Desvio padrão
“os dados tendem a dispersar-se em torno de um valor médio “
Primeiro, precisamos falar de Dispersão ou Variação… Dispersão ou Variação são o grau no qual os dados tendem a dispersar-se em torno de um valor médio. Existem várias medidas de dispersão ou de variação. Dentre elas, podem ser citadas a amplitude total, o desvio médio, a amplitude semi-interquartílica, a amplitude entre os centis (10-90) e o desvio padrão.
Amplitude total
A amplitude total de um conjunto de dados é a diferença entre o valor mais alto e o mais baixo deste conjunto. Por exemplo, se considerarmos o conjunto de dados: 2, 3, 3, 5, 5, 5, 8, 10, 12, a amplitude total é 12-2=10.
Desvio Médio
O desvio médio de um conjunto de dados {\color {red} (X_1, X_2, X_3…, X_n) } é definido por:
Desvio\,Médio= \frac{\displaystyle\sum_{j=1}^{N} |X_j-\bar{X}|} {\displaystyle N}
onde:
\bar{X} : média aritmética do conjunto de dados
|X_j-\bar{X}| : valor absoluto do desvio X_j em relação à \bar{X}
Exemplo: Determinar o desvio médio de conjunto de números 2, 3, 6, 8, 11. A média aritmética {\color {red} \bar{X} } pode ser determinada assim:
\bar{X}=\frac{\displaystyle 2+3+6+8+11} {\displaystyle 5} = 6
O Desvio Médio pode ser determinado da seguinte maneira:
Desvio\,Médio=\frac{\displaystyle |2-6|+|3-6|+|6-6|+|8-6|+|11-6|} {\displaystyle 5}
Desvio\,Médio=\frac{\displaystyle 4+3+0+2+5} {\displaystyle 5} = 2,8
O desvio médio pode ser calculado também em função da frequência em que cada número aparece no conjunto de dados. Desse modo, se {\color {red} X_1, X_2, X_3…X_K } ocorrerem com as frequências {\color {red} f_1, f_2, f_3…, f_K } , respectivamente, o Desvio Médio poderá ser indicado da seguinte forma:
Desvio\,Médio= \frac{\displaystyle\sum_{j=1}^{K} f_j |X_j-\bar{X}|} {\displaystyle N}
onde:
N=\displaystyle\sum_{j=1}^{K} f_j = \displaystyle\sum{f}
Amplitude semi-quartílica ou desvio quartílico
A Amplitude semi-quartílica ou desvio quartílico de um conjunto de dados pode ser definida como:
Amplitude\,Semi-quartílica=Q=\frac{\displaystyle Q_3-Q_1} {\displaystyle2}
Onde:
{\color {red} Q1 } e {\color {red} Q3 } são o primeiro e o terceiro quartis referentes aos dados, respectivamente.
Amplitude entre os percentis 10-90
A Amplitude entre os percentis {\color {red} 10-90 } de um conjunto de dados pode ser definida como:
Amplitude\,entre\,os\,percentis\,10-90=P_{90} - P_{10}
Onde: {\color {red} P_{10} } e {\color {red} P_{90} } são o 10° e o 90° percentis referente aos dados, respectivamente.
Desvio Padrão
O Desvio Padrão de um conjunto de N números {\color {red} X_1, X_2, X_3…, X_N } é representado por {\color {red} S } e definido como:
Desvio\,Padrão=S=\sqrt \frac{\displaystyle\sum_{j=1}^{N} (X_j-\bar{X})^2} {\displaystyle N}
Desvio\,Padrão=S=\sqrt \frac{\displaystyle\sum_{}^{} (X-\bar{X})^2} {\displaystyle N}
Se representarmos o desvio de cada um dos números {\color {red} X_j } em relação à média {\color {red} \bar{X} } como sendo {\color {red} x }, a equação do Desvio Padrão se torna:
Desvio\,Padrão = S=\sqrt{\sum_{}^{} x^2 } = \overline{(X-\bar{X})^2}
Desse modo, podemos dizer que S é a raiz média quadrática dos desvios, em relação à média ou, como é muitas vezes denominada de Desvio da Raiz Média Quadrática.
Obs: A raiz média quadrática (RMQ) ou média quadrática, de um conjunto de números {\color {red} X_1, X_2, X_3,…, X_N } é, algumas vezes representada por e definida por:
RMQ=\displaystyle\sqrt{\bar{X}^2} = \sqrt \frac{\displaystyle\sum_{j=1}^{N} X^2_j} {\displaystyle N} = \sqrt \frac{\displaystyle\sum_{}^{} X^2} {\displaystyle N}
Do mesmo modo que no desvio médio citado anteriormente, podemos calcular o desvio padrão consierando a frequência no qual os número aparecem. Se {\color {red} X_1, X_2, X_3,…,X_K } ocorrerem com as frequências {\color {red} f_1, f_2, f_3,…, f_K }, respectivamente, o desvio padrão pode ser definido como:
Desvio\,Padrão=S=\sqrt \frac{\displaystyle\sum_{j=1}^{N} f_j (X-\bar{X})^2} {\displaystyle N}
Desvio\,Padrão=S=\sqrt \frac{\displaystyle\sum_{}^{} f (X-\bar{X})^2} {\displaystyle N}
Desvio\,Padrão = S=\displaystyle\sqrt{\sum_{}^{} fx^2 } = \overline{(X-\bar{X})^2}
onde:
N = \displaystyle\sum_{j=1}^{K} f_j = \displaystyle\sum_{}^{} f
Observação importante: Às vezes, o desvio padrão correspondente aos dados de uma amostra é definido como {\color {red} (N-1) }, em lugar de {\color {red} N } dos denominadores das expressões. Isto é usado porque o valor resultante representa uma estimativa melhor do desvio padrão da população da qual a amostra foi extraída. Para grandes valores de {\color {red} N } ( {\color {red} N>30 }, por exemplo) não há praticamente, diferença entre usar {\color {red} N }ou {\color {red} N-1 } no denominador.
Variância
A variância de um conjunto de dados é definida como o quadrado do desvio padrão, sendo, portanto, representada por {\color {red} \mathbf {s^2} }
Existem dois símbolos que representam o Desvio Padrão. Estes são o {\color {red} \mathbf {s} } e o {\color {red} \mathbf {\sigma} }. Entretanto, eles são utilizados em diferentes circunstâncias.. Se o desvio padrão é de uma amostra, devemos usar o {\color {red} \mathbf {s} } e se o desvio padrão calculado é de uma população, devemos usar o {\color {red} \mathbf {\sigma} } . Desse modo, o {\color {red} \mathbf {s^2} } e {\color {red} \mathbf {\sigma ^2} } representam, respectivamente, a variância da amostra e da população.
Curtiu? Quer aprender mais sobre Desvio Padrão? Oferecemos curso de quimiometria e outras análises multivariadas em Campinas e região. Entre em contato!