top of page

Desvío Estandar

Foto del escritor: ruthhenquinruthhenquin


Esta forma de resumir la variabilidad de un conjunto de datos de forma numérica que es el más frecuentemente reportado en la literatura es a su vez el que más dificultades de comprensión presenta.


Reportando el Desvío Estándar lo que hacemos es “medir” dentro de una muestra, a qué distancia de su media se encuentra un valor dado.


La unidad de distancia que usamos en estadística se denomina Desvío Estándar.


ü En lugar de medir la distancia en centímetro, metros o kilómetros, ahora usaremos el desvío estándar. (DS)


Para un grupo de datos es posible calcular la distancia entre cada valor de la muestra y su media; al sumar cada distancia obtenemos una distancia promedio que representa el valor de 1 desvío estándar para esa muestra.

El valor absoluto que adquiere 1 DS es propio de cada muestra y depende de varios factores que veremos luego.


Cuando hablamos de 1 DS nos referimos a una distancia “fija” entre la media y el DS, que es común a cualquier muestra de datos cuantitativos, siempre y cuando la muestra sea simétrica.


De esta forma, esta medida de distancia nos independiza de los valores particulares de cada muestra y establece un lenguaje común para todos. Cuando decimos tal valor está a 1 DS todos entendemos a qué distancia está. Veremos mas adelante cual es el patrón de distancia del DS.



Cálculo de Varianza y Desvió Estándar.


Si tomamos los valores de IMC de 450 sujetos, cuya media es 26.6 Kg/m2, podríamos calcular para cada uno de los valores su distancia a la media. Por ejemplo para el valor mas bajo de la muestra = 12.9 Kg/m2


La distancia es = 12.9 – 26.6 = – 13.7 Kg/m2


Cada vez que calculemos la distancia de un valor menor a la media obtendremos valores negativos. Para evitar esto, la matemática siempre tiene una solución, que en este caso es elevar la resta al cuadrado. Por lo tanto ahora la diferencia es:


(12.9 – 26.6)2 = 187.69 (Kg/m2 ) 2


Este valor es ahora positivo, pero está en unidades que no son las originales,¡ Kg/m2 al cuadrado! y además es extremadamente grande, pero por el momento dejémoslo así.


Ahora bien, dijimos que sumando todas las distancias de cada valor (ya sabemos por qué están elevadas al cuadrado) podemos obtener el “promedio” de las distancias. Si queremos obtener un promedio lo que debemos hacer entonces es dividir la suma de las distancia por el número de sujetos de la muestra. Así, en notación matemática tendremos:


Promedio de distancia =

Donde:


Σ= Sumatoria de las diferencias

x = Cada valor individual de la muestra

= Media

n – 1 = númerototal de la muestra – 1


Aplicando esta fórmula lo que se obtiene es un valor de la distancia promedio elevada al cuadrado conocida con Varianza Muestral. Su resultado se expresa en unidades al cuadrado (en este caso Kg/m2 al cuadrado) que no tiene mucho sentido; por lo tanto, para volver a los valores a las unidades originales de la muestra y obtener valores más adecuados en cuanto a magnitud, lo que se hace es calcular la raíz cuadrada de la Varianza Muestral (notación matemática S2 ) que no es otra cosa que el Desvío Estándar (notación matemática: DS o “S”)


Siendo S2 o Varianza =


El Desvío Estándar ó S es =


Tenemos entonces un valor con sus unidades originales que equivale a 1 DS


Aplicando esta fórmula a los datos de de IMC obtenemos:


varianza (S2 ) = 32.68 Kg/m2 2 y DS ( S )= 5.7 Kg/m2.


Para esta muestra el valor de 1 DS es igual a 5.7 Kg/m2.

Para medir la distancia de cualquier valor de la muestra y su media, usamos la unidad de distancia DS. Decimos entonces que un valor x está a, por ejemplo, a 1.3 DS de la media.


Por suerte, en la actualidad contamos con programas que hacen cálculos estadísticos. Estos programas calculan el valor a que equivale 1 desvío estándar para la muestra con la que estemos trabajando.


Si sabemos a cuántas unidades equivale 1 DS para una muestra determinada, podemos calcular cualquier valor que se encuentre a x nº de DS.


Siguiendo con el mismo ejemplo cuya media es 26.6 Kg/m2, decimos que hay un valor a 1.6 DS ¿cuál es ese valor?


Si 1 DS es igual a 5.7 Kg/m2:


1.6 DS es igual a = 5.7 (valor de 1 DS) * 1.6 (nº de DS) = 9.2 Kg/m2


El valor que está a 1.6 DS es = 26.6 (media) + 9.2 (1,6 DS) = 35.8 Kg/m2


Entonces 35.8 Kg/m2 está a 1.6 DS de la media.


También podemos calcular la inversa: si un sujeto tiene un IMC de 23 Kg/m2 y el valor del DS es de 5.7 Kg/m2, ¿a cuántos DS se encuentra de la media?


El cálculo es muy fácil: si la distancia es 23 – 26.6 (Media Muestral) = -3.6 Kg/m2.

Siendo el valor de 1 DS igual a 5.7 Kg/m2 y la diferencia de 3 Kg/m2 a ¿cuántos DS equivale?


Nº de Desvíos estándar es igual a: 3.6/5.7 = - 0.63 DS


Decimos entonces que el valor se encuentra a - 0.63 DS de la media de esa muestra. Esto significa que este valor, al ser negativo, se encuentra a la izquierda de la media


La idea de tomar al DS como una unidad de distancia permite adoptar una medida de distancia universal aplicable a cualquier muestra que se desee estudiar. Luego veremos que la unidad de 1 DS es derivada matemáticamente teniendo en cuenta ciertos factores, fundamentalmente el tipo de distribución de datos que presente la muestra (simétrica o asimétrica).



Si tomamos la media como punto central, podemos contar DS a la derecha y a la izquierda de la media.

La estadística nos dice que entre ± 1.96 DS de la media (1.96 DS a la derecha y 1.96 DS a la izquierda) se encuentra el 95 % de los valores esperados de obtener por variación al azar, siempre y cuando la distribución de los datos sea simétrica.


Es lo que comúnmente se dice ± 2 DS ya que 1.96 es casi 2. También es posible calcular el 99 %, de los valores esperables de obtener por aza, para lo cual hay que sumar y restar 3 DS.

Si la muestra no es simétrica a un lado y otro de la media hay diferente proporción de valores observados y no tenemos el 95 % de la muestra entre ± 1.96 DS, de hecho en estas muestras no es correcto calcular ni la varianza ni el DS.


Si observamos la siguiente figura vemos que el valor 40 Kg/m2 se encuentra por fuera de este límite porque está a más de 1.96 DS (a la derecha). Podríamos concluir que, como no es esperable obtenerlo por variación al azar, este valor puede deberse a otras causas.

Aquí no podemos decir que hubo variabilidad aleatoria. ¿Podría ser un sujeto incluido por error? ¿Podría padecer obesidad?

Si observamos el calculo de ± 3 DS ( 99 % de la población ) puede predecir valores que no hallan sido encontrados en la muestra, como muestra el calculo de –3 DS.








6 visualizaciones0 comentarios

Entradas recientes

Ver todo

Comments


Publicar: Blog2_Post

©2019 por Dra Henquin. Creada con Wix.com

bottom of page