top of page

Métodos estadísticos para comparación de medias

Foto del escritor: ruthhenquinruthhenquin

A modo de introducción y resumen, diremos que antes de analizar 2 o más muestras de datos continuos debemos:


  1. Determinar si las muestras tienen una distribución Normal

  2. Establecer si los datos están apareados o son independientes.

  3. Elegir la prueba estadística correspondiente según la siguiente tabla.


Ya hemos visto cómo la media de una muestra y su ES se usan para construir el IC 95 % de la media, que representa los valores probables de obtener por azar de la media para esa población.

También hemos calculado el valor de t para determinar a cuántos ES esta una media de la otra y a través de este cálculo establecer la probabilidad de obtener una media dada sólo por azar.

Cuando nos preguntamos si un valor determinado de una media es consistente con cierto valor hipotético de media, lo que hacemos para responder esta pregunta es utilizar las llamadas Pruebas de Significación Estadística, también llamadas Pruebas de Hipótesis.



¿A qué se llaman muestras apareadas?

Hay situaciones en las cuales las medias que se quieren comparar no son independientes, no provienen de 2 grupos diferentes de sujetos.

En muchos casos podemos realizar múltiples mediciones en los mismos sujetos.

El ejemplo más común es medir la tensión arterial de un grupo de sujetos antes y después de administrar un tratamiento, Entonces, dado que los datos provienen del mismo grupo, ya no son independientes; los datos de la segunda medición van a depender de la primera. Se dice entonces que estos son datos apareados.

La importancia de esto radica en que el planteo de la Hipótesis Nula aquí es diferente.


Supongamos que tenemos las mediciones de Homocisteína pre y pos medicación de una muestra de 20 sujetos y queremos determinar si esta droga desciende los valores de Homocisteína.

Cuando los datos están apareados, en lo que estamos interesados es en el promedio de las diferencias entre mediciones de cada sujeto y en su variabilidad.


Como vemos en la tabla, por cada par de mediciones sobre el mismo sujeto se calcula la diferencia entre ambas y con todas las diferencias se calcula la “media de las diferencias” y su DS, en este caso la media de las diferencias es de – 4.4 y su DS 5.5

Significa que, en promedio, la droga disminuyó 4.4 puntos los valores de Homocisteína. Pero, ¿Estamos seguros que si repetimos el experimento esta droga siempre demostrará disminuir la Homocisteína? ¿O cabe la posibilidad de que en algún caso veamos que no hay efecto?


Lo que en este caso nos preguntamos es ¿La media de las diferencias es distinta a cero?


Si la medicación no tuviera efecto, la Homocisteína no descendería sus valores, y las diferencias individuales serían cero. Por lo tanto, la media de las diferencias también sería cero. Pero si la medicación es eficaz, la Homocisteína descendería; en ese caso la segunda medición sería menor a la primera y las diferencias tenderían a ser negativas. Como consecuencia la media de las diferencias también sería negativa.


Como ya sabemos que los valores de la media de las diferencias varían por azar, lo que tenemos que determinar es cuál es la probabilidad de encontrar un valor de – 4.4 para la media de las diferencias, asumiendo que ésta es en principio igual a cero.

Es lo mismo que decir que la Hipótesis Nula es “no hay diferencias entre las mediciones pre y post” o bien que la media de las diferencias es igual a cero.

La Hipótesis Alternativa será en este caso que la media de las diferencias es distinta a cero

Para determinar si hay verdaderos cambios en este caso se utiliza el Test de Student o Test de t para muestras apareadas.









La formula incluye el cero porque la Media de la de la Hipótesis Nula es cero; podríamos también escribir la fórmula como:













Si buscamos en la Tabla de Distribución de t, vemos que para 19 grados de libertad (n – 1) el valor de t = 3.57 y corresponde a un valor de p de 0.002.


Con esto concluimos que la media de las diferencias es estadísticamente diferente a cero. Es lo mismo que decir que rechazamos la Hipótesis Nula y aceptamos la alternativa. Por lo tanto, para el estudio, se demuestra que la droga disminuyó los valores de Homocisteína de forma significativa.


Si construimos el IC 95 % de la media de las diferencias tendremos:


IC 95 % = - 4.4 ± (2.09* 1.23) = - 4.4 ± 2.57


Usamos 2.09 en lugar de 1.96 porque es una muestra pequeña. 2.09 es el valor que corresponde a 19 grados de libertad en la tabla de distribución de t cuando p vale 0.05. En esta muestra vemos que entre ± 2.09 % del área bajo la curva se encuentra el 95 % de los valores posibles de obtener por azar para la media de las diferencias.


Límite inferior IC 95 % = - 6.9

Límite Superior IC 95 % = - 1.8


Como vemos el IC 95 % no contiene al cero (valor de la media propuesta por la Hipótesis Nula); por lo tanto inferimos que de 100 veces que hagamos este experimento, en 95 oportunidades obtendremos valores de media de las diferencias entre – 6.9 y – 1.8.



En este caso tenemos 2 grupos de 150 sujetos, que no tienen ninguna relación entre ellos.

A un grupo se le administró placebo y al otro droga activa y se midió colesterol LDL al cabo de 8 semanas de tratamiento.


La media de LDL del grupo placebo fue de 130 mg % con DS de 1.3 y la del grupo droga activa 100 mg % con DS 1.


Para este caso la Hipótesis Nula (H 0) sostiene que la diferencia entre las medias es igual a cero: no habla de la media de las diferencias como el caso anterior.


Para este caso la H 0 sería: 130 – 100 = 0


Y la Hipótesis Alternativa:


H 1 : 130 – 100 ¹ 0


La prueba de Student para este caso se plantea como:











Como aquí tenemos 2 muestras independientes con sus respectivos ES, lo que la prueba utiliza es el error estándar promedio de las 2 muestras.


Sólo a modo informativo se muestran las fórmulas para el cálculo del ES promedio de las 2 muestras.









La varianza promedio de las 2 muestras se calcula como:














Cuando las muestras tienen > 100 sujetos, como ya sabemos se utiliza z. El cálculo del ES promedio se calcula de forma diferente, siendo z











Volviendo al ejemplo inicial tenemos:


Muestra 1: n = 150 Media 130 mg/% DS 1.3

Muestra 2: n = 150 Media 100 mg/% DS 1


Como las muestras tienen > 100 sujetos, usaremos z.



























Si buscamos en la Tabla de Distribución Normal el valor 227, veremos que no existe. Eso es porque estar a 227 ES significa una distancia tal que no es necesario casi ningún cálculo. Ya sabemos que están muy alejadas y el valor de p será muy chico, en este caso < 0.00003.


Para construir el IC 95 % de la diferencia de las medias usamos el valor de ES que calculamos para z = 0.132


IC 95 % = 30 ± 1.96 * 0.132 =


IC 95 % límite superior = 30 + 0.258 = 30.25

IC 95 % límite inferior = 30 - 0.258 = 29.74


IC 95 % diferencia de las medias = 29.74 – 30.25


Como podemos observar este intervalo NO contiene al cero.

Por lo tanto, en base al test de z y al IC 95 %, decimos que rechazamos la H 0 (diferencia de la medias = cero) y aceptamos la alternativa.

En este estudio diremos que la media de colesterol del grupo tratado fue significativamente menor a la del grupo placebo.


Hasta aquí hemos visto cómo analizar una muestra, 2 muestras apareadas y 2 muestras independientes, cuando éstas tienen distribución normal.

2 visualizaciones0 comentarios

Entradas recientes

Ver todo

Comments


Publicar: Blog2_Post

©2019 por Dra Henquin. Creada con Wix.com

bottom of page