Pruebas No Paramétricas.
Cuando la o las muestras a comparar no tienen distribución normal, se recurre a las llamadas pruebas no Paramétricos.
Estas pruebas comparan medianas en lugar de medias. El método matemático que estas pruebas emplean está más allá del alcance de este libro; por lo tanto, sólo mencionaremos los test disponibles de acuerdo a cada caso en particular.
Cuando queremos compara una muestra se utiliza el llamado Test del Signo o, más frecuentemente, el test de Wilcoxon (Wilcoxon signed rank sum test).
Para el caso de muestras apareadas, el Test usado es el de Wilcoxon para Muestras Apareadas (Wilcoxon matched pairs signed rank sum test)
Por último, para la comparación de 2 muestras independientes, el test utilizado es el llamado Mann- Whitney.
Veamos un ejemplo.
Se quiere comparar el valor de PCR de 2 grupos independientes.
Lo primero que hacemos es verificar si los datos tienen distribución normal.
El grafico Box-Plot nos muestra que ambas muestras son francamente asimétricas.
Veamos qué sucede, si aplicamos en este caso el test de Student para muestras independientes.
Test de t para muestras independientes
Media de PCR Grupo 1 = 8,084553
Media de PCR Grupo 2 = 14,349254
Error estándar combinado = 2,859258
IC 95 % para la diferencia de las medias = –11,895468 a –0,633933
df = 255
t = 2,191023
valor p = 0,0294
TEST DE T NO VÁLIDO. UTILICE TEST DE MANN-WHITNEY
Como podemos observar, el valor de p es significativo, y por lo tanto concluiríamos que ambas medias son diferentes. Esto no es válido, ya que las muestras no tienen distribución normal. El mismo programa estadístico detecta este error e informa que el test no es válido y sugiere utilizar el test correspondiente.
No todos los programas estadísticos advierten sobre este error, por lo que es nuestra obligación confirmar el supuesto de normalidad para las 2 muestras.
Veamos que pasa al aplicar el test correspondiente.
Test de Mann-Whitney
Observaciones PCR G1 = 123 mediana = 3,3
Observaciones PCR G0 = 134 mediana = 4,2
p (2 colas) = 0,1569
IC 95 % para la diferencia de las medias = -1,5 a 0,2
Como vemos, cuando aplicamos el test correspondiente, las cosas son bastante diferentes.
Aquí el valor de p ya no es significativo, por lo tanto la conclusión es que ambas medianas no son diferentes.
Este ejemplo demuestra lo “peligroso” que puede ser utilizar un test que no está indicado para el tipo de muestras con las que estamos trabajando.
Lo mismo sucede si para datos apareados utilizamos Test para Muestras Independientes.
Comments