Los datos cualitativos son aquellos que expresamos como porcentajes.
Se clasifican en tres categorias, por ello también se los conoce como datos categóricos.
Datos Dicotúmicos: Son aquellos que solo tiene 2 posibilidades. Por ejemplo: vivo o muerto, mayor a 65 años o menor, etc. En resumen solo pueden ser si o no.
Datos Nominales: Son los que tiene mas de 2 respuestas pero no tiene un orden jerarquico.
Ejemplo: Estado civil, tipo de tratamiento, tipo de dispositivo, tipo de cirugia, etc.
Por ultimo tenemos los datos ordinales, estos tiene mas de 2 categorias pero ellas tiene un orden, en general por su gravedad, ejemplo de estas variables son la clase funcional, la funcion ventricular , datos numericos agrupados , por ejemplo, la edad en grupos de 10 años, el grupo de menor edad se introducira en la base de datos como 0 o 1, el grupo siguiente el 1 o 2 , etc.
Introducir correctamente los datos categoricos o saber reconocer que tipon de datos son es fundamental para su analisis, ya que de eso depende el tipo de test de chi cuadrado que se use, ademaas de otros aspectos que veremos.
Prueba de Chi Cuadrado para Dos Proporciones o Dicotómicos.
En el caso más simple de comparación de 2 proporciones se relacionan 2 variables, cada una con 2 categorías (dicotómicas) usando la Tabla de Contingencia 2 ´ 2.
Supongamos que tenemos una muestra de 2.000 sujetos, un grupo de 1.000 sujetos recibe una droga y el otro placebo. El evento de interés es infarto de miocardio. (Tabla 21-1.)
Las preguntas clínicas aquí son: ¿La droga disminuye la incidencia de infarto? ¿La eficacia de la droga es mayor al placebo?
En términos estadísticos la pregunta es: ¿Las proporciones observadas de infarto están relacionadas con el tipo de tratamiento asignado (droga o placebo) o sólo es producto del azar? ¿8 % de mortalidad en el grupo tratamiento es igual a 12 % en el grupo placebo?
La prueba de Chi Cuadrado se usa para verificar si hay “asociación” entre ambas variables (tratamiento e infarto) y por lo tanto si lo porcentajes obtenidos son estadísticamente diferentes.
El Análisis por prueba de Significación de Dos Proporciones estudia si los porcentajes son estadísticamente diferentes; no establece asociación entre variables.
Establecer asociación no necesariamente implica establecer la causa, para ello debemos contar con otro tipo de evidencia que veremos más adelante.
Tabla 21-1. Proporción de infarto y grupo de tratamiento.
Para decidir si hay suficiente evidencia para asegurar que la droga fue efectiva o si los porcentajes encontrados fueron sólo al azar usamos la prueba de Chi Cuadrado simple o 2x2.
Bajo la Hipótesis Nula, de no asociación entre droga e infarto, podríamos pensar que tanto la droga como el placebo tienen la misma eficacia. Por lo tanto, del total de infartos, la mitad correspondería al grupo tratamiento y la otra mitad al grupo placebo.
Si las proporciones o el número de sujetos observados fueran por azar, podemos calcular cuáles podrían ser.
Para el cálculo del número de sujetos “esperados” en cada celda se multiplica el total de la fila ´ el total de la columna correspondiente a cada celda y se divide por el total de pacientes en el estudio. (Tabla 21-2.)
Para el grupo tratamiento el número esperado de individuos con infarto es:
(200 ´ 1.000)/2.000 = 100 pacientes.
Para el grupo tratamiento el número esperado de individuos sin infarto es:
(1.800 ´ 1.000)/2.000 = 900 pacientes.
El mismo cálculo se realiza para cada celda del grupo placebo.
También podríamos calcular cual es el porcentaje de infartos esperados en el grupo tratamiento y en el grupo placebo. Como vemos es la tabla siguiente, los porcentajes esperados son iguales. Esto es debido a que el test asume como hipótesis nula, no asociación y por lo tanto no diferencia entre los porcentajes de infarto entre los grupos tratamiento y placebo.
Tabla 21-3. Número de porcentajes “esperados” de infarto según tratamiento o placebo.
Entonces, el valor esperado de número de sujetos para de cada celda es:
Para la celda a = (a + b) x ( a + c)/n
Para la celda b = (a + b) x ( b + d)/n
Para la celda c = (c + d) x ( a + c)/n
Para la celda d = (c + d) x ( b + d)/n
Para que la prueba de Chi Cuadrado sea válida debe cumplir con una regla: el 80 % de las celdas deben tener un valor esperado igual o mayor que 5. En nuestro ejemplo, ninguna de las celdas tiene valores esperados menores que 5.
Las preguntas que contesta la prueba de Chi Cuadrado son: ¿Las proporciones observadas son estadísticamente diferentes a las esperadas? ¿Hay una asociación entre la droga y la tasa de eventos?
Matemáticamente la prueba de Chi Cuadrado es igual a:
La prueba utiliza los valores observados y esperados de cada celda, por eso se emplea el símbolo sumatoria. La diferencia entre O y E está elevada al cuadrado para que los valores finales sean siempre positivos.
Para la prueba de Chi Cuadrado, existe una distribución de probabilidades que le pertenece. Al calcular el valor de X2 estamos buscando en su tabla de distribución a que valor de p corresponde y entonces podemos determinar si las variables analizadas están asociadas o bien si son variaciones al azar.
Como las frecuencias esperadas en cada celda son el producto del total de la columna y la fila de interés dividido por el número total de la muestra, la prueba de Chi Cuadrado está condicionada por estos totales. Por lo tanto, de acuerdo con el número de columnas y de filas que tenga, la tabla la distribución de Chi Cuadrado se modifica.
Es por eso que la prueba de Chi Cuadrado utiliza también grados de libertad para determinar su valor; en este caso los grados de libertad corresponden al número de filas y columnas de la tabla.
El cálculo de los grados de libertad para las tablas de contingencia es igual a:
Una vez hallado el valor de X2 se busca en la Tabla de Distribución de Chi Cuadrado de acuerdo con los grados de libertad el valor de p. (ver tabla distribución al final del capítulo)
Para nuestro ejemplo, el valor de Chi Cuadrado es:
Comments