Los datos cuantitativos son aquellos cuya naturaleza es originalmente un numero, ejemplo de ello son todas las determinaciones de laboratorio, edad, talla, peso. etc.
Para poder reportar este tipo de datos, lo que necesitamos es “resumirlos”.
Si en un estudio incluimos 1000 sujetos y obtenemos datos de edad, talla, peso, y determinaciones de laboratorio, no podemos publicar una tabla con 1000 datos de cada variable. Esto no seria interpretable y por lo tanto debemos reportar un único valor que resuma todos los datos obtenidos de una variable.
Además, como ya sabemos, estos valores pueden variar entre sujetos, ya sea debido al azar o por patologías que puedan padecer los sujetos: los valores de glucemia de pacientes con diabetes serán superiores a los de sujetos sin esta patología. Y aún dentro de cada grupo de pacientes, los valores de glucemia también serán diferentes entre los sujetos.
Podemos entonces dividir la variabilidad de los datos en de causas conocidas o de causa no explicable. Esta última es la que decimos es debida al azar y se denomina variabilidad aleatoria.
Consecuentemente, lo que vamos a reportar son 2 tipos de valores: un único valor que resuma a todos los valores: Medidas de Posición (También llamadas de tendencia central) y otro que nos muestre el grado de variabilidad de las observaciones que presenta la muestra: Medidas de Dispersión
Medidas de Posición
El primer paso para describir un conjunto de observaciones numéricas es calcular el promedio. En estadística el promedio se conoce como Media y su notación matemática es:
Su cálculo es muy sencillo, es la suma de todos los valores dividida por el número de sujetos de la muestra.
Otra medida que resume los valores es la Mediana. Esta se define como el valor que divide a la muestra en 2 partes iguales o 50 % cuando los datos están ordenados.
En la tabla se observan valores de Índice de masa corporal (IMC) y creatinina de 20 pacientes.
El IMC medio o la media de IMC de esta población es 517.8/20 = 25.9 Kg/m2
La mediana es el valor que ocupa la posición que divide a la muestra en 2 partes iguales o igual número de sujetos por debajo y por encima de la mediana. En este caso, como tenemos 20 observaciones, la posición de la mediana está entre el sujeto 10 y el 11. Para el calculo de la mediana en este caso promediamos los valores de la posición 10 y 11= 26.9+27/2 = 26.9 Kg/m2.
Si tuviéramos 19 valores la mediana ocuparía la posición 10 y sería = 26.9 Kg/m2.
La media de creatinina para la muestra de 20 sujetos es de 12.3/20 = 0.6 mg % y su mediana de 0.6+0.6= 0.6 mg %.
Supongamos que IMC de los pacientes 19 y 20 ha cambiado a 37.9 Kg/m2; la media es ahora 26.4 Kg/m2 y la mediana sigue siendo la misma, 26.9 Kg/m2.
Si los valores 19 y 20 de creatinina cambian a 1.40, la media es 0.7 mg %
Como vemos, la media es muy sensible a valores extremos, por lo que en muestras cuya variabilidad esté desviada hacia algún lado de la media (muestras asimétricas o no normales) esta medida de posición no refleja el valor central de la muestra sino un valor que está desviado hacia el lado donde hay valores más extremos.
Por lo tanto, dependiendo de la variabilidad que presente la muestra, es más apropiado presentar la mediana, que no se ve influenciada por valores extremos.
Opmerkingen