top of page

Para que sirve la correlacion?

Foto del escritor: ruthhenquinruthhenquin




















Correlación y Regresión Lineal


Hasta el momento hemos visto la manera de determinar si 2 variables cuantitativas son diferentes o no, de acuerdo con el concepto estadístico.


Otro tipo de análisis que muchas veces se requiere con las variables cuantitativas es determinar si están asociadas y si es posible, partir de una de ellas, predecir el valor de la otra.

Para ello se utilizan dos pruebas estadísticas diferentes.


Correlación

Es un método de análisis que se usa para estudiar la relación lineal entre dos variables continuas.


Supongamos que queremos determinar si los valores de colesterol total tienen una relación lineal con los valores de LDL.

Lo primero que hacemos es graficar estos valores en un grafico Scatter Plot (Fig. 16-1.)


Fig. 16-1 Grafico Scatter Plot. Relación colesterol vs. LDL




Como podemos observar, a medida que los valores de colesterol total aumentan, también lo hacen los de LDL.

Para determinar si esta relación es por azar, se calcula el Coeficiente de Correlación de Pearson (si los datos son de distribución normal).


El valor del Coeficiente “ r “ para este caso es igual a 0.94 con un IC 95 % de 0,90 a 0,96 y p < 0,0001, lo que significa que la relación lineal no es debida al azar. Los valores posibles de r están dentro de +1 a –1.

Un valor de +1 significa que todos los puntos del Scatter Plot están sobre una recta perfecta. La correlación es positiva si con el aumento de uno de los valores el otro también aumenta, y es negativa si uno de los valores tiende a disminuir con el aumento del otro.


Si el coeficiente de correlación se acerca a cero, significa que no hay asociación lineal.

En el ejemplo, el valor del coeficiente es muy cercano a 1, y visualmente se puede apreciar que los puntos del gráfico están sobre una línea casi recta.

Es importante recalcar que el Coeficiente de Correlación evalúa la si existe una relación lineal. Es posible que dos variables tengan una relación pero no de forma lineal. Pueden describir relaciones de tipo elíptica o curvilínea.

Es por eso que es importante primero observar el gráfico, ya que un Coeficiente bajo (< 0.70) no implica una falta total de relación, sino que no hay una relación lineal.


Para que el Coeficiente sea válido hay condiciones que deben cumplirse:


a) Al menos una de las variables debe tener distribución normal.

b) Los valores deben obtenerse al azar

c) Los valores no deben estar apareados.


En el caso de que los valores no tengan una distribución normal, puede usarse el Coeficiente de Correlación de Spearman.

NO DEBE ENTENDERSE QUE UNA BUENA CORRELACION IMPLICA BUENA CONCORDANCIA.(Determinar si dos métodos miden lo mismo)


Regresión Lineal.

Cuando dos variables están asociadas en una relación de tipo lineal es posible, mediante el cálculo de la regresión lineal, obtener la ecuación matemática que describa la recta que las asocia.

En matemática, describir una recta significa determinar dos parámetros. Uno de ellos se denomina intersección (que es el punto donde la recta corta al eje y) .El otro parámetro es su pendiente. Con estos 2 parámetros se puede dibujar una recta en un eje de ordenadas y abscisas.

Describir la recta permite calcular cuánto aumenta la variable y con el incremento de la variable x,y así calcular el valor de y a partir de cualquier valor de x.


A la variable y se la denomina Variable Dependiente y a la variable x se la llama Variable Independiente o explicatoria, ya que a partir de los valores de ella se calculan los valores de y.


Es importante determinar cuál es la variable Dependiente y cual la explicatoria, ya que, a diferencia de la Correlación, el resultado será diferente dependiendo de cuál variable se elija como dependiente.


La ecuación general de la Regresión Lineal es la siguiente:




es la variable Dependiente. Es aquella que deseamos predecir.

es el parámetro de Intercepción (llamado Intercept) o punto donde la recta corta al eje y. Este parámetro nos da el valor de la variable y cuando x vale cero.

es la pendiente de la recta y nos informa cuántas unidades aumenta la variable y cuando la variable x aumenta 1 unidad. es el valor que toma la variable independiente.


Tomando el ejemplo anterior, supongamos que, a partir de un valor determinado de colesterol total, deseamos calcular el valor de LDL esperado.

Ya hemos comprobado que el colesterol total y la LDL están asociados en una relación lineal por el Coeficiente de Correlación.


Si calculamos la ecuación de la Regresión Lineal obtendremos los parámetros que describen la recta que asocia el colesterol y la LDL.



Como se observa en la Fig. 16-2 los puntos que unen Colesterol con LDL se hallan sobre una recta que corta al eje y en el valor –52 (si proyectamos la recta hasta cortar el eje y veremos que lo hace por debajo del valor 60) y que tiene una pendiente cercana a los 45 º


Fig. 16-2 Relación LDL vs. colesterol total



En matemática, una pendiente de 45º equivale a un valor de 1, ya que, si la pendiente esta a 45º y corta el eje de coordenadas en su punto de intersección, la relación entre ambas variables será 1 a 1. Esto significa que, por cada unidad que aumente la variable x, la variable y también aumentará en 1 unidad.

Si la pendiente de la recta es igual a cero, significa que no hay pendiente, o que la recta es paralela al eje x, y por lo tanto por más que aumenten los valores de la variable x no hay aumento en los valores de la variable y (Fig. 16 -3.)


Fig. 16-3 Parámetros de una recta.













Fig. 16-4 Valores de la Regresión Lineal. Predicción de LDL














Si lo que deseamos es predecir el valor de LDL a partir de cualquier valor de colesterol total, utilizamos los parámetros calculados por la regresión lineal.

Entonces, si la pendiente es igual a 0.91 (valor de la pendiente cercano a 1); por cada unidad de aumento del colesterol total, la LDL aumentará 0.91unidades multiplicado por cualquier valor de colesterol (valor de x) menos 52 (valor de Intercept)


Como es lógico, el valor de Intercept es negativo, ya que los valores de LDL son menores a los de colesterol total. (Fig. 16-4.)


La regresión lineal, como prueba estadística, evalúa el valor de la pendiente de la recta.

Asume como Hipótesis Nula que la recta no tiene pendiente (b = 0), o sea que es perpendicular el eje x, con lo cual, por más que el valor de la variable x aumente, no se produce ningún incremento en la variable y.

La regresión lineal tiene que establecer si el valor de la pendiente es estadísticamente diferente a cero y de esta manera obtener la evidencia para rechazar la Hipótesis Nula.


En otras palabras, tiene que probar que hay pendiente y si la hay, que al incrementar x ,aumenta o disminuye y.


El valor de p obtenido en el cálculo de la regresión lineal anterior de LDL es < 0.001, con lo que se rechaza la Hipótesis Nula de no pendiente y se acepta que hay pendiente, en este caso cercana a 45 º.


Como toda estimación en la estadística, el valor de la pendiente tiene un IC 95 %, en este caso IC 95 % de la pendiente = 0,90 a 0,97.

Esto significa que los valores esperables de la pendiente de la recta que asocia colesterol y LDL estarán en el 95 % de los casos entre valores que van de 0.90 a 0.97.


En la práctica, si queremos saber qué valor de LDL tendríamos si el paciente tiene un valor de colesterol total de 300 mg/dL, aplicamos la formula obtenida.


LDL = 300 * 0.91 – 52 = 221 mg/dL


Sólo a fines ilustrativos, veamos qué pasa si lo que queremos predecir esta vez es el valor de colesterol total.


El resultado de la regresión lineal es igual a:


Fig. 16-5 Regresión Lineal. Predicción de colesterol total












Colesterol total = 0,98 * LDL + 70,7 p < 0.001


En este caso, como es esperable, el valor de es positivo (+70,7), dado que los valores de colesterol total son mayores a los de LDL.

El valor de 0.98 significa que, además de ser cercano a 1, por cada incremento en 1 unidad de LDL el colesterol aumenta 0.98 mg/dL.

Aquí también vemos que la pendiente es de casi 45º (valor de 0.98) con p < 0.001, por lo que confirmamos que la pendiente es diferente a cero (hay pendiente, la recta no es horizontal). (Fig. 16-5.)


En resumen, la prueba de correlación determina si dos variables tienen relación lineal y la regresión lineal establece el grado de asociación de estas variables.


Para determinar comcordancia veremos que metodos tenemos disponibles.

3 visualizaciones0 comentarios

Entradas recientes

Ver todo

Comments


Publicar: Blog2_Post

©2019 por Dra Henquin. Creada con Wix.com

bottom of page