Pearson, Spearman, Kendall
Coeficientes Rho, Rho y Tau
Coeficientes de Pearson, Spearman y Kendall. Fórmulas
Coeficientes de correlación
El coeficiente de correlación entre dos variables responde a la pregunta:
“¿Están las dos variables relacionadas? Es decir, si una variable cambia, ¿la otra también cambia?”.
Coeficiente de Correlación de Pearson para variables normales
Si ambas variables están distribuidas normalmente, la medida estándar para determinar el coeficiente de correlación, frecuentemente atribuida a Pearson, es el coeficiente de correlación de Pearson, a veces también denominado coeficiente de correlación poblacional o correlación de muestra. Este coeficiente puede tomar cualquier valor entre -1 y +1. Es importante notar que la fórmula del coeficiente de correlación es simétrica entre x y y, lo cual no sucede en el caso de la regresión lineal.
Visualmente el nivel de correlación puede verse en graficos como los ya muy conocidod publicados en wikipedia.
Correlación por Rangos
Si la distribución de los datos no es normal, se requiere un enfoque diferente. En este caso, se puede clasificar el conjunto de datos de cada variable y comparar los órdenes. Existen dos métodos comúnmente utilizados para calcular la correlación por rangos:
Rho de Spearman: Es exactamente el mismo coeficiente de correlación que el de Pearson, pero calculado sobre los rangos de las observaciones y no sobre los valores originales.
Tau de Kendall: También es un coeficiente de correlación por rangos, que mide la asociación entre dos cantidades medidas. Es más difícil de calcular que el de Spearman, pero se argumenta que los intervalos de confianza para el coeficiente de Spearman son menos confiables e interpretables que los intervalos de confianza para los parámetros de Kendall.
Los coeficientes de correlación se explican en el apartado de correlaciones lineales.