¿Qué es el coeficiente de correlación?
El coeficiente de correlación es una medida estadística de la fuerza de una relación lineal entre dos variables. Sus valores pueden oscilar entre -1 y 1. Un coeficiente de correlación de -1 describe una correlación negativa o inversa perfecta, en la que los valores de una serie aumentan mientras que los de la otra disminuyen, y viceversa. Un coeficiente de 1 muestra una correlación positiva perfecta o una relación directa. Un coeficiente de correlación de 0 significa que no existe una relación lineal.
Los coeficientes de correlación se utilizan en ciencias y finanzas para evaluar el grado de asociación entre dos variables, factores o conjuntos de datos. Por ejemplo, debido a que los altos precios del petróleo son favorables para los productores de petróleo crudo, se podría suponer que la correlación entre los precios del petróleo y los rendimientos futuros de las existencias de petróleo es muy positiva. El cálculo del coeficiente de correlación de estas variables con base en datos de mercado revela una correlación moderada e inconsistente durante largos períodos.
Puntos clave
- Los coeficientes de correlación se utilizan para evaluar la fuerza de las asociaciones entre variables de datos.
- El más común, denominado coeficiente de correlación de Pearson, mide la fuerza y dirección de una relación lineal entre dos variables.
- Los valores siempre van desde -1 para una relación perfectamente inversa o negativa hasta 1 para una correlación perfectamente positiva. Los valores de cero o cercanos indican que no hay relación lineal o una correlación muy débil.
- Los valores de los coeficientes requeridos para reportar una asociación significativa dependen de la aplicación. La significación estadística de una correlación se puede calcular a partir del coeficiente de correlación y el número de puntos de datos en la muestra, suponiendo una distribución de población normal.
Entender el coeficiente de correlación
Se utilizan diferentes tipos de coeficientes de correlación para evaluar la correlación en función de las propiedades de los datos que se comparan. Con mucho, el más común es el coeficiente de Pearson, o coeficiente de Pearson. r, que mide la fuerza y la dirección de una relación lineal entre dos variables. El coeficiente de Pearson no puede evaluar asociaciones no lineales entre variables y no puede distinguir entre variables dependientes e independientes.
El coeficiente de Pearson utiliza una fórmula estadística matemática para medir qué tan cerca se aproximan los puntos de datos que combinan las dos variables (con los valores de una serie de datos trazados en el eje x y los valores correspondientes de la otra serie en el eje y) línea de mejor ajuste. La línea de mejor ajuste se puede determinar a través del análisis de regresión.
Cuanto más lejos esté el coeficiente de cero, ya sea positivo o negativo, mejor será el ajuste y mayor será la correlación. Los valores de -1 (para una correlación negativa) y 1 (para una positiva) describen ajustes perfectos donde todos los puntos de datos se alinean en línea recta, lo que indica que las variables están perfectamente correlacionadas. En otras palabras, la relación es tan predecible que el valor de una variable puede determinarse por el valor correspondiente de la otra. Cuanto más cerca de cero esté el coeficiente de correlación, más débil será la correlación, hasta que en cero no haya una relación lineal.
Las evaluaciones de la fuerza de la correlación basadas en el valor del coeficiente de correlación varían según la aplicación. En física y química, un coeficiente de correlación debería ser inferior a -0,9 o superior a 0,9 para que la correlación se considere significativa, mientras que en ciencias sociales el umbral podría ser tan alto como -0,5 y tan bajo como 0,5.
Para los coeficientes de correlación derivados del muestreo, la determinación de la significación estadística depende del valor p, calculado a partir del tamaño de la muestra de datos y el valor del coeficiente.
Ecuación del coeficiente de correlación
Para calcular la correlación de Pearson, comienza por determinar la desviación estándar de cada variable y la covarianza entre ellas. El coeficiente de correlación es la covarianza dividida por el producto de las desviaciones estándar de las dos variables.
ρ
X
sí
=
Cov
(
X
,
sí
)
σ
X
σ
sí
Dónde está:
ρ
X
sí
=
Coeficiente de correlación producto-momento de Pearson
Cov
(
X
,
sí
)
=
covarianza de las variables
X
Y
sí
σ
X
=
desviación estándar de
X
σ
sí
=
desviación estándar de
sí
\begin{alineado} &\rho_{xy} = \frac { \text{Cov} ( x, y ) }{ \sigma_x \sigma_y } \\ &\textbf{donde:} \\ &\rho_{xy} = \text{Coeficiente de correlación momento-producto de Pearson} \\ &\text{Cov} ( x, y ) = \text{covarianza de variables } x \text{ e } y \\ &\sigma_x = \text{desviación estándar de } x \\ &\sigma_y = \text{desviación estándar de } y \\ \end{alineado} ρXsí=σXσsíCov(X,sí)Dónde está:ρXsí=Coeficiente de correlación producto-momento de PearsonCov(X,sí)=covarianza de las variables X Y síσX=desviación estándar de Xσsí=desviación estándar de sí
La desviación estándar es una medida de la dispersión de los datos de su media. La covarianza muestra si las dos variables tienden a moverse en la misma dirección, mientras que el coeficiente de correlación mide la fuerza de esa relación en una escala normalizada, de -1 a 1.
La fórmula anterior se puede resolver como
r
=
no
×
(
∑
(
X
,
Y
)
−
(
∑
(
X
)
×
∑
(
Y
)
)
)
(
no
×
∑
(
X
2
)
−
∑
(
X
)
2
)
×
(
no
×
∑
(
Y
2
)
−
∑
(
Y
)
2
)
Dónde está:
r
=
Coeficiente de correlación
no
=
Número de observaciones
\begin{alineado}&r = \frac { n \times ( \sum (X, Y) – ( \sum (X) \times \sum (Y) ) ) }{ \sqrt { ( n \times \sum (X) ^ 2) – \sum (X) ^ 2 ) \times ( n \times \sum( Y ^ 2 ) – \sum (Y) ^ 2 ) } } \\&\textbf{donde:}\\&r=\ text{Coeficiente de correlación}\\&n=\text{Número de observaciones}\end{alineadas} r=(no×∑(X2)−∑(X)2)×(no×∑(Y2)−∑(Y)2)no×(∑(X,Y)−(∑(X)×∑(Y)))Dónde está:r=Coeficiente de correlaciónno=Número de observaciones
Estadísticas de correlación e inversiones
El coeficiente de correlación es especialmente útil para evaluar y gestionar los riesgos de inversión. Por ejemplo, la teoría moderna de la cartera sugiere que la diversificación puede reducir la volatilidad de los rendimientos de una cartera al limitar el riesgo. El coeficiente de correlación entre rendimientos históricos puede indicar si agregar una inversión a una cartera mejorará su diversificación.
Los cálculos de correlación también son un elemento básico de la inversión por factores, una estrategia para construir una cartera basada en factores asociados con rendimientos adicionales. Mientras tanto, los cuantitativos usan correlaciones históricas y coeficientes de correlación para anticipar cambios a corto plazo en los precios de las acciones.
Limitaciones del coeficiente de correlación de Pearson
La correlación no implica causalidad, como se suele decir, y el coeficiente de Pearson no puede determinar si una de las variables correlacionadas depende de la otra.
El coeficiente de correlación tampoco muestra qué proporción del cambio en la variable dependiente es atribuible a la variable independiente. Esto se muestra mediante el coeficiente de determinación, también conocido como R-cuadrado, que es simplemente el coeficiente de correlación al cuadrado.
El coeficiente de correlación no describe la pendiente de la línea de mejor ajuste; la pendiente se puede determinar mediante el método de mínimos cuadrados en el análisis de regresión.
El coeficiente de correlación de Pearson no se puede utilizar para evaluar asociaciones no lineales o aquellas que surgen de datos muestreados que no están sujetos a una distribución normal. También puede estar sesgado por valores atípicos: puntos de datos muy por fuera del diagrama de dispersión de una distribución. Estas relaciones se pueden analizar mediante métodos no paramétricos, como el coeficiente de correlación de Spearman, el coeficiente de correlación de rangos de Kendall o un coeficiente de correlación policórica.
Encontrar coeficientes de correlación en Excel
La forma más fácil de calcular la correlación en Excel es poner dos series de datos en columnas adyacentes y usar la fórmula de correlación integrada:
Si desea crear una matriz de correlación en una serie de conjuntos de datos, Excel tiene un complemento de Análisis de datos en la pestaña Datos, en Analizar.
Seleccione la tabla de rendimiento. En este caso, nuestras columnas tienen título, por lo que queremos marcar la casilla «Etiquetas en la primera fila», para que Excel sepa que debe tratarlas como títulos. Luego puede optar por enviar a la misma hoja o a una hoja nueva.
Presionar enter producirá la matriz de correlación. Puede agregar texto y formato condicional para limpiar el resultado.
¿Qué es un coeficiente de correlación?
El coeficiente de correlación describe cómo se mueve una variable en relación con otra. Una correlación positiva indica que los dos se mueven en la misma dirección, con un valor de 1 que indica una correlación positiva perfecta. Un valor de -1 muestra una correlación negativa o inversa perfecta, mientras que cero significa que no hay una correlación lineal.
¿Cómo se calcula el coeficiente de correlación?
El coeficiente de correlación se calcula determinando la covarianza de las variables y dividiendo ese número por el producto de las desviaciones estándar de esas variables.
¿Cómo se utiliza el coeficiente de correlación en la inversión?
Los coeficientes de correlación juegan un papel clave en las evaluaciones de riesgo de cartera y las estrategias comerciales cuantitativas. Por ejemplo, algunos administradores de cartera monitorearán los coeficientes de correlación de sus tenencias para limitar la volatilidad y el riesgo de una cartera.