¿Qué es una regresión?
La regresión es un método estadístico utilizado en finanzas, inversiones y otras disciplinas que intenta determinar la fuerza y el carácter de la relación entre una variable dependiente (generalmente denominada Y) y otras variables (conocidas como variables independientes).
También llamada regresión simple o mínimos cuadrados ordinarios (OLS), la regresión lineal es la forma más común de esta técnica. La regresión lineal establece la relación lineal entre dos variables en función de una línea de mejor ajuste. Luego, la regresión lineal se grafica usando una línea recta con la pendiente que define cómo un cambio en una variable afecta un cambio en la otra. La intersección y de una relación de regresión lineal representa el valor de una variable cuando el valor de la otra es cero. También existen modelos de regresión no lineal, pero son mucho más complejos.
El análisis de regresión es una herramienta poderosa para descubrir asociaciones entre las variables observadas en los datos, pero no puede indicar fácilmente la causalidad. Se utiliza en diferentes contextos en los negocios, las finanzas y la economía. Por ejemplo, se utiliza para ayudar a los administradores de inversiones a evaluar los activos y comprender las relaciones entre factores como los precios de las materias primas y las acciones de las empresas que comercian con esas materias primas.
La regresión como técnica estadística no debe confundirse con el concepto de regresión a la media (mean reversion).
Puntos clave
- Una regresión es una técnica estadística que relaciona una variable dependiente con una o más variables independientes (explicativas).
- Un modelo de regresión puede mostrar si los cambios observados en la variable dependiente están asociados con cambios en una o más de las variables explicativas.
- Lo hace ajustando esencialmente una línea de mejor ajuste y observando cómo se dispersan los datos alrededor de esta línea.
- La regresión ayuda a los economistas y analistas financieros con cosas que van desde la valoración de activos hasta la previsión.
- Para que los resultados de la regresión se interpreten correctamente, se deben cumplir varias suposiciones sobre los datos y el modelo en sí.
1:21
Regresión
Comprender la regresión
La regresión captura la correlación entre las variables observadas en un conjunto de datos y cuantifica si esas correlaciones son o no estadísticamente significativas.
Los dos tipos básicos de regresión son la regresión lineal simple y la regresión lineal múltiple, aunque existen métodos de regresión no lineal para datos y análisis más complicados. La regresión lineal simple usa una variable independiente para explicar o predecir el resultado de la variable dependiente Y, mientras que la regresión lineal múltiple usa dos o más variables independientes para predecir el resultado (manteniendo todas las demás constantes).
La regresión puede ayudar a los profesionales de las finanzas y la inversión, así como a los profesionales de otros negocios. La regresión también puede ayudar a predecir las ventas de una empresa en función del clima, las ventas anteriores, el crecimiento del PIB u otros tipos de condiciones. El modelo de fijación de precios de activos de capital (CAPM) es un modelo de regresión que se usa a menudo en finanzas para valorar activos y descubrir el costo de capital.
Regresión y econometría
La econometría es un conjunto de técnicas estadísticas utilizadas para analizar datos en finanzas y economía. Un ejemplo de la aplicación de la econometría es el estudio del efecto ingreso utilizando datos observables. Un economista puede, por ejemplo, suponer que a medida que aumentan los ingresos de una persona, también lo harán sus gastos.
Si los datos muestran que tal asociación está presente, se puede realizar un análisis de regresión para comprender la fuerza de la relación entre el ingreso y el consumo y si la relación es estadísticamente significativa o no, es decir, parece poco probable que sea solo por casualidad. .
Tenga en cuenta que puede tener varias variables explicativas en su análisis, por ejemplo, cambios en el PIB y la inflación, así como el desempleo para explicar los precios del mercado de valores. Cuando se utiliza más de una variable explicativa, se denomina regresión lineal múltiple. Esta es la herramienta más utilizada en econometría.
A veces se critica a la econometría por depender demasiado de la interpretación de los resultados de la regresión sin vincularla a la teoría económica o buscar mecanismos causales. Es imperativo que los hallazgos revelados en los datos puedan ser adecuadamente explicados por una teoría, incluso si eso significa desarrollar la propia teoría de los procesos subyacentes.
Cálculo de regresión
Los modelos de regresión lineal a menudo usan un enfoque de mínimos cuadrados para determinar la línea de mejor ajuste. La técnica de mínimos cuadrados se determina minimizando la suma de cuadrados creada por una función matemática. A su vez, un cuadrado se determina elevando al cuadrado la distancia entre un punto de datos y la línea de regresión o el valor medio del conjunto de datos.
Una vez que se completa este proceso (que generalmente se realiza hoy en día con software), se construye un modelo de regresión. La forma general de cada tipo de modelo de regresión es:
Regresión lineal simple:
Y
=
a
+
b
X
+
tú
\begin{alineado}&Y = a + bX + u \\\end{alineado} Y=a+bX+tú
Regresión lineal múltiple:
Y
=
a
+
b
1
X
1
+
b
2
X
2
+
b
3
X
3
+
.
.
.
+
b
t
X
t
+
tú
Dónde está:
Y
=
La variable dependiente que intentas predecir
o explicar
X
=
Las variables explicativas (independientes) que usted está
usando para predecir o asociar con Y
a
=
El intercepto en y
b
=
(coeficiente beta) es la pendiente de la explicativa
variables
tú
=
El residuo de regresión o término de error
\begin{alineado}&Y = a + b_1X_1 + b_2X_2 + b_3X_3 + … + b_tX_t + u \\&\textbf{donde:} \\&Y = \text{La variable dependiente que intentas predecir} \\& \text{o explicar} \\&X = \text{Las variables explicativas (independientes) que está } \\&\text{usando para predecir o asociar con Y} \\&a = \text{La intersección y } \\ &b = \text{(coeficiente beta) es la pendiente de la explicación} \\&\text{variable(s)} \\&u = \text{El residuo de regresión o término de error} \\\end{alineado} Y=a+b1X1+b2X2+b3X3+…+btXt+túDónde está:Y=La variable dependiente que intentas predeciro explicarX=Las variables explicativas (independientes) que usted está usando para predecir o asociar con Ya=El intercepto en yb=(coeficiente beta) es la pendiente de la explicativavariablestú=El residuo de regresión o término de error
Ejemplo de cómo se utiliza el análisis de regresión en finanzas
La regresión se usa a menudo para determinar cuánto factores específicos, como el precio de un producto básico, las tasas de interés, industrias o sectores particulares, influyen en el movimiento del precio de un activo. El CAPM anterior se basa en una regresión y se utiliza para proyectar los rendimientos esperados de las acciones y para generar costos de capital. Los rendimientos de una acción se comparan con los rendimientos de un índice más amplio, como el S&P 500, para generar una beta para la acción en particular.
Beta es el riesgo del valor en relación con el mercado o índice y se refleja como una pendiente en el modelo CAPM. El rendimiento del valor en cuestión sería la variable dependiente Y, mientras que la variable independiente X sería la prima de riesgo de mercado.
Se pueden agregar al modelo CAPM variables adicionales, como la capitalización de mercado de una acción, los índices de valoración y los rendimientos recientes, para obtener mejores estimaciones de los rendimientos. Estos factores adicionales se conocen como factores Fama-French, en honor a los profesores que desarrollaron el modelo de regresión lineal múltiple para explicar mejor los rendimientos de los activos.
¿Por qué se llama regresión?
Si bien existe cierto debate sobre los orígenes del nombre, lo más probable es que Sir Francis Galton se refiriera a la técnica estadística descrita anteriormente como «regresión» en el siglo XIX para describir la característica estadística de los datos biológicos (como la altura de las personas). en una población) regresan a algún nivel promedio. En otras palabras, si bien hay personas más bajas y más altas, solo los valores atípicos son muy altos o bajos, y la mayoría de las personas se agrupan en algún lugar alrededor (o «regresan») de la media.
¿Cuál es el propósito de la regresión?
En el análisis estadístico, la regresión se usa para identificar asociaciones entre variables que ocurren en algunos datos. Puede mostrar tanto la magnitud de esta asociación como determinar su significación estadística (es decir, si la asociación se debe o no al azar). La regresión es una herramienta poderosa para la inferencia estadística y también se ha utilizado para tratar de predecir resultados futuros basados en observaciones pasadas.
¿Cómo se interpreta un modelo de regresión?
La salida de un modelo de regresión puede tener la forma de Y = 1.0 + (3.2)X1 -2.0(X2) + 0,21.
Aquí tenemos una regresión lineal múltiple que relaciona una variable Y con dos variables explicativas X1 y X2. Interpretaríamos el modelo como si el valor de Y cambiara 3.2 veces por cada cambio de una unidad en X1 (si X1 sal de 2, Y sal de 6,4, etc.) manteniendo todo lo demás constante (Todos los demás iguales). Esto significa verificar X2X1 tiene esta relación observada. De manera similar, manteniendo constante X1, cada unidad aumenta en X2 está asociado con un 2x disminuir en Y. También podemos notar el intercepto en y de 1.0, lo que significa que Y = 1 cuando X1 y X2 ambos son nulos. El término de error (residual) es 0,21.
¿Cuáles son los supuestos que deben cumplirse para los modelos de regresión?
Para interpretar correctamente el resultado de un modelo de regresión, deben cumplirse las siguientes suposiciones principales sobre el proceso de datos subyacente de lo que está analizando:
- La relación entre las variables es lineal.
- Homocedasticidad, es decir, que la varianza de las variables y el término de error deben permanecer constantes
- Todas las variables explicativas son independientes entre sí.
- Todas las variables tienen distribución normal.