¿Qué es la suma residual de cuadrados (RSS)?
La suma residual de cuadrados (RSS) es una técnica estadística utilizada para medir la cantidad de varianza en un conjunto de datos que no se explica por un modelo de regresión en sí. En su lugar, estima la varianza en los residuos o término de error.
La regresión lineal es una medida que ayuda a determinar la fuerza de la relación entre una variable dependiente y uno o más factores, conocidos como variables independientes o explicativas.
Puntos clave
- La suma residual de cuadrados (RSS) mide el nivel de variación en el término de error, o residuos, de un modelo de regresión.
- Cuanto menor sea la suma residual de los cuadrados, mejor se ajustará el modelo a los datos; cuanto mayor sea la suma residual de los cuadrados, peor se ajustará su modelo a sus datos.
- Un valor de cero significa que su modelo es perfecto.
- Los inversores y gestores de cartera utilizan modelos estadísticos para realizar un seguimiento del precio de una inversión y utilizar esos datos para predecir movimientos futuros.
- Los analistas financieros utilizan RSS para estimar la validez de sus modelos econométricos.
Entendiendo la suma residual de cuadrados
En términos generales, la suma de cuadrados es una técnica estadística utilizada en el análisis de regresión para determinar la dispersión de puntos de datos. En un análisis de regresión, el objetivo es determinar qué tan bien un conjunto de datos puede ajustarse a una función que podría ayudar a explicar cómo se generó el conjunto de datos. La suma de cuadrados se utiliza como método matemático para encontrar la función que mejor se ajusta (varía menos) a los datos.
RSS mide la cantidad de error restante entre la función de regresión y el conjunto de datos después de ejecutar el modelo. Una cifra de RSS más pequeña representa una función de regresión que se ajusta bien a los datos.
RSS, también conocido como residuos de suma cuadrada, determina esencialmente qué tan bien un modelo de regresión explica o representa los datos en el modelo.
Cómo calcular la suma residual de cuadrados
RSS = ∑noyo=1 (síyo – F(Xyo))2
Dónde está:
síyo = el yoel valor de la variable a predecir
F(Xyo) = valor esperado de yyo
n = límite superior de suma
Suma residual de cuadrados (RSS) frente a error estándar residual (RSE)
El error estándar residual (RSE) es otro término estadístico que se utiliza para describir la diferencia en las desviaciones estándar de los valores observados frente a los valores predichos, como muestran los puntos en un análisis de regresión. Es una medida de bondad de ajuste que se puede utilizar para analizar qué tan bien se ajusta un conjunto de puntos de datos al modelo real.
El RSE se calcula dividiendo el RSS por el número de observaciones en la muestra menos 2, y luego sacando la raíz cuadrada: RSE = [RSS/(n-2)]1/2
Consideraciones Especiales
Los mercados financieros se han vuelto cada vez más orientados cuantitativamente; por lo tanto, buscando una ventaja, muchos inversores utilizan técnicas estadísticas avanzadas para ayudarlos en sus decisiones. Las aplicaciones de big data, aprendizaje automático e inteligencia artificial también requieren el uso de propiedades estadísticas para impulsar las estrategias de inversión contemporáneas. La suma residual de cuadrados, o estadística RSS, es una de las muchas propiedades estadísticas que experimentan un renacimiento.
Los inversores y gestores de cartera utilizan modelos estadísticos para realizar un seguimiento del precio de una inversión y utilizar esos datos para predecir movimientos futuros. El estudio, llamado análisis de regresión, podría involucrar el análisis de la relación en los movimientos de precios entre un producto básico y las acciones de las empresas dedicadas a la fabricación del producto básico.
Encontrar la suma residual de cuadrados (RSS) manualmente puede ser difícil y llevar mucho tiempo. Debido a que involucra muchas restas, ecuaciones y sumas, los cálculos pueden ser propensos a errores. Por esta razón, puede decidir usar un software, como Excel, para hacer los cálculos.
Cualquier modelo puede tener desviaciones entre los valores predichos y los resultados reales. Aunque las desviaciones pueden explicarse mediante análisis de regresión, el RSS representa las desviaciones o errores no explicados.
Debido a que es posible construir una función de regresión lo suficientemente compleja como para adaptarse a prácticamente cualquier conjunto de datos, se necesita más estudio para determinar si la función de regresión es, de hecho, útil para explicar la varianza del conjunto de datos.
Sin embargo, por lo general, un valor más bajo o más bajo para RSS es ideal en cualquier modelo, ya que significa que hay menos variación en el conjunto de datos. En otras palabras, cuanto menor sea la suma de los residuos cuadrados, mejor será el modelo de regresión para explicar los datos.
Ejemplo de la suma residual de cuadrados
Para una demostración simple (pero larga) del cálculo de RSS, considere la conocida correlación entre el gasto del consumidor de un país y su PIB. El siguiente gráfico refleja los valores publicados de gasto del consumidor y producto interno bruto para los 27 estados miembros de la Unión Europea, a partir de 2020.
Gasto del consumidor vs. PIB de los Estados miembros de la UE | ||
---|---|---|
Aldea | Gasto del consumidor (millones) |
PIB (millones) |
Austria | 309.018,88 | 433.258,47 |
Bélgica | 388,436.00 | 521.861,29 |
Bulgaria | 54.647,31 | 69.889,35 |
Croacia | 47.392,86 | 57.203,78 |
Chipre | 20.592,74 | 24.612,65 |
República Checa | 164.933,47 | 245.349,49 |
Dinamarca | 251.478,47 | 356.084,87 |
Estonia | 21,776.00 | 30.650,29 |
Finlandia | 203.731,24 | 269.751,31 |
Francia | 2.057.126,03 | 2.630.317,73 |
Alemania | 2.812.718,45 | 3.846.413,93 |
Grecia | 174.893,21 | 188.835,20 |
Hungría | 110.323,35 | 155.808,44 |
Irlanda | 160.561,07 | 425.888,95 |
Italia | 1.486.910,44 | 1.888.709,44 |
letonia | 25.776,74 | 33.707,32 |
Lituania | 43.679,20 | 56.546,96 |
luxemburgo | 35.953,29 | 73.353,13 |
Malta | 9,808.76 | 14.647,38 |
Holanda | 620.050,30 | 913.865,40 |
Polonia | 453.186,14 | 596.624,36 |
Portugal | 190.509,98 | 228.539,25 |
Rumania | 198.867,77 | 248.715,55 |
República Eslovaca | 83.845,27 | 105.172,56 |
Eslovenia | 37.929,24 | 53.589,61 |
España | 997.452,45 | 1.281.484,64 |
Suecia | 382.240,92 | 541.220,06 |
El gasto del consumidor y el PIB tienen una fuerte correlación positiva, y es posible predecir el PIB de un país en función del gasto del consumidor (CS). Usando la fórmula para una línea de mejor ajuste, esta relación se puede aproximar como:
PIB = 1.3232 x SC + 10447
Las unidades del PIB y el gasto del consumidor están en millones de dólares estadounidenses.
Esta fórmula es muy precisa para la mayoría de los propósitos, pero no es perfecta debido a las variaciones individuales en la economía de cada país. El siguiente gráfico compara el PIB proyectado de cada país, basado en la fórmula anterior, y el PIB real registrado por el Banco Mundial.
Datos sobre el PIB proyectado y real para los Estados miembros de la UE y cuadrados residuales | ||||
---|---|---|---|---|
Aldea | Valor más reciente del gasto del consumidor (millones) | Valor más reciente del PIB (millones) | PIB proyectado (basado en la línea de tendencia) | Cuadrado residual (proyectado – real)^2 |
Austria | 309.018,88 | 433.258,47 | 419.340.782016 | 193.702.038,819978 |
Bélgica | 388,436.00 | 521.861,29 | 524.425,52 | 6.575.250,87631504 |
Bulgaria | 54.647,31 | 69.889,35 | 82.756,320592 | 165.558.932,215393 |
Croacia | 47.392,86 | 57.203,78 | 73.157.232352 | 254.512.641,947534 |
Chipre | 20.592,74 | 24.612,65 | 37.695.313568 | 171.156.086.033474 |
República Checa | 164.933,47 | 245.349,49 | 228.686.967504 | 277.639.655,929706 |
Dinamarca | 251.478,47 | 356.084,87 | 343203.311504 | 165.934.549,28587 |
Estonia | 21,776.00 | 30.650,29 | 39,261.00 | 74.144.381,8126542 |
Finlandia | 203.731,24 | 269.751,31 | 280.024,176768 | 105.531.791,633079 |
Francia | 2.057.126,03 | 2.630.317,73 | 2,732,436.162896 | 10.428.174.337,1349 |
Alemania | 2.812.718,45 | 3.846.413,93 | 3.732.236.05304 | 13.036.587.587.0929 |
Grecia | 174.893,21 | 188.835,20 | 241.865.695472 | 2.812.233.450,00581 |
Hungría | 110.323,35 | 155.808,44 | 156.426.85672 | 382.439.239575558 |
Irlanda | 160.561,07 | 425.888,95 | 222.901,407824 | 41.203.942.278.6534 |
Italia | 1.486.910,44 | 1.888.709,44 | 1,977,926.894208 | 7.959.754.135,35658 |
letonia | 25.776,74 | 33.707,32 | 44,554.782368 | 117.667.439,825176 |
Lituania | 43.679,20 | 56.546,96 | 68.243,32 | 136.804.777,364243 |
luxemburgo | 35.953,29 | 73.353,13 | 58.020,393328 | 235.092.813,852894 |
Malta | 9,808.76 | 14.647,38 | 23.425,951232 | 77.063.312,875298 |
Holanda | 620.050,30 | 913.865,40 | 830.897,56 | 6.883.662.978,71 |
Polonia | 453.186,14 | 596.624,36 | 610102,900448 | 181.671.052,608372 |
Portugal | 190.509,98 | 228.539,25 | 262.529,805536 | 1.155.357.865,6459 |
Rumania | 198.867,77 | 248.715,55 | 273.588.833264 | 618.680.220,331183 |
República Eslovaca | 83.845,27 | 105.172,56 | 121.391.061264 | 263.039.783,25037 |
Eslovenia | 37.929,24 | 53.589,61 | 60.634.970368 | 49.637.102,7149851 |
España | 997.452,45 | 1.281.484,64 | 1.330.276,08184 | 2,380,604,796,8261 |
Suecia | 382.240,92 | 541.220,06 | 516228.185344 | 624.593.798,821215 |
La columna de la derecha muestra los cuadrados residuales, que es la diferencia al cuadrado entre cada valor predicho y su valor real. Los números parecen grandes, pero en realidad suman menos que el RSS para cualquier otra línea de tendencia posible. Si una línea diferente tuviera un RSS más bajo para estos puntos de datos, esa línea sería la mejor opción.
¿Es la suma residual de cuadrados igual a R-cuadrado?
La suma residual de cuadrados (RSS) es la cantidad absoluta de variación explicada, mientras que R-squared es la cantidad absoluta de variación como proporción de la variación total.
¿Es RSS igual a la suma de la estimación de errores al cuadrado (SSE)?
La suma residual de cuadrados (RSS) también se conoce como suma estimada de errores cuadrados (SSE).
¿Cuál es la diferencia entre la suma residual de cuadrados y la suma total de cuadrados?
La suma total de cuadrados (TSS) mide cuánta variación hay en los datos observados, mientras que la suma residual de cuadrados mide la variación en el error entre los datos observados y los valores modelados. En estadística, los valores de la suma residual de cuadrados y la suma total de cuadrados (TSS) a menudo se comparan entre sí.
¿Puede una suma residual de cuadrados ser cero?
La suma residual de cuadrados puede ser cero. Cuanto menor sea la suma residual de los cuadrados, mejor se ajustará el modelo a los datos; cuanto mayor sea la suma residual de los cuadrados, peor se ajustará su modelo a sus datos. Un valor de cero significa que su modelo es perfecto.