¿Qué es el Análisis de Varianza (ANOVA)?
El análisis de varianza (ANOVA) es una herramienta de análisis utilizada en estadística que divide una variabilidad observada agregada que se encuentra dentro de un conjunto de datos en dos partes: factores sistemáticos y factores aleatorios. Los factores sistemáticos tienen una influencia estadística en el conjunto de datos dado, mientras que los factores aleatorios no. Los analistas usan la prueba ANOVA para determinar la influencia que las variables independientes tienen sobre la variable dependiente en un estudio de regresión.
Los métodos de prueba z desarrollados en el siglo XX se utilizaron para el análisis estadístico hasta 1918, cuando Ronald Fisher creó el método de análisis de varianza. ANOVA también se denomina análisis de varianza de Fisher y es la extensión de las pruebas t y z. El término se hizo famoso en 1925, después de aparecer en el libro de Fisher, «Métodos estadísticos para investigadores». Se empleó en psicología experimental y luego se extendió a temas más complejos.
Puntos clave
- El análisis de varianza, o ANOVA, es un método estadístico que separa los datos de varianza observados en diferentes componentes que se utilizarán para pruebas adicionales.
- Se utiliza un ANOVA de una vía para tres o más conjuntos de datos, para obtener información sobre la relación entre las variables dependientes e independientes.
- Si no hay una varianza real entre grupos, la relación F del ANOVA debe estar cerca de 1.
1:01
¿Qué es el Análisis de Varianza (ANOVA)?
La fórmula para ANOVA es:
F
=
extensión de ETS
extensión MSE
Dónde está:
F
=
Coeficiente ANOVA
extensión de ETS
=
Suma media de cuadrados debido al tratamiento
extensión MSE
=
Suma media de cuadrados debido al error
\begin{alineado} &\text{F} = \frac{ \text{MST} }{ \text{MSE} } \\ &\textbf{donde:} \\ &\text{F} = \text{ANOVA coeficiente} \\ &\text{MST} = \text{Suma media de cuadrados debido al tratamiento} \\ &\text{MSE} = \text{Suma media de cuadrados debido al error} \\ \end{alineado} F=extensión MSEextensión de ETSDónde está:F=Coeficiente ANOVAextensión de ETS=Suma media de cuadrados debido al tratamientoextensión MSE=Suma media de cuadrados debido al error
¿Qué revela el análisis de varianza?
La prueba ANOVA es el primer paso para analizar los factores que influyen en un conjunto de datos determinado. Una vez que se realiza la prueba, un analista realiza más pruebas sobre los factores metódicos que contribuyen de manera mensurable a la inconsistencia del conjunto de datos. El analista utiliza los resultados de la prueba ANOVA en una prueba f para generar datos adicionales que se alineen con los modelos de regresión propuestos.
La prueba ANOVA le permite comparar más de dos grupos al mismo tiempo para determinar si existe una relación entre ellos. El resultado de la fórmula ANOVA, la estadística F (también llamada relación F), permite el análisis de múltiples conjuntos de datos para determinar la variabilidad entre muestras y dentro de la muestra.
Si no existe una diferencia real entre los grupos probados, lo que se denomina hipótesis nula, el resultado del estadístico F-ratio del ANOVA será cercano a 1. La distribución de todos los valores posibles del estadístico F es la F Esta es en realidad un grupo de funciones de distribución, con dos números característicos, llamados grados de libertad del numerador y grados de libertad del denominador.
Ejemplo de cómo usar ANOVA
Un investigador podría, por ejemplo, evaluar a los estudiantes de varias universidades para ver si los estudiantes de una de las universidades superan constantemente a los estudiantes de las otras universidades. En una aplicación empresarial, un investigador de I+D podría probar dos procesos diferentes de creación de un producto para ver si un proceso es mejor que el otro en términos de rentabilidad.
El tipo de prueba ANOVA utilizada depende de varios factores. Se aplica cuando los datos van a ser experimentales. El análisis de varianza se usa si no hay acceso al software estadístico que da como resultado el cálculo manual del ANOVA. Es fácil de usar y más adecuado para muestras pequeñas. Con muchos diseños experimentales, los tamaños de muestra deben ser los mismos para varias combinaciones de niveles de factores.
ANOVA es útil para probar tres o más variables. Es similar a múltiples pruebas de dos muestras. Sin embargo, da como resultado menos errores de tipo I y es apropiado para varios problemas. ANOVA agrupa las diferencias comparando las medias de cada grupo e incluye la dispersión de la varianza en diferentes fuentes. Se emplea con sujetos, grupos de prueba, entre grupos y dentro de grupos.
ANOVA unidireccional versus ANOVA bidireccional
Hay dos tipos principales de ANOVA: unidireccional (o unidireccional) y bidireccional. También hay variaciones de ANOVA. Por ejemplo, MANOVA (ANOVA multivariado) difiere de ANOVA en que el primero prueba múltiples variables dependientes simultáneamente mientras que el segundo evalúa solo una variable dependiente a la vez. Unidireccional o bidireccional se refiere al número de variables independientes en la prueba de análisis de varianza. Un ANOVA unidireccional evalúa el impacto de un solo factor en una sola variable de respuesta. Determine si todas las muestras son iguales. Se utiliza ANOVA unidireccional para determinar si existen diferencias estadísticamente significativas entre las medias de tres o más grupos independientes (no relacionados).
Un ANOVA de dos vías es una extensión del ANOVA de una vía. Con una forma, tienes una variable independiente que afecta a una variable dependiente. Con un ANOVA de dos vías, hay dos independientes. Por ejemplo, un ANOVA bidireccional permite a una empresa comparar la productividad de los trabajadores en función de dos variables independientes, como el salario y el conjunto de habilidades. Se utiliza para observar la interacción entre los dos factores y probar el efecto de dos factores simultáneamente.