Ce este analiza varianței (ANOVA)?
Analiza varianței (ANOVA) este un instrument de analiză utilizat în statistici care împarte o variabilitate agregată observată găsită într-un set de date în două părți: factori sistematici și factori aleatori. Factorii sistematici au o influență statistică asupra setului de date dat, în timp ce factorii aleatori nu o au. Analiștii folosesc testul ANOVA pentru a determina influența pe care o au variabilele independente asupra variabilei dependente într-un studiu de regresie.
Metodele de testare t și z dezvoltate în secolul al XX-lea au fost folosite pentru analiza statistică până în 1918, când Ronald Fisher a creat metoda de analiză a varianței. ANOVA se mai numește și analiza Fisher a varianței și este extinderea testelor t și z. Termenul a devenit binecunoscut în 1925, după ce a apărut în cartea lui Fisher, „Statistical Methods for Research Workers”. A fost folosit în psihologia experimentală și mai târziu sa extins la subiecte care erau mai complexe.
Recomandări cheie
- Analiza varianței sau ANOVA este o metodă statistică care separă datele varianței observate în diferite componente pentru a fi utilizate pentru teste suplimentare.
- Un ANOVA unidirecțional este utilizat pentru trei sau mai multe grupuri de date, pentru a obține informații despre relația dintre variabilele dependente și independente.
- Dacă nu există o variație adevărată între grupuri, raportul F al ANOVA ar trebui să fie egal cu 1.
1:01
Ce este analiza varianței (ANOVA)?
Formula pentru ANOVA este:
F
=
MST
MSE
Unde:
F
=
Coeficientul ANOVA
MST
=
Suma medie a pătratelor datorată tratamentului
MSE
=
Suma medie a pătratelor din cauza erorii
\begin{aligned} &\text{F} = \frac{ \text{MST} }{ \text{MSE} } \\ &\textbf{unde:} \\ &\text{F} = \text{ANOVA coeficient} \\ &\text{MST} = \text{Suma medie a pătratelor din cauza tratamentului} \\ &\text{MSE} = \text{Suma medie a pătratelor din cauza erorii} \\ \end{aliniat} F=MSEMSTUnde:F=Coeficientul ANOVAMST=Suma medie a pătratelor datorată tratamentuluiMSE=Suma medie a pătratelor din cauza erorii
Ce dezvăluie analiza variației?
Testul ANOVA este pasul inițial în analiza factorilor care afectează un anumit set de date. Odată ce testul este terminat, un analist efectuează teste suplimentare asupra factorilor metodici care contribuie în mod măsurabil la inconsecvența setului de date. Analistul utilizează rezultatele testului ANOVA într-un test f pentru a genera date suplimentare care se aliniază cu modelele de regresie propuse.
Testul ANOVA permite o comparație a mai mult de două grupuri în același timp pentru a determina dacă există o relație între ele. Rezultatul formulei ANOVA, statistica F (numită și raportul F), permite analiza mai multor grupuri de date pentru a determina variabilitatea între eșantioane și în interiorul eșantioanelor.
Dacă nu există o diferență reală între grupurile testate, care se numește ipoteza nulă, rezultatul statisticii raportului F al ANOVA va fi aproape de 1. Distribuția tuturor valorilor posibile ale statisticii F este distribuția F. Acesta este de fapt un grup de funcții de distribuție, cu două numere caracteristice, numite grade de libertate numărător și grade de libertate numitor.
Exemplu de utilizare a ANOVA
Un cercetător ar putea, de exemplu, să testeze studenți din mai multe colegii pentru a vedea dacă studenții de la unul dintre colegii depășesc în mod constant studenții din celelalte colegii. Într-o aplicație de afaceri, un cercetător în cercetare și dezvoltare ar putea testa două procese diferite de creare a unui produs pentru a vedea dacă un proces este mai bun decât celălalt în ceea ce privește eficiența costurilor.
Tipul de test ANOVA utilizat depinde de o serie de factori. Se aplică atunci când datele trebuie să fie experimentale. Analiza varianței este utilizată dacă nu există acces la software-ul statistic, ceea ce duce la calcularea manuală a ANOVA. Este simplu de utilizat și cel mai potrivit pentru mostre mici. Cu multe modele experimentale, dimensiunile eșantionului trebuie să fie aceleași pentru diferitele combinații de nivel de factori.
ANOVA este utilă pentru testarea a trei sau mai multe variabile. Este similar cu mai multe teste t cu două eșantioane. Cu toate acestea, are ca rezultat mai puține erori de tip I și este adecvată pentru o serie de probleme. ANOVA grupează diferențele comparând mediile fiecărui grup și include răspândirea varianței în diverse surse. Este folosit cu subiecți, grupuri de testare, între grupuri și în cadrul grupelor.
ANOVA unidirecțional versus ANOVA bidirecțional
Există două tipuri principale de ANOVA: unidirecțională (sau unidirecțională) și bidirecțională. Există și variații ale ANOVA. De exemplu, MANOVA (ANOVA multivariată) diferă de ANOVA deoarece primul testează pentru mai multe variabile dependente simultan, în timp ce cel din urmă evaluează doar o variabilă dependentă la un moment dat. Unic sau bidirecțional se referă la numărul de variabile independente din testul de analiză a varianței. O ANOVA unidirecțională evaluează impactul unui singur factor asupra unei singure variabile de răspuns. Acesta determină dacă toate mostrele sunt la fel. ANOVA unidirecțională este utilizată pentru a determina dacă există diferențe semnificative statistic între mediile a trei sau mai multe grupuri independente (neînrudite).
O ANOVA bidirecțională este o extensie a ANOVA unidirecțională. Cu un singur sens, aveți o variabilă independentă care afectează o variabilă dependentă. Cu un ANOVA cu două sensuri, există doi independenți. De exemplu, o ANOVA bidirecțională permite unei companii să compare productivitatea lucrătorilor pe baza a două variabile independente, cum ar fi salariul și setul de abilități. Este utilizat pentru a observa interacțiunea dintre cei doi factori și pentru a testa efectul a doi factori în același timp.