Ce este o distribuție de eșantionare?
O distribuție de eșantionare este o distribuție de probabilitate a unei statistici obținute dintr-un număr mai mare de eșantioane extrase dintr-o anumită populație. Distribuția de eșantionare a unei populații date este distribuția frecvențelor unei game de rezultate diferite care ar putea avea loc pentru o statistică a unei populații.
În statistică, o populație este întregul grup din care este extras un eșantion statistic. O populație se poate referi la un întreg grup de oameni, obiecte, evenimente, vizite la spital sau măsurători. Astfel, se poate spune că o populație este o observație agregată a subiecților grupați împreună printr-o trăsătură comună.
- O distribuție de eșantionare este o statistică care este obținută prin eșantionarea repetată de la o populație mai mare.
- Descrie o serie de rezultate posibile ale unei statistici, cum ar fi media sau modul unei variabile, deoarece există cu adevărat o populație.
- Majoritatea datelor analizate de cercetători sunt de fapt extrase din eșantioane și nu din populații.
Înțelegerea distribuției eșantionării
O mulțime de date extrase și utilizate de academicieni, statisticieni, cercetători, marketeri, analiști etc. sunt de fapt eșantioane, nu populații. Un eșantion este un subset al unei populații. De exemplu, un cercetător medical care a dorit să compare greutatea medie a tuturor bebelușilor născuți în America de Nord între 1995 și 2005 cu cei născuți în America de Sud în aceeași perioadă de timp nu poate extrage datele pentru întreaga populație de timp într-un interval de timp rezonabil. peste un milion de nașteri care au avut loc în intervalul de timp de zece ani. Ei vor folosi în schimb doar greutatea a, să zicem, 100 de bebeluși, pe fiecare continent pentru a trage o concluzie. Greutatea a 200 de bebeluși utilizată este eșantionul, iar greutatea medie calculată este media eșantionului.
Acum să presupunem că, în loc să ia doar un eșantion de 100 de greutăți nou-născuți de pe fiecare continent, cercetătorul medical ia probe aleatorii repetate din populația generală și calculează media eșantionului pentru fiecare grup de eșantion. Deci, pentru America de Nord, ei extrag date pentru 100 de greutăți nou-născuți înregistrate în SUA, Canada și Mexic, după cum urmează: patru 100 de probe de la spitale selectate din SUA, cinci 70 de mostre din Canada și trei 150 de înregistrări din Mexic, pentru un total din 1.200 de greutăți ale nou-născuților grupați în 12 seturi. Ei colectează, de asemenea, un eșantion de date de 100 de greutăți la naștere din fiecare dintre cele 12 țări din America de Sud.
Fiecare eșantion are propria medie a eșantionului, iar distribuția mediei eșantionului este cunoscută sub denumirea de distribuție a eșantionului.
Greutatea medie calculată pentru fiecare set de probă este distribuția de eșantionare a mediei. Nu doar media poate fi calculată dintr-un eșantion. Alte statistici, cum ar fi abaterea standard, varianța, proporția și intervalul pot fi calculate din datele eșantionului. Abaterea standard și varianța măsoară variabilitatea distribuției de eșantionare.
Numărul de observații dintr-o populație, numărul de observații dintr-un eșantion și procedura utilizată pentru a extrage seturile de eșantionare determină variabilitatea unei distribuții de eșantionare. Abaterea standard a unei distribuții de eșantionare se numește eroare standard. În timp ce media unei distribuții de eșantionare este egală cu media populației, eroarea standard depinde de abaterea standard a populației, de dimensiunea populației și de dimensiunea eșantionului.
Cunoașterea cât de dispersată este media fiecărui set de eșantion una de cealaltă și de media populației va oferi o indicație despre cât de aproape este media eșantionului de media populației. Eroarea standard a distribuției de eșantionare scade pe măsură ce dimensiunea eșantionului crește.
consideratii speciale
O populație sau un set de eșantion de numere va avea o distribuție normală. Cu toate acestea, deoarece o distribuție de eșantionare include mai multe seturi de observații, nu va avea neapărat o formă curbată în clopot.
Urmând exemplul nostru, greutatea medie a copiilor din America de Nord și America de Sud are o distribuție normală, deoarece unii bebeluși vor fi subponderali (sub medie) sau supraponderali (peste medie), majoritatea bebelușilor fiind între ele (în jurul mediei). ). Dacă greutatea medie a nou-născuților din America de Nord este de șapte kilograme, greutatea medie a eșantionului în fiecare dintre cele 12 seturi de observații eșantionate înregistrate pentru America de Nord va fi și ea aproape de șapte kilograme.
Cu toate acestea, dacă reprezentați grafic fiecare dintre mediile calculate în fiecare dintre cele 1.200 de grupuri de eșantion, forma rezultată poate avea ca rezultat o distribuție uniformă, dar este dificil de prezis cu certitudine care se va dovedi forma reală. Cu cât cercetătorul folosește mai multe eșantioane din populația de peste un milion de cifre de greutate, cu atât graficul va începe să formeze o distribuție normală.