Ce este eșantionarea aleatorie stratificată?
Eșantionarea aleatorie stratificată este o metodă de eșantionare care implică împărțirea unei populații în subgrupuri mai mici cunoscute sub numele de straturi. În eșantionarea aleatorie stratificată, sau stratificarea, straturile sunt formate pe baza atributelor sau caracteristicilor comune ale membrilor, cum ar fi venitul sau nivelul educațional.
Eșantionarea aleatorie stratificată este denumită și eșantionare aleatoare proporțională sau eșantionare aleatoare cotă.
Recomandări cheie
- Eșantionarea aleatorie stratificată permite cercetătorilor să obțină o populație eșantion care reprezintă cel mai bine întreaga populație studiată.
- Eșantionarea aleatorie stratificată presupune împărțirea întregii populații în grupuri omogene numite strate.
- Eșantionarea aleatorie stratificată diferă de eșantionarea aleatorie simplă, care implică selecția aleatorie a datelor dintr-o întreagă populație, astfel încât fiecare eșantion posibil să apară la fel de probabil.
1:40
Eșantionare aleatorie stratificată
Cum funcționează eșantionarea aleatorie stratificată
La finalizarea analizei sau a cercetării asupra unui grup de entități cu caracteristici similare, un cercetător poate descoperi că dimensiunea populației este prea mare pentru a putea finaliza cercetarea. Pentru a economisi timp și bani, un analist poate adopta o abordare mai fezabilă, selectând un grup mic din populație. Grupul mic este denumit dimensiunea eșantionului, care este un subset al populației care este utilizat pentru a reprezenta întreaga populație. Un eșantion poate fi selectat dintr-o populație printr-un număr de moduri, dintre care unul este metoda de eșantionare aleatorie stratificată.
O eșantionare aleatorie stratificată presupune împărțirea întregii populații în grupuri omogene numite strate (plural pentru strat). Apoi sunt selectate probe aleatorii din fiecare strat. De exemplu, luați în considerare un cercetător academic care ar dori să cunoască numărul de studenți MBA în 2007 care au primit o ofertă de muncă în trei luni de la absolvire.
Cercetătorul va descoperi în curând că au fost aproape 200.000 de absolvenți de MBA pentru anul. Ei ar putea decide să ia doar un eșantion aleator simplu de 50.000 de absolvenți și să desfășoare un sondaj. Mai bine, ar putea împărți populația în straturi și ar putea lua un eșantion aleatoriu din straturi. Pentru a face acest lucru, ei ar crea grupuri de populație bazate pe sex, interval de vârstă, rasă, țara de naționalitate și cariera. Un eșantion aleatoriu din fiecare strat este luat într-un număr proporțional cu dimensiunea stratului în comparație cu populația. Aceste subseturi de straturi sunt apoi reunite pentru a forma un eșantion aleatoriu.
Eșantionarea stratificată este utilizată pentru a evidenția diferențele dintre grupurile dintr-o populație, spre deosebire de eșantionarea aleatorie simplă, care tratează toți membrii unei populații ca fiind egali, cu o probabilitate egală de a fi eșantionați.
Exemplu de eșantionare aleatorie stratificată
Să presupunem că o echipă de cercetare dorește să determine GPA al studenților din SUA. Echipa de cercetare are dificultăți în colectarea datelor de la toți cei 21 de milioane de studenți; decide să ia un eșantion aleatoriu din populație utilizând 4.000 de studenți.
Acum să presupunem că echipa se uită la diferitele atribute ale eșantionului de participanți și se întreabă dacă există diferențe între GPA și specializările studenților. Să presupunem că se constată că 560 de studenți sunt specializări în limba engleză, 1135 sunt specializări în științe, 800 sunt specializări în informatică, 1090 sunt specializări în inginerie și 415 sunt specializări în matematică. Echipa dorește să utilizeze un eșantion aleator stratificat proporțional în care stratul eșantionului este proporțional cu eșantionul aleator din populație.
Să presupunem că echipa cercetează datele demografice ale studenților din SUA și găsește procentul în care se studiază studenții: 12% specializare în engleză, 28% specialitate în știință, 24% specialitate în informatică, 21% specializare în inginerie și 15% specializare în matematică. Astfel, sunt create cinci straturi din procesul de eșantionare aleatorie stratificată.
Apoi, echipa trebuie să confirme că stratul populației este proporțional cu stratul din eșantion; cu toate acestea, constată că proporțiile nu sunt egale. Apoi, echipa trebuie să reeșantioneze 4.000 de studenți din populație și să selecteze aleatoriu 480 de studenți englezi, 1.120 de științe, 960 de studenți de informatică, 840 de inginerie și 600 de studenți la matematică.
Cu acestea, are un eșantion aleatoriu stratificat proporțional de studenți, care oferă o reprezentare mai bună a studenților cu studii superioare din SUA. Cercetătorii pot apoi evidenția un strat specific, pot observa diferitele studii ale studenților din SUA și pot observa diferitele medii ale notelor. .
Aleatoriu simplu versus eșantioane aleatoare stratificate
Eșantioanele aleatoare simple și eșantioanele aleatoare stratificate sunt ambele instrumente de măsurare statistică. Un eșantion aleator simplu este utilizat pentru a reprezenta întreaga populație de date. Un eșantion aleator stratificat împarte populația în grupuri mai mici, sau straturi, pe baza caracteristicilor comune.
Eșantionul aleator simplu este adesea folosit atunci când există foarte puține informații disponibile despre populația de date, când populația de date are mult prea multe diferențe pentru a fi împărțită în diferite subseturi sau când există o singură caracteristică distinctă în rândul populației de date.
De exemplu, o companie de bomboane poate dori să studieze obiceiurile de cumpărare ale clienților săi pentru a determina viitorul liniei sale de produse. Dacă există 10.000 de clienți, poate folosi alegerea a 100 dintre acești clienți ca eșantion aleatoriu. Apoi poate aplica ceea ce găsește de la cei 100 de clienți la restul bazei sale. Spre deosebire de stratificare, va eșantiona 100 de membri pur la întâmplare, fără a ține cont de caracteristicile lor individuale.
Stratificare proporțională și disproporționată
Eșantionarea aleatorie stratificată asigură că fiecare subgrup al unei anumite populații este reprezentat în mod adecvat în întreaga populație eșantion a unui studiu de cercetare. Stratificarea poate fi proporțională sau disproporționată. Într-o metodă stratificată proporțională, dimensiunea eșantionului fiecărui strat este proporțională cu dimensiunea populației stratului.
De exemplu, dacă cercetătorul a dorit un eșantion de 50.000 de absolvenți folosind intervalul de vârstă, eșantionul aleator stratificat proporțional va fi obținut folosind această formulă: (mărimea eșantionului/mărimea populației) x dimensiunea stratului. Tabelul de mai jos presupune o dimensiune a populației de 180.000 de absolvenți de MBA pe an.
Grupă de vârstă |
24-28 |
29-33 |
34-37 |
Total |
Numărul de persoane din strat |
90.000 |
60.000 |
30.000 |
180.000 |
Dimensiunea eșantionului straturilor |
25.000 |
16.667 |
8.333 |
50.000 |
Mărimea eșantionului de strat pentru absolvenții de MBA în intervalul de vârstă 24-28 de ani este calculată ca (50.000/180.000) x 90.000 = 25.000. Aceeași metodă este utilizată pentru celelalte grupe de vârstă. Acum că dimensiunea eșantionului straturilor este cunoscută, cercetătorul poate efectua o eșantionare aleatorie simplă în fiecare strat pentru a-și selecta participanții la sondaj. Cu alte cuvinte, 25.000 de absolvenți din grupa de vârstă 24-28 de ani vor fi selectați aleatoriu din întreaga populație, 16.667 de absolvenți din grupa de vârstă 29-33 de ani vor fi selectați aleatoriu din populație și așa mai departe.
Într-un eșantion stratificat disproporționat, dimensiunea fiecărui strat nu este proporțională cu dimensiunea sa în populație. Cercetătorul poate decide să eșantioneze 1/2 dintre absolvenții din grupa de vârstă 34-37 de ani și 1/3 dintre absolvenții din grupa de vârstă 29-33 de ani.
Este important de reținut că o persoană nu se poate încadra în mai multe straturi. Fiecare entitate trebuie să se încadreze doar într-un singur strat. A avea subgrupuri suprapuse înseamnă că unii indivizi vor avea șanse mai mari de a fi selectați pentru sondaj, ceea ce neagă complet conceptul de eșantionare stratificată ca tip de eșantionare probabilă.
Administratorii de portofoliu pot utiliza eșantionarea aleatorie stratificată pentru a crea portofolii prin replicarea unui indice, cum ar fi un indice de obligațiuni.
Avantajele eșantionării aleatorii stratificate
Principalul avantaj al eșantionării aleatorii stratificate este că surprinde caracteristicile cheie ale populației din eșantion. Similar cu o medie ponderată, această metodă de eșantionare produce caracteristici în eșantion care sunt proporționale cu populația totală. Eșantionarea aleatorie stratificată funcționează bine pentru populații cu o varietate de atribute, dar este ineficientă dacă nu se pot forma subgrupuri.
Stratificarea oferă o eroare mai mică în estimare și o precizie mai mare decât metoda simplă de eșantionare aleatorie. Cu cât diferențele dintre straturi sunt mai mari, cu atât câștigul de precizie este mai mare.
Dezavantajele eșantionării aleatorii stratificate
Din păcate, această metodă de cercetare nu poate fi folosită în fiecare studiu. Dezavantajul metodei este că trebuie îndeplinite mai multe condiții pentru ca aceasta să fie utilizată corect. Cercetătorii trebuie să identifice fiecare membru al unei populații studiate și să clasifice fiecare dintre ei într-o singură subpopulație. Ca rezultat, eșantionarea aleatorie stratificată este dezavantajoasă atunci când cercetătorii nu pot clasifica cu încredere fiecare membru al populației într-un subgrup. De asemenea, găsirea unei liste exhaustive și definitive a unei întregi populații poate fi o provocare.
Suprapunerea poate fi o problemă dacă există subiecți care se încadrează în mai multe subgrupe. Atunci când se efectuează o eșantionare aleatorie simplă, cei care se află în mai multe subgrupuri sunt mai probabil să fie aleși. Rezultatul ar putea fi o denaturare sau o reflectare inexactă a populației.
Exemplele de mai sus ușurează: studenții, absolvenții, bărbații și femeile sunt grupuri clar definite. În alte situații, totuși, ar putea fi mult mai dificil. Imaginați-vă că includeți caracteristici precum rasa, etnia sau religia. Procesul de sortare devine mai dificil, făcând eșantionarea aleatorie stratificată o metodă ineficientă și mai puțin decât ideală.