Ce este valoarea P?
În statistică, valoarea p este probabilitatea de a obține rezultate cel puțin la fel de extreme ca rezultatele observate la un test de ipoteză statistică, presupunând că ipoteza nulă este corectă. Valoarea p servește ca alternativă la punctele de respingere pentru a oferi cel mai mic nivel de semnificație la care ipoteza nulă ar fi respinsă. O valoare p mai mică înseamnă că există dovezi mai puternice în favoarea ipotezei alternative.
Valoarea P este adesea folosită pentru a promova credibilitatea pentru studii sau rapoarte ale agențiilor guvernamentale. De exemplu, Biroul de recensământ al Statelor Unite prevede că orice analiză cu o valoare p mai mare de 0,10 trebuie să fie însoțită de o declarație conform căreia diferența nu este diferită statistic de zero. Biroul de recensământ are, de asemenea, standarde care stipulează valorile p acceptabile pentru diverse publicații.
Recomandări cheie
- O valoare p este o măsurătoare statistică utilizată pentru a valida o ipoteză în raport cu datele observate.
- O valoare p măsoară probabilitatea de a obține rezultatele observate, presupunând că ipoteza nulă este adevărată.
- Cu cât valoarea p este mai mică, cu atât semnificația statistică a diferenței observate este mai mare.
- O valoare p de 0,05 sau mai mică este, în general, considerată semnificativă din punct de vedere statistic.
- Valoarea P poate servi ca alternativă la sau în plus față de nivelurile de încredere preselectate pentru testarea ipotezelor.
1:53
Faceți clic pe Play pentru a afla cum este calculată valoarea P
Cum se calculează valoarea P?
Valorile P se găsesc de obicei folosind tabele cu valori p sau foi de calcul/software statistic. Aceste calcule se bazează pe distribuția de probabilitate presupusă sau cunoscută a statisticii specifice testate. Valorile p sunt calculate din abaterea dintre valoarea observată și o valoare de referință aleasă, având în vedere distribuția de probabilitate a statisticii, cu o diferență mai mare între cele două valori corespunzătoare unei valori p mai mici.
Din punct de vedere matematic, valoarea p este calculată folosind calcul integral din aria de sub curba de distribuție a probabilității pentru toate valorile statisticilor care sunt cel puțin la fel de departe de valoarea de referință pe cât este valoarea observată, în raport cu aria totală de sub curba de distribuție a probabilității. . Calculul pentru o valoare p variază în funcție de tipul de test efectuat. Cele trei tipuri de teste descriu locația pe curba de distribuție a probabilității: testul cu coada inferioară, testul cu coada superioară sau testul cu două fețe.
Pe scurt, cu cât diferența dintre două valori observate este mai mare, cu atât este mai puțin probabil ca diferența să se datoreze unei simple întâmplări aleatorii, iar acest lucru este reflectat de o valoare p mai mică.
Abordarea cu valoarea P a testării ipotezelor
Abordarea cu valoarea p a testării ipotezelor folosește probabilitatea calculată pentru a determina dacă există dovezi care să respingă ipoteza nulă. Ipoteza nulă, cunoscută și sub numele de „conjectura”, este afirmația inițială despre o populație (sau un proces de generare a datelor). Ipoteza alternativă afirmă dacă parametrul populației diferă de valoarea parametrului populației menționat în conjectură.
În practică, nivelul de semnificație este declarat în prealabil pentru a determina cât de mică trebuie să fie valoarea p pentru a respinge ipoteza nulă. Deoarece diferiți cercetători folosesc niveluri diferite de semnificație atunci când examinează o întrebare, un cititor poate avea uneori dificultăți în compararea rezultatelor a două teste diferite. Valorile P oferă o soluție la această problemă.
De exemplu, să presupunem că un studiu care compară randamentele de la două active particulare a fost întreprins de diferiți cercetători care au folosit aceleași date, dar niveluri de semnificație diferite. Cercetătorii ar putea ajunge la concluzii opuse în ceea ce privește dacă activele diferă. Dacă un cercetător a folosit un nivel de încredere de 90%, iar celălalt a necesitat un nivel de încredere de 95% pentru a respinge ipoteza nulă, iar valoarea p a diferenței observate între cele două randamente a fost de 0,08 (corespunzând unui nivel de încredere de 92%) , atunci primul cercetător ar descoperi că cele două active au o diferență care este semnificativă statistic, în timp ce al doilea nu ar găsi nicio diferență semnificativă statistic între randamente.
Pentru a evita această problemă, cercetătorii ar putea raporta valoarea p a testului de ipoteză și ar putea permite cititorilor să interpreteze ei înșiși semnificația statistică. Aceasta se numește abordare cu valoarea p a testării ipotezelor. Observatorii independenți ar putea nota valoarea p și ar putea decide singuri dacă aceasta reprezintă o diferență semnificativă statistic sau nu.
Exemplu de valoare P
Un investitor susține că performanța portofoliului lor de investiții este echivalentă cu cea a indicelui Standard & Poor’s (S&P) 500. Pentru a determina acest lucru, investitorul efectuează un test cu două cozi. Ipoteza nulă afirmă că randamentele portofoliului sunt echivalente cu randamentele S&P 500 pe o perioadă specificată, în timp ce ipoteza alternativă afirmă că randamentele portofoliului și randamentele S&P 500 nu sunt echivalente — dacă investitorul a efectuat un test unilateral, alternativa ipoteza ar afirma că randamentele portofoliului sunt fie mai mici, fie mai mari decât randamentele S&P 500.
Testul ipotezei valorii p nu folosește neapărat un nivel de încredere preselectat la care investitorul ar trebui să resetați ipoteza nulă conform căreia randamentele sunt echivalente. În schimb, oferă o măsură a câte dovezi există pentru a respinge ipoteza nulă. Cu cât valoarea p este mai mică, cu atât este mai mare dovezile împotriva ipotezei nule. Astfel, dacă investitorul constată că valoarea p este 0,001, există dovezi puternice împotriva ipotezei nule, iar investitorul poate concluziona cu încredere că randamentele portofoliului și randamentele S&P 500 nu sunt echivalente.
Deși acest lucru nu oferă un prag exact cu privire la momentul în care investitorul ar trebui să accepte sau să respingă ipoteza nulă, are un alt avantaj foarte practic. Testarea ipotezei valorii P oferă o modalitate directă de a compara încrederea relativă pe care o poate avea investitorul atunci când alege dintre mai multe tipuri diferite de investiții sau portofolii în raport cu un indicator de referință, cum ar fi S&P 500.
De exemplu, pentru două portofolii, A și B, a căror performanță diferă de S&P 500 cu valori p de 0,10 și, respectiv, 0,01, investitorul poate fi mult mai încrezător că portofoliul B, cu o valoare p mai mică, va arăta de fapt. rezultate constant diferite.
Este semnificativă o valoare P de 0,05?
O valoare p mai mică de 0,05 este de obicei considerată a fi semnificativă statistic, caz în care ipoteza nulă ar trebui respinsă. O valoare p mai mare de 0,05 înseamnă că abaterea de la ipoteza nulă nu este semnificativă statistic, iar ipoteza nulă nu este respinsă.
Ce înseamnă o valoare P de 0,001?
O valoare p de 0,001 indică faptul că, dacă ipoteza nulă testată ar fi într-adevăr adevărată, ar exista o șansă din 1.000 de a observa rezultate cel puțin la fel de extreme. Acest lucru îl determină pe observator să respingă ipoteza nulă deoarece fie a fost observat un rezultat de date foarte rar, fie ipoteza nulă este incorectă.
Cum puteți utiliza valoarea P pentru a compara două rezultate diferite ale unui test de ipoteză?
Dacă aveți două rezultate diferite, unul cu o valoare p de 0,04 și unul cu o valoare p de 0,06, 0,04 va fi considerat semnificativ statistic, în timp ce 0,06 nu. Dincolo de acest exemplu simplificat, puteți compara o valoare p de 0,04 cu o valoare p de 0,001. Ambele sunt semnificative statistic, dar 0,001 oferă un caz și mai puternic împotriva ipotezei nule decât 0,04.
Corecție – 2 aprilie 2022: O versiune anterioară a descris în mod incorect valoarea p ca fiind probabilitatea rezultatelor care apar prin întâmplare aleatorie.