Why Shrewd Experts „Fail to Reject the Null” Every Time

Aseară m-am uitat la un film vechi despre motociclete din anii ’60 și am fost impresionat de argoul motocicliștilor. Aveau o limbă proprie. La fel ca și statisticienii, a căror manieră de a vorbi îi derutează adesea pe cei care nu sunt familiarizați cu jargonul analizei de date.

Mi-a dat de gândit…dacă ar exista o bandă de motocicliști numai statisticieni? Să-i numim Nulls Angels. Imaginați-vă-i în culorile lor, străbătând zona rurală, analizând date și întrebându-i pe oamenii pe care îi întâlnesc pe drum dacă „nu reușesc să respingă ipoteza nulă.”

Dacă subliniezi cât de ciudat sună această frază, Îngerii Nulls vor ști că nu ești cool… și că nu ești foarte conștient de statistică.

Vorbind doar ca editor, recunosc că „nu reușesc să respingă ipoteza nulă” este demn de scârbă. „Eșecul de a respinge” mi se pare un echivalent prea complicat de acceptat. Cel puțin, este o formulare greoaie.

Dar se pare că acei statisticieni rudimentari din Nulls Angels au motive întemeiate să vorbească așa. Dintr-o perspectivă statistică, este incontestabil de precisă – și înlocuirea „eșecului de a respinge” cu „a accepta” ar fi pur și simplu greșită.

Ce este ipoteza nulă, oricum?

Testele de ipoteză includ testele t cu una și două eșantioane, teste de asociere, teste de normalitate și multe altele. (Toate aceste teste sunt disponibile în meniul Stat din software-ul statistic Minitab. Sau, dacă doriți un pic mai multă îndrumare statistică, asistentul vă poate ghida pas cu pas prin testele de ipoteză comune.)

Un test de ipoteză examinează două propoziții: ipoteza nulă (sau pe scurt H0) și alternativa (H1). Ipoteza alternativă este cea pe care sperăm să o susținem. Presupunem că ipoteza nulă este adevărată, cu excepția cazului în care datele oferă suficiente dovezi că nu este așa.

Ați auzit expresia „Nevinovat până la proba contrarie”. Aceasta înseamnă că nevinovăția acuzatului este considerată ca fiind de la sine înțeleasă până când vinovăția este dovedită. În statistică, ipoteza nulă este considerată ca fiind de la sine înțeleasă până când se dovedește că alternativa este adevărată.

Atunci, de ce „nu reușim să respingem” ipoteza nulă?

Aceasta aduce în discuție problema „dovezii.”

Gradul de dovezi statistice de care avem nevoie pentru a „dovedi” ipoteza alternativă este nivelul de încredere. Nivelul de încredere este 1 minus riscul nostru de a comite o eroare de tip I, care apare atunci când respingem în mod incorect o ipoteză nulă care este adevărată. Statisticienii numesc acest risc alfa și se referă, de asemenea, la el ca la nivelul de semnificație. Alfa tipic de 0,05 corespunde unui nivel de încredere de 95%: acceptăm o șansă de 5% de a respinge ipoteza nulă chiar dacă aceasta este adevărată. (În probleme de viață sau de moarte, am putea reduce riscul unei erori de tip I la 1% sau mai puțin.)

Indiferent de nivelul alfa pe care îl alegem, orice test de ipoteză are doar două rezultate posibile:

  1. Respingeți ipoteza nulă și concluzionați că ipoteza alternativă este adevărată la un nivel de încredere de 95% (sau la orice nivel pe care l-ați selectat).
  2. Nu respingeți ipoteza nulă și concluzionați că nu sunt disponibile suficiente dovezi pentru a sugera că ipoteza nulă este falsă la un nivel de încredere de 95%.

Utilizăm adesea o valoare p pentru a decide dacă datele susțin sau nu ipoteza nulă. Dacă valoarea p a testului este mai mică decât nivelul alfa selectat de noi, respingem ipoteza nulă. Sau, așa cum spun statisticienii: „Când valoarea p este mică, nulul trebuie să dispară.”

Acest lucru tot nu explică de ce un statistician nu va „accepta ipoteza nulă”. Iată care este concluzia: faptul că nu se respinge ipoteza nulă nu dovedește că ipoteza nulă este adevărată. Acest lucru se datorează faptului că un test de ipoteză nu determină care ipoteză este adevărată, sau chiar care este cea mai probabilă: acesta evaluează doar dacă există dovezi pentru a respinge ipoteza nulă.

„Null Until Proved Alternative”

Revenim la „nevinovat până la proba contrarie”. În calitate de analist de date, dumneavoastră sunteți judecătorul. Testul de ipoteză este procesul, iar ipoteza nulă este acuzatul. Ipoteza alternativă este acuzarea, care trebuie să își demonstreze cazul dincolo de orice îndoială rezonabilă (să zicem, cu o certitudine de 95%).

Dacă dovezile din proces nu arată că acuzatul este vinovat, nici nu s-a dovedit că acesta este nevinovat. Cu toate acestea, pe baza probelor disponibile, nu puteți respinge această posibilitate. Așadar, cum v-ați anunța verdictul?

„Nevinovat.”

Această frază este perfectă: „Nevinovat „nu spune că acuzatul este nevinovat, pentru că acest lucru nu a fost dovedit. Spune doar că acuzarea nu a putut convinge judecătorul să renunțe la presupunerea de nevinovăție.

Așa că „eșecul de a respinge nulul” este echivalentul statistic al lui „nevinovat”. Într-un proces, sarcina probei cade în sarcina acuzării. Atunci când analizați date, întreaga sarcină a probei revine eșantionului de date. „Nevinovat” nu înseamnă „nevinovat”, iar „a nu respinge” ipoteza nulă este foarte diferit de „a o accepta”.

Așa că, dacă un grup de statisticieni mardeiași în piele de Nulls Angels vă întreabă vreodată, păstrați-vă în grațiile lor și arătați că știți că „a nu respinge ipoteza nulă” nu înseamnă „a accepta ipoteza nulă.”

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.