Errore di tipo I e di tipo II
Vi ricorderete che l’errore di tipo II è la probabilità di accettare l’ipotesi nulla (o in altre parole “non riuscire a rifiutare l’ipotesi nulla”) quando in realtà avremmo dovuto rifiutarla. Questa probabilità è indicata dalla lettera β. Al contrario, rifiutare l’ipotesi nulla quando non avremmo dovuto farlo è un errore di tipo I ed è indicato con α. In questo video, vedrete in modo pittorico dove sono questi valori su un disegno delle due distribuzioni di H0 vera e HAlt vera.
- Errore di tipo I (α): rifiutiamo erroneamente H0 anche se l’ipotesi nulla è vera.
- Errore di tipo II (β): accettiamo erroneamente (o “non rifiutiamo”) H0 anche se l’ipotesi alternativa è vera.
Un errore mnemonico
Ipotesi alternativa (Ha): c’è un lupo
Ipotesi nulla (H0): non c’è nessun lupo
- Errore di tipo I (α): rifiutiamo erroneamente l’ipotesi nulla, che non c’è un lupo (cioè, crediamo che ci sia un lupo), anche se l’ipotesi nulla è vera (non c’è nessun lupo).
- Errore di tipo II (β): accettiamo erroneamente (o “non rifiutiamo”) l’ipotesi nulla (non c’è nessun lupo) anche se l’ipotesi alternativa è vera (c’è un lupo).
Potenza statistica
La potenza di un test è la probabilità che il test rifiuti l’ipotesi nulla quando l’ipotesi alternativa è vera. In altre parole, la probabilità di non commettere un errore di tipo II. In altre parole, qual è la potenza del nostro test per determinare una differenza tra due popolazioni (H0 e HA) se tale differenza esiste?
- Potenza (1-β): la probabilità di rifiutare correttamente l’ipotesi nulla (quando l’ipotesi nulla non è vera).
- Errore di tipo II (β): la probabilità di non scartare l’ipotesi nulla (quando l’ipotesi nulla non è vera).
Ci sono quattro componenti interrelate della potenza:
- B: beta (β), poiché la potenza è 1-β
- E: effect size, la differenza tra le medie delle distribuzioni di campionamento di H0 e HAlt. Maggiore è la differenza tra queste due medie, più potenza avrà il vostro test per rilevare una differenza. Questo è matematicamente scritto come una differenza normalizzata (d) tra le medie delle due popolazioni. d = (μ1-μ0)/σ.
- A: alfa (α), il valore di significatività che è tipicamente fissato a 0,05, questo è il limite al quale accettiamo o rifiutiamo la nostra ipotesi nulla. Rendere α più piccolo (α = 0,1) rende più difficile rifiutare l’H0. Questo rende la potenza più piccola.
- N: dimensione del campione (n). Più grande è la popolazione, più piccolo diventa l’errore standard (SE = σ/√n). Fondamentalmente rende la distribuzione del campione più stretta e quindi rende β più piccolo.
È davvero utile vedere questi grafici nel video. Prova a disegnare esempi di come cambiare ogni componente cambia la potenza fino a quando non lo capisci e sentiti libero di fare domande (nei commenti o via email).
Significatività clinica contro statistica
La significatività clinica è diversa dalla significatività statistica. Una differenza tra mezzi, o un effetto di trattamento, può essere statisticamente significativa ma non clinicamente significativa. Per esempio, se la dimensione del campione è abbastanza grande, differenze molto piccole possono essere statisticamente significative (ad esempio, un cambiamento di mezzo chilo nel peso, 1 mmHg di pressione sanguigna) anche se non avranno alcun impatto reale sui risultati del paziente. Quindi è importante prestare attenzione alla significatività clinica così come alla significatività statistica quando si valutano i risultati dello studio. La significatività clinica è determinata usando il giudizio clinico così come i risultati di altri studi che dimostrano l’impatto clinico a valle dei risultati dello studio a breve termine.
Testate la vostra comprensione
Con questo problema impostato sulla potenza.