先日、1960年代の古いバイク映画を見たのですが、バイカーたちのスラングに衝撃を受けました。 彼らには独自の言語がありました。 ちょうど統計学者のように、その話し方は、データ分析の専門用語に精通していない人をしばしば困惑させます。 Nulls Angels と呼んでください。 そのカラーで田舎を走り回り、データを分析し、道で出会う人々に「帰無仮説を棄却できないか」と尋ねる姿を想像してみてください。
そのフレーズがいかに奇妙に聞こえるかを指摘すると、Nulls Angelsはあなたがクールではない…そして統計についてあまり理解していないことを知るでしょう。 “Failing to reject “は、acceptと同等に複雑すぎるように思います。
しかし、Nulls Angels の荒削りな統計学者がそのように話すには、それなりの理由があることが判明しました。 統計学の観点からは、それは紛れもなく正確であり、「棄却できない」を「受け入れる」に置き換えることは、単に間違っているのです。
そもそも帰無仮説とは何でしょうか。 (これらの検定はすべて、Minitab 統計ソフトウェアの Stat メニューで利用可能です。 または、もう少し統計的なガイダンスが必要な場合は、アシスタントが一般的な仮説検定について順を追って説明します)
仮説検定では、帰無仮説 (略して H0) と対立仮説 (H1) という 2 つの命題を検討します。 対立仮説は、私たちが支持することを望むものです。 データがそうでないという十分な証拠を提供しない限り、帰無仮説が真であると推定します。
“Innocent until proven guilty” という言葉を聞いたことがあると思います。 それは、有罪が証明されるまでは、被告の無実を当然とすることを意味します。 統計学では、帰無仮説は対立仮説が真であると証明されるまで当然とされます。
では、なぜ我々は帰無仮説を「棄却できない」のでしょうか。 信頼水準は 1 からタイプ I エラーを犯すリスクを引いたもので、これは、真である帰無仮説を誤って棄却したときに起こります。 統計学者はこのリスクをアルファと呼び、また有意水準とも呼ぶ。 一般的なアルファ値0.05は信頼度95%に相当し、帰無仮説が真であっても棄却される確率が5%であることを認めている。 生死にかかわる問題では、タイプIエラーのリスクを1%以下に引き下げることもある。
選んだアルファ レベルに関係なく、どの仮説検定も 2 つの可能な結果しかない。
- 帰無仮説を棄却し、95% 信頼水準(または選択した任意の水準)で対立仮説が真であると結論づける。)
- 帰無仮説を棄却せず、95%信頼水準で帰無仮説が偽であることを示唆する十分な証拠がないと結論づける。
データが帰無仮説をサポートしているかどうかを判断するために、しばしば p 値を使用します。 検定の p 値が我々の選択したアルファ値より小さい場合、我々は帰無仮説を棄却する。 または、統計学者が言うように、「p 値が低い場合、帰無仮説を棄却しなければならない」
これでは、統計学者が「帰無仮説を受け入れる」ことができない理由をまだ説明していません。 ここが肝心なところですが、帰無仮説を棄却できなかったからといって、帰無仮説が真であることを証明できるわけではありません。 それは、仮説検定では、どの仮説が真であるか、あるいは、どちらが最も可能性が高いかを決定しないためです。
“Null Until Proved Alternative”
“innocent until proven guilty” に戻ります。 データ分析者として、あなたは裁判官です。 仮説検証は裁判であり、帰無仮説は被告である。 対立仮説は検察側で、合理的な疑いを超えて (たとえば、95% の確実さで) 訴える必要があります。
裁判の証拠が被告が有罪であることを示していない場合、被告が無罪であることを証明したわけでもありません。 しかし、利用可能な証拠に基づいて、その可能性を否定することはできない。
「無罪」
このフレーズは完璧です:「無罪」は被告が無実であるとは言っていません、それは証明されていませんから。 無罪の仮定を放棄するよう、検察が裁判官を説得できなかったというだけだ。
つまり「帰無値を棄却できなかった」というのは、統計的には「無罪」に相当するのだ。 裁判では、立証責任は検察側にある。 データ解析の場合、立証責任は全てサンプルデータにある。 「無罪」は「無実」を意味しませんし、帰無仮説を「棄却できない」ことと「受け入れる」ことは全く別物です。
Nulls Angelsのレザーを着た猛獣のような統計学者たちが尋ねてきたら、彼らの機嫌を取り、「帰無仮説を棄却できない」ことが「帰無仮説を受け入れる」ことではないことを知っていることを示しましょう。