Por qué los expertos astutos «no rechazan lo nulo» siempre

La otra noche vi una vieja película de motociclistas de los años 60 y me llamó la atención la jerga de los moteros. Tenían un lenguaje propio. Al igual que los estadísticos, cuya forma de hablar a menudo confunde a los que no están familiarizados con la jerga del análisis de datos.

Eso me hizo pensar… ¿y si hubiera una banda de moteros formada exclusivamente por estadísticos? Llámalos los Nulls Angels. Imagínatelos con sus colores, recorriendo el campo, analizando datos y preguntando a la gente que encuentran en la carretera si «no rechazan la hipótesis nula».

Si señalas lo extraña que suena esa frase, los Ángeles Nulos sabrán que no eres guay… y que no estás muy al tanto de la estadística.

Hablando puramente como editor, reconozco que «no rechazar la hipótesis nula» es digno de risa. «No rechazar» parece un equivalente demasiado complicado de aceptar. Como mínimo, es una redacción torpe.

Pero resulta que esos rudos estadísticos de los Ángeles Nulos tienen buenas razones para hablar así. Desde un punto de vista estadístico, es innegablemente preciso, y sustituir «no rechazar» por «aceptar» sería un error.

¿Qué es la hipótesis nula, de todos modos?

Las pruebas de hipótesis incluyen pruebas t de una y dos muestras, pruebas de asociación, pruebas de normalidad y muchas más. (Todas estas pruebas están disponibles en el menú Stat del software estadístico Minitab. O, si desea un poco más de orientación estadística, el Asistente puede guiarlo a través de las pruebas de hipótesis comunes paso a paso.)

Una prueba de hipótesis examina dos proposiciones: la hipótesis nula (o H0 para abreviar), y la alternativa (H1). La hipótesis alternativa es lo que esperamos apoyar. Suponemos que la hipótesis nula es verdadera, a menos que los datos proporcionen pruebas suficientes de que no lo es.

Has oído la frase «Inocente hasta que se demuestre lo contrario». Eso significa que se da por sentada la inocencia del acusado hasta que se demuestre su culpabilidad. En estadística, la hipótesis nula se da por sentada hasta que se demuestre que la alternativa es cierta.

Entonces, ¿por qué «no rechazamos» la hipótesis nula?

Eso nos lleva a la cuestión de la «prueba».

El grado de evidencia estadística que necesitamos para «probar» la hipótesis alternativa es el nivel de confianza. El nivel de confianza es 1 menos nuestro riesgo de cometer un error de tipo I, que ocurre cuando se rechaza incorrectamente una hipótesis nula que es verdadera. Los estadísticos llaman a este riesgo alfa, y también se refieren a él como nivel de significación. El alfa típico de 0,05 corresponde a un nivel de confianza del 95%: estamos aceptando una probabilidad del 5% de rechazar la nula incluso si es verdadera. (En asuntos de vida o muerte, podríamos reducir el riesgo de un error de tipo I al 1% o menos.)

Independientemente del nivel alfa que elijamos, cualquier prueba de hipótesis sólo tiene dos resultados posibles:

  1. Rechazar la hipótesis nula y concluir que la hipótesis alternativa es verdadera con un nivel de confianza del 95% (o el nivel que haya seleccionado).
  2. No rechazar la hipótesis nula y concluir que no se dispone de suficientes pruebas para sugerir que la nula es falsa al nivel de confianza del 95%.

A menudo utilizamos un valor p para decidir si los datos apoyan la hipótesis nula o no. Si el valor p de la prueba es inferior a nuestro nivel alfa seleccionado, rechazamos la nula. O, como dicen los estadísticos: «Cuando el valor p es bajo, la nula debe desaparecer».

Esto sigue sin explicar por qué un estadístico no «acepta la hipótesis nula». Aquí está la línea de fondo: no rechazar la hipótesis nula no demuestra que la hipótesis nula es verdadera. Eso es porque una prueba de hipótesis no determina qué hipótesis es verdadera, o incluso cuál es la más probable: sólo evalúa si existen pruebas para rechazar la hipótesis nula.

«Nula hasta que se demuestre la alternativa»

Recuerde lo de «inocente hasta que se demuestre lo contrario». Como analista de datos, usted es el juez. La prueba de la hipótesis es el juicio, y la hipótesis nula es el acusado. La hipótesis alternativa es la acusación, que tiene que presentar su caso más allá de una duda razonable (digamos, con un 95% de certeza).

Si las pruebas del juicio no demuestran que el acusado es culpable, tampoco han demostrado que sea inocente. Sin embargo, basándote en las pruebas disponibles, no puedes rechazar esa posibilidad. Entonces, ¿cómo anunciarías tu veredicto?

«Inocente».

Esa frase es perfecta: «Inocente» no dice que el acusado sea inocente, porque eso no se ha probado. Sólo dice que la fiscalía no pudo convencer al juez de abandonar la suposición de inocencia.

Así que «no rechazar el nulo» es el equivalente estadístico de «no culpable». En un juicio, la carga de la prueba recae en la acusación. Cuando se analizan datos, toda la carga de la prueba recae sobre los datos de su muestra. «Inocente» no significa «inocente», y «no rechazar» la hipótesis nula es muy distinto a «aceptarla».

Así que si un grupo de estadísticos merodeadores en sus cueros de Nulls Angels alguna vez le pregunta, manténgase en su gracia, y demuestre que sabe que «no rechazar la nula» no es «aceptar la nula».

Deja una respuesta

Tu dirección de correo electrónico no será publicada.