¿De dónde viene la p?

Deja un comentario / Historias / Por mario.gil.conesa

En estadística, el valor «p», o valor de probabilidad, es un número que describe la probabilidad de que los datos se hayan producido bajo la hipótesis nula de la prueba estadística. En otras palabras, la «p» indica la probabilidad de que se observen datos como los que se han encontrado -o más raros-.

Un ejemplo gráfico que nos puede ayudar a clarificar esto es el de la escena de un crimen.

Supongamos que te encuentra la policia cerca de la escena de un crimen, y la hipótesis nula (o punto de partida) es que eres inocente. En este caso, la p sería de 1 (es decir, un 100% de probabilidad de que seas inocente).

Si aparece un zapato en la escena del crimen, y resulta que es de tu talla, esa p bajaría a un 0,9 (90% de probabilidad). Si poco después aparece un objeto que te pertenece en la escena, la p bajaría a un 0,6 (60%), y si un vecino te vio salir poco después del momento del crimen de la escena, la p será de 0,3. Cuando por fin, encuentran un cuchillo con sangre de la víctima en tu bolsillo, la p acaba cayendo a un 0,05 (es decir, un 5% de probabilidad de inocencia), que es el punto de corte en el que rechazamos la hipótesis nula: consideremos que es muy improbable que seas inocente, y concluimos que no eres inocente. Pero ojo, es un puro tema de probabilidad, nadie está seguro que de hayas sido tú, a lo mejor te han tendido una trampa.

En investigación, se ha extendido un miedo generalizado a la p mayor de 0,05, pero para saber por qué no temer esta cifra debemos entender por qué este punto de corte.

En el comienzo del siglo XVIII, Laplace y J.Arbuthnot fijaron la hipótesis nula de que debían nacer tantos hombres como mujeres (50/50), pero los datos de natalidad en Londres mostraron que la ley del 50/50 era falsa. Para ello usaron por primera vez el estadístico p, o la probabilidad de hallar los datos observados partiendo de una hipótesis nula.

Pearson introdujo el concepto de p en la estadística a principios del siglo XX. Pero fue Ronald Fisher quien en 1925 escribió que un 0,05 era un buen corte, porque “1 entre 20 es suficientemente improbable“. Desde entonces es la obsesión de todos los investigadores, aunque no hay que olvidar que es una mera convención: la opinión de Fisher.

Lo realmente importante es la magnitud del efecto y la relevancia de la diferencia observada:

Cuando una prueba se realiza en muchos sujetos, la distribución muestral tendrá poca variabilidad y -por tanto- diferencias de pequeña magnitud tendrán valores p muy significativos (aunque el efecto no sea importante).
Cuando se realiza una prueba en pocos sujetos puede no detectar efectos importantes por la gran variabilidad del muestreo

Incluir Riesgos Relativos, Intervalos de confianza y defender la importancia de las diferencias es más importante que tener una p< de 0,05.

Deja un comentario Cancelar respuesta