La regresión a la mediocridad


Es matemáticamente inevitable si usted es muy inteligente que su pareja sea menos inteligente que usted (D. Kahneman)

numeros

Sir Francis Galton era -según cuenta la wiki- un polímata, uno de esos tipos renacentistas que sabían un poco de todo y que ha pasado a la historia de la ciencia por dos cuestiones fundamentales: primero por su conceptualización de un misterio matemático:  la regresión la media para lo que necesitó del mejor estadístico de su época, Karl Pearson y la otra una palabra de infame recuerdo para nosotros los europeos, la eugenesia, que tanto relacionamos con las aniquilaciones étnicas que llevó a cabo del III Reich.

Lo cierto es que el fenómeno de la regresión a la media es inevitable matemáticamente y aun así es algo desconocido para una mente convencional, tan enamorados estamos del pensamiento causal que apenas nos hemos fortalecido en eso que ha venido en llamarse pensamiento bayesiano o estadístico, simplemente vivimos ajenos a ello, somos hombres anuméricos, y es por eso que fenómenos tan comunes como la regresión a la media nos parecen fenomenos misteriosos.

Y sin embargo son tan domesticos como este ejemplo: la altura de los padres correlaciona con la estatura de los hijos, pero la estatura de los hijos tiende a la media, es decir si usted tiene unos padres muy altos es casi seguro que usted sea más bajito que ellos. Es mejor decir que existe una correlación entre su altura y la media de ambos padres. Oros ejemplos son las relaciones entre la estatura y el peso o la estatura y el numero (la talla) de zapatos.

En realidad la correlación es el fenómeno oculto de la regresión a la media (que Galton llamaba mediocridad), la otra cara del mismo fenómeno y es aplicable -según el coeficiente de Pearson- en relación a dos variables cuantitativas. Si una variable aumenta cuando la otra aumenta entonces decimos que existe correlación entre ellas u es por eso que su talla y su numero de teléfono no correlacionan en absoluto.

Una correlación que se mide entre 0 y 1. Así decimos que si determinado rasgo tiene una heredabilidad de .5 queremos decir que el 50% de los descendientes tendrá ese rasgo, uno de esos rasgos es por ejemplo la inteligencia.

Lo interesante de las correlaciones es que por sí mismas no implican causalidad, no dicen nada del por qué de las cosas, solo nos señalan insistentemente de existen relaciones entre unas cosas y otras. De manera que en medicina medir estas correlaciones y saber distinguirlas de los relatos causales es muy importante.

Sugiero al lector que lea estas dos correlaciones:

1.- La anorexia mental es más frecuente en las sociedades donde existen altos indices de divorcio. O

2.- La anorexia mental es más frecuente en las sociedades de bajos indices de natalidad.

Las dos afirmaciones son verdaderas y sin embargo no significan linealmente que el divorcio o los bajos índices de natalidad causen la anorexia mental.

Y sin embargo estamos tentados a construir un relato narrativo sobre ello. Cualquiera de ustedes que haya leido las dos afirmaciones (verdaderas) anteriores estará decidido a construir una hipótesis que para usted probablemente será ya una creencia.

Lo más probable es que usted se equivoque si ya ha construido una hipótesis explicativa sobre la epidemiología de la anorexia mental. Y es probable porque el divorcio y baja natalidad compartan algo con la causa principal o bien que compartan algo con otras variables igualmente correlacionadas.

Otras variables relacionadas podrían ser, los anticonceptivos, la urbanicidad, la libertad sexual,  la opulencia alimentaria o las diferencias sexuales.

Es casi seguro que algunas de esas variables que he nombrado tengan algo que ver en la causa de la anorexia mental tal y como conté en este post.

La importancia de la regresión a la media en entornos educativos y médicos.-

La regresión a la media se da en todas las circunstancias donde se dan medidas extremas y tiene consecuencias predictivas de mucho interés, por ejemplo en los rendimientos escolares, deportivos o en cualquier otra prestación donde los resultados pueden cuantificarse. Por ejemplo si en un primer examen un niño saca un 10 y otro saca un 2, siendo la nota media de la clase un 5, es matemáticamente inevitable que en un segundo examen el que sacó un 10 disminuya su nota mientras que el que sacó un 2 las aumente, pues las puntuaciones tienden a igualarse buscando la mediocridad (la media).

Pero lo más interesante de esta cuestión es que esta regresión va a darse igual tanto si animamos o reprendemos al suspendido como si nos dedicamos a lisonjear al sobresaliente. Algo que va en contra de nuestras intuiciones pedagógicas. En ellas tendemos a «echar la bronca» a los que quedan por debajo de la media y a alabar los buenos rendimientos de los que se salen por arriba, sin caer en la cuenta de que nuestros esfuerzos no sirven de nada cuando estamos enfrentando puntuaciones extremas. Lo cual no quiere decir que la motivación, el apoyo o el empoderamiento no sean buenas estrategias pedagógicas, sino que solo sirven en las medianías y no en los casos extremos.

Y como tenemos tendencia a premiar a los buenos y a castigar a los malos estamos condenados a cosechar decepciones por parte de los buenos (y con los que somos mas agradables) y sorpresas agradables con aquellos con los que somos desagradables. (Kahneman 2012).

En nuestro sino de hombres anuméricos.

Un caso interesante de misterios correlacionales es la pregunta de si el consumo de cannabis provoca o no psicosis a largo plazo. O dicho de otra manera si existe alguna relación entre consumo y aparicion de esquizofrenia.

Son verdad las siguientes afirmaciones:

1.- El consumo de cannabis desencadena psicosis breves indistingibles de la esquizofrenia.

2.-El consumo de cannabis agrava los sintomas de la esquizofrenia.

Otra vez volvemos a enfrentarnos con la verdad estadística, que nada nos dice de causalidad,  es por eso que es te tipo de verdades no nos gustan pues no contienen ningún relato con sentido para la mayor parte de los consumidores de cannabis.

Hemos de volver pues nuestros ojos hacia alguna otra variable oculta: la variable más sospechosa es la edad. Efectivamente, el consumo de cannabis durante la adolescencia correlaciona con mayores indices de trastornos psiquiátricos en la edad adulta. Otra variable a tener en cuenta es la pobreza: se sabe que ciertos barrios acumulan más casos que otros entornos igualmente urbanos.

Es posible afirmar que la esquizofrenia y el consumo de cannabis comparten una variable oculta (o no tan oculta) entre ambos de donde se deduce que la buena instrucción y la buena situación socioeconómica son factores protectores.

De manera que no se preocupe demasiado si tiene que pagar a hacienda, quizá eso le proteja hasta del otro demonio de nuestro tiempo: el consumo de tabaco. ¿Sienta igual de mal el tabaco a los ricos que a los pobres?

Post o cum hoc ergo propter hoc es una falacia en la que solemos caer con mucha frecuencia. Vigila, tu pensamiento causal está siempre dispuesto para construir hipótesis falsas con tal que resulten explicativas.

4 comentarios en “La regresión a la mediocridad

  1. Sí, la verdad es que nuestro pensamiento tiende ha construir historias por su cuenta de la realidad que le envuelve, sobre todo los niños, pero las matemáticas son las que mandan, es interesante la regresión a la media, de alguna forma esa ley(por llamarla de alguna forma) indica que la naturaleza es más estable de lo que nuestros pensamientos nos dice de ella.
    Yo añadiría que la regresión a la media funciona perfectamente cuando el sistema está aislado perfectamente, pero como no existe ningún sistema aislado perfectamente, la regresión a la media funciona parcialmente aunque con buen rendimiento, si el sistema no está aislado, es decir que hay variables que perturban la media, también perturbarán la regresión a ella.
    Me refiero a que si en el colegio en donde el niño saca un 10 y el otro saca un 2, en el siguiente examen, si uno de los dos enferma y no puede hacer el examen,(el sistema no está aislado), entonces afectará a la media, y por tanto a su regresión, porque claro el hecho de que el niño que saca el 10, luego enferme, no hará que se compense en los otros niños de la clase sus notas.
    Aunque si que es verdad que el hecho de enfermar también tiene su propia media y pueda estar correlacionada indirectamente con la media de las notas.

    Me gusta

  2. Pingback: ¿De qué están hechas las relaciones? | Entretantomagazine

Deja un comentario