Estadística y verdad

Etxeberria Murgiondo, Juanito

EHUko irakaslea. Hezkuntzako Ikerkuntzaren eta Diagnosi Metodoen Saila

Las frases "Ya sé la respuesta, dame una estadística para justificarla", o "Los políticos utilizan la estadística como farolas: más que para iluminar, como soporte" resumen la opinión bastante extendida como leyenda urbana. La estadística es un fraude.
Estadística y verdad
01/05/2009 | Etxeberria Murgiondo, Juanito | Profesora UPV. Departamento de Investigación y Métodos de Diagnóstico en Educación

Son muchos los que mezclan estadísticas con estadísticas. La estadística es una rama de las matemáticas encargada de recopilar, organizar y analizar los datos numéricos. Y no sólo eso, sino que nos ayuda a resolver los problemas y tomar decisiones que surgen en el diseño de los experimentos. A pesar de su corta historia como disciplina científica, tiene una larga antigüedad como herramienta de síntesis y publicación de información numérica. La extensión de la estadística y su función instrumental se extiende a todas las ramas de la ciencia.

En aquellos casos en los que no se disponga de datos de todos los elementos de la población objeto de estudio, se trabajará en condiciones de incertidumbre y aleatoriedad para preparar las conclusiones. En estos casos, el análisis inferencial de los datos utiliza una metodología estadística para estimar parámetros desconocidos, contrastar hipótesis concretas, prever comportamientos futuros, tomar decisiones, realizar diagnósticos individuales y colectivos, cuantificar la incertidumbre e incluso limitar el margen de error. Así se anuncia el tiempo, el estado de salud de una persona, la comparación entre los resultados de ambos procedimientos, la fiabilidad de los componentes de una máquina a lo largo de varios años. Las previsiones concretas deberían ser: mañana hay una probabilidad de lluvia del 87%, tienes el cerebro mal con un 93% de probabilidad, o la bombilla A es mejor que la B con un margen de error del 5%. Pero no parece que el hombre del tiempo, ni el médico, ni el vendedor de bombillas tomen la tarea de determinar el grado de error de sus pronósticos.

Cabe destacar, además, que las nociones de locura e incertidumbre confunden a veces la intuición. Así, en un colectivo de 30 personas, la probabilidad de que haya dos personas que cumplan los años en el mismo día es superior a la de que no exista, es decir, superior al 50%. Con tan sólo treinta personas parece mentira, pero la teoría de la probabilidad "demuestra" que la probabilidad de que el cumpleaños ocurra a la vez es mayor que la probabilidad de que no ocurra a la vez.

Un proceso de análisis inferencial de datos nos conduce a la definición de la población, la determinación del tamaño de la muestra y la selección de los elementos, la medición de las variables del objeto de estudio, el análisis de los datos y la presentación de los resultados. En cada una de estas etapas podemos hacer errores, que en algunos casos son difíciles de cuantificar. El objetivo de la inferencia estadística será cuantificar la probabilidad de cada posible error. Sin embargo, al igual que se pueden mentir con el lenguaje, con los números también se pueden mentir, manipulando los resultados, dividiendo la información, guardando una parte en el bolsillo trasero, o presentando los resultados de forma fraudulenta...

Veamos dos ejemplos bastante ingenuos. En los dos gráficos adjuntos se muestran los perfiles de dos carreras con gran continuidad en el País Vasco. En uno de ellos, en el Tour de Francia aparecen varios puertos de montaña que los ciclistas suben a lo largo de 159,5 kilómetros, entre ellos Tourmalet --2.114 metros de altura-. El otro gráfico corresponde a la carrera Behobia-San Sebastián. En esta carrera, los corredores unen a los dos pueblos, corriendo aproximadamente 20 kilómetros. Se trata básicamente de un recorrido llano con los altos más altos, Gaintxurizketa, con 84 metros. Observa los perfiles que aparecen en los dos gráficos: son similares. Las escalas utilizadas para crear gráficos son muy diferentes, pero me han permitido diseñar dos perfiles muy similares. Datos muy diferentes pero gráficos iguales. También se pueden ver ejemplos en contra todos los días.

A partir de datos muy diferentes se pueden generar dos gráficos con un perfil muy similar. Todo es cuestión de escala.

Vamos ahora a Oñati. Para ver que es un pueblo se sabe. Pero en la revista Concelupetik (publicada en Oñati), al explicar el número de visitantes del municipio en 2007, aparece un pequeño error.

Para empezar, lo que sorprende es la precisión del titular: "20.293 turistas visitaron Oñati en 2007". Surgen dudas y preguntas al respecto. ¿Cuentan todos los que dan una vuelta alrededor de la universidad? ¿Y todos los que acuden el día del Corpus? ¿Y todos los que van a Arantzazu? ¿Y todos los que van a las cuevas de Arrikrutz? ¿Cómo consiguen contar todos con este tipo de precisión? Siendo tan bonito Oñati y con tantos turistas, ¿no son pocos? Media inferior a 60 por día.

Una vez leída la noticia, se aclaran nuestras dudas: 20.293 personas pasan por la oficina de turismo. En el título se mezclan ambos conceptos: muestra y población estadística. Lamentablemente, este tipo de errores se cometen con una frecuencia muy elevada en las presentaciones de resultados estadísticos.

Noticia publicada desde el concejo en la revista. La muestra está mezclada con la población estadística.

La estadística es una herramienta que ayuda a conocer la “verdad” de una realidad y nos invade en diferentes ámbitos de la vida. Sin embargo, el mal uso y los excesos estadísticos a veces justifican las reticencias estadísticas de una parte de la población. La única vacuna contra este mal uso es la mayor formación estadística.

Creo que es el momento de reivindicar la inclusión de más conceptos estadísticos en el currículo escolar de matemáticas. Estadística para la vida, o algo parecido... O, bien, ¿por qué no las Matemáticas para la Vida? Ayudaría a reducir el "anumerismo social" y, con ello, nos ayudaría a estar alerta ante los malos usos de la estadística. Y es que, aunque los números no miente, los mentirosos son once.

Juanito Etxeberria Murgiondo. Profesor de la UPV. Departamento de Investigación y Métodos de Diagnóstico en Educación.

Etxeberria Murgiondo, Juanito
Servicios
253
2009
Servicios
026
Matemáticas
Análisis
Biblioteca
Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila