Ciencia
De aquellos datos, estas conclusiones

Entre científicos, la controversia sobre qué estadística es la “correcta” sigue a día de hoy. Cuál se usa en distintos campos tiene mucho que ver con la costumbre.

Estadísticas — Foto de Quinn Dombrowski.

Jordi Burguet Castell

24 ago 2019 06:49

Cómo aprendemos a partir de los datos? Si confirman una teoría, creemos más en ella, y si la contradicen, la rechazamos. Parece de sentido sentido común, y una versión ligeramente más refinada es lo que se conoce como método científico. Esta forma de aprender tiene varios aspectos sorprendentes y detalles tremendamente interesantes. Sin embargo, también puede subvertirse para hacernos “aprender” cosas que tienen poco que ver con la realidad.

En realidad, los datos por sí solos nunca confirman ni rechazan del todo un punto de partida. Si por ejemplo miramos las temperaturas máximas en España durante los últimos cien años, los valores registrados (los “datos”), podrían ocurrir tanto si hay cambio climático como si no lo hay. ¿Eso significa que no nos dicen nada sobre si lo hay? No, porque las probabilidades de que ocurran no son las mismas. Si no hay cambio climático, esperaríamos que las temperaturas se distribuyan completamente al azar. Sería muy sorprendente que las más altas se dieran en años recientes, aunque no imposible (la probabilidad sería muy baja aunque no cero, porque nunca lo es). Si hay cambio climático sí tendrían una probabilidad muy alta.

Vamos a centrarnos en cómo se utilizan en ciencia los métodos para obtener unas conclusiones a partir de unos datos. La forma en que, a partir de un punto de partida, se llega a saber con qué probabilidad pueden ocurrir esos datos es lo que se conoce como cálculo de probabilidades. Al punto de partida, por cierto, también se le llama “hipótesis” o “modelo”. La probabilidad es un campo muy estudiado, que se entiende bastante bien y sobre el que hay poca controversia. Normalmente la parte más importante es la de crear/imaginar —pñor algo decía Einstein que “la imaginación es más importante que el conocimiento”— buenos modelos que describan lo que ocurre y a partir de ahí existen múltiples técnicas para calcular las probabilidades que queremos saber sobre los datos.

Sin embargo en lo que normalmente estamos interesados es en lo contrario: saber hasta qué punto creer un modelo u otro en base a los datos que tenemos. Es decir, el proceso inverso al de calcular la probabilidad de los datos. La disciplina que estudia esta especie de trabajo detectivesco se conoce como inferencia estadística (a veces simplemente, estadística). Es a la vez más interesante y mucho más controvertida que el mero cálculo de probabilidades, en el cual está basada.

Piense como una científica

La forma de encontrar la probabilidad inversa, es decir, la probabilidad de algo a partir de los datos, es relativamente sencilla. En realidad el cerebro humano ya la utiliza de forma natural sin darnos cuenta. “Estas huellas podrían ser de pantera o de gato, ¿cuánto se parecen realmente a unas u otras?, ¿cuántas panteras y gatos hay por estos parajes?, y a raíz de esto, ¿cuánto tengo que preocuparme entonces?”. Sin hacer cálculos de forma consciente, por lo general estimamos bien, tal y como lo haríamos si usáramos lo que se llama “estadística Bayesiana”. En ella, calcularíamos la probabilidad del modelo como proporcional al producto de la probabilidad inicial veces la probabilidad de los datos según el modelo.

A nivel de individuos interesados en conocer cómo es la realidad, es bueno ser consciente de que hay múltiples formas de engañar “con estadística”

Laplace, científico pionero en el cálculo de probabilidades, ya utilizaba a principios del siglo XIX esta forma para hacer inferencia estadística. Con ella pudo estimar entre otras cosas la masa del planeta Saturno con tan solo un 0,4% de error, una precisión asombrosamente buena para la época.

En realidad con esta estadística lo que hacemos es actualizar una estimación a partir de unos datos. Es decir, necesitamos tener una estimación inicial (comúnmente llamada probabilidad a priori, o prior) antes de usarla. El resultado de la estimación depende mucho de ese prior. ¿Y qué prior utilizar? La falta de consenso en ese último punto llevó a la estadística por un largo desvío durante muchos años.

Probabilidad, ¿frecuencia o medida de la incertidumbre?

Donde sí estaban las cosas más claras era en, dado un modelo, saber la probabilidad de que salgan unos datos, en el sentido siguiente: si repetimos el mismo experimento muchas veces ¿cuántas veces ocurre cada resultado? Por ejemplo, si tiramos un dado muchas veces, ¿cuántas veces saldrá el 6?

Interpretando la probabilidad como esa frecuencia para muchas repeticiones, en lugar de como una medida de la incertidumbre, se desarrolló todo un grupo de técnicas “estadísticas” para analizar los datos. Es lo que se conoce como “estadística frecuentista”, y es la otra corriente principal en ciencia sobre cómo interpretar los datos.

Los distintos conceptos y tests estadísticos que se crearon son muy potentes y ayudan tanto a entender los datos como a tomar decisiones en base a ellos. Sin embargo, utilizarlos correctamente requiere estar atentos a sutilezas y en realidad no responden a las preguntas que uno se suele plantear. Por ejemplo, en lugar de decir que la masa de Saturno está entre ciertos valores con una cierta la probabilidad, lo que dicen son cosas como que si repetimos muchas veces el tomar los datos, se construiría un intervalo en el que su masa caería dentro un cierto número de veces. Algo que está relacionado, pero que ni es lo mismo ni tampoco muy intuitivo.

Sorprendentemente a día de hoy la estadística frecuentista sigue siendo el estándar que se enseña en la universidad. Sin embargo en las últimas décadas vuelve a haber más científicos que se toman en serio la estadística Bayesiana, en la que se han desarrollado técnicas más potentes, que no son solo más generales que las frecuentistas, sino que las pueden justificar cuando estas tienen sentido, y dar una respuesta mejor cuando no.

Entre científicos, la controversia sobre qué estadística es la “correcta” sigue a día de hoy. Cuál se usa en distintos campos tiene mucho que ver con la costumbre. En campos como la física de partículas se utiliza mucho la versión frecuentista, mientras que en otros como la astrofísica o más modernamente en inteligencia artificial normalmente se tiene una visión Bayesiana.

Este es el panorama actual en ciencia en cuanto a estadística. A pesar de sus diferencias, en la práctica con ambas formas, Bayesiana y frecuentista, podemos aprender bien en base a los datos y entender mejor el mundo. Es solo en ciertos casos límite que la distinción se vuelve importante (y en esos casos, nuestra opinión sobre cuál es la adecuada habrá quedado clara).

Mentiras, malditas mentiras, y estadística

La inferencia estadística es una herramienta con la que podemos conocer el mundo cada vez mejor a partir de los datos que tenemos. No solo en ciencia, sino en cualquier aspecto de la vida.

Así que para ir siendo más sabios, basta con tomar cada vez más datos. ¿No?

La razón de que no sea tan fácil es que normalmente los datos que nos llegan no son independientes, suelen estar sesgados. Si nos quieren hacer creer alguna mentira, qué mejor que hacernos llegar unos datos y no otros, tal vez incluso sacarlos de contexto o hasta distorsionarlos un poco, y para recubrirlo todo añadir un análisis estadístico en base a ellos y que dé apariencia de verdad inescapable a la conclusión.

Aquí lo que está en cuestión no es la metodología científica para plantear experimentos y obtener información, ni las interpretaciones varias de la “inferencia estadística”. A nivel de individuos interesados en conocer cómo es la realidad, es bueno ser consciente de que hay múltiples formas de engañar “con estadística”. Esto no se les pasa por alto a quienes quieren manipular las opiniones, ni es algo nuevo. Sobre las formas en que se hace, y qué podemos hacer al respecto, esperamos hablar en un próximo artículo.

Archivado en: Ciencia

Informar de un error

Es necesario tener cuenta y acceder a ella para poder hacer envíos. Regístrate. Entra en tu cuenta.

Relacionadas

Memoria histórica

Memoria histórica Buenos y sabios: el paso por Extremadura de Odón y Sadí de Buen

Chema Álvarez Rodríguez

Memoria de Odón de Buen —científico, librepensador y republicano— y de su hijo Sadí —asesinado por el fascismo— y de su lucha para la erradicación del paludismo.

Psicoactivos

Psicodélicos Antón Gómez-Escolar (Drogopedia): “A las farmas tradicionales no les interesan los psicodélicos porque amenaza su negocio"

Yago Álvarez Barba

El psicofarmacólogo y divulgador sobre drogas publica el libro ‘Expande tu mente’ donde dibuja el mapa de la revolución de los psicodélicos en la salud mental.

Ecofeminismo

Cuando la ciencia y el feminismo se encuentran en la naturaleza. Carson y Margulis sembraron ecofeminismo.

Marisa Maliaño Toca

Rachel Carson y Lynn Margulis desafiaron el pensamiento dominante y patriarcal.

Comentarios (1) Es necesario acceder para comentar

Comentar

Suscríbete y comenta sin moderación Si ya estás suscrita
inicia sesión

David González

25/8/2019 11:18

Gracias por el artículo.

Sigo creyendo que la era del Big Data está fundamentada en el síndrome de Diógenes del dato, generando silos tóxicos. Aquí, la Teoría de Muestreo ha sido relejada por un discurso marquetiniano basado en una columna que se tambalea sin sesar: la Ley de los Pequeños Números.

Que barbaridades ve uno en las empresas, buscando el número dorado, sea o no real.

Un saludo, Compañero

Responder

Laboral

Laboral Reivindicar los derechos laborales en micro empresas, el reto de los sindicatos

Laura L. Ruiz

Nuevas estrategias hacen frente a realidades como las de los falsos autónomos o los puestos en remoto, mientras el PP quiere restringir aún más los comités de empresa.

Palestina

Palestina Albanese presenta su informe ante la ONU: “Gaza es el escenario de un crimen”

Redacción El Salto

El Consejo de Derechos Humanos atiende al reporte sobre el lucro de empresas y bancos en el actual genocidio de Gaza. The Guardian califica de “posible crimen de guerra” el ataque contra una cafetería en la que murieron 39 personas.

Política

Política Feijóo radicaliza al Partido Popular en medio del terremoto Cerdán con la vista puesta en las elecciones

Javier H. Rodríguez

Miguel Tellado será el nuevo secretario general del partido. Un movimiento con el que Feijóo consigue el control casi absoluto del PP y le come espacio del discurso ultra a Vox, pero que lo aleja de eventuales pactos con PNV y Junts.

Galicia

Galicia Galicia elige el rumbo de la lucha contra Altri en las elecciones a la directiva de la plataforma Ulloa Viva

Javier H. Rodríguez

Vecinos y vecinas de la comarca más afectada presentan dos listas separadas tras no llegar a una propuesta de consenso. Por un lado concurre una candidatura continuista y, por el otro, una alternativa que se acerca más al nacionalismo institucional.

En el margen

En el margen Aisetou Kajakeh: “Nosotras no estamos rompiendo techos de cristal, sino sorteando muros”

Elena García

Esta socióloga española asegura que las asociaciones gambianas en España mantienen un vínculo directo con el lugar de origen, lo que hace que nunca pierdan la conexión con las raíces.

Opinión

Opinión Espejismo España

Pablo Elorduy

La descomposición del Gobierno de coalición es un reflejo de la expansión de la ola ultraderechista, pero no implica que los movimientos de transformación no puedan organizarse para contrarrestar esa amenaza.

Tribuna

Regadíos Regar con un agua que no tenemos ni tendremos

Carmen Molina Cañadas , Miguel A. Quesada Felice

Se encona la lucha por el control de un agua de la que somos deficitarios, exponiendo amplios territorios a la desertificación y el abandono.

Últimas

Córdoba

Turismo El número de pisos turísticos en Córdoba se reduce a los tres meses de la moratoria para nuevas licencias

Deva Mar Escobedo

Otras normas tratan de limitar la proliferación de las viviendas de uso turístico por la ciudad. Un portavoz de Stop Desahucios predice que estos pisos se trasladarán a los barrios no afectados por la moratoria.

Naciones Unidas (ONU)

Genocidio El Informe Albanese denuncia ante la ONU a las empresas que se han lucrado del exterminio en Gaza

Pablo Elorduy

La relatora presenta un informe al Consejo de Derechos Humanos en el que detalla la responsabilidad de decenas de empresas en las políticas de ocupación, apartheid y genocidio que está llevando a cabo Israel en Palestina.

Crisis climática

Datos El junio más cálido jamás registrado cierra con 330 fallecimientos por calor

Deva Mar Escobedo

103 personas han muerto en los primeros tres días de la ola de calor, según las estimaciones. Los datos de la Aemet señalan al pasado mes como el junio más caluroso; ha pulverizado la máxima anterior por 0,8 grados de diferencia.

Desempleo

Paro El paro registrado cae otras 48.920 personas y marca el junio más bajo desde 2008

Redacción El Salto

El total de desempleados se sitúa en los 2.405.963 y el paro femenino también marca mínimos en los últimos 17 años.

Oriente Medio

Oriente Medio La plantilla de EFE en Oriente Medio denuncia salarios por debajo de los mil euros

Laura L. Ruiz

La delegación, formada por 24 personas, anuncia paros en sus funciones al verse reducida más de un 25% su nómina sin opción a negociar.

Alquiler

Racismo y alquileres Siete de cada diez migrantes se ve en la necesidad de vivir de alquiler frente al 14% de los hogares españoles

Susana Albarrán Méndez

“El precio del prejuicio” es el título del más reciente estudio del Instituto de Investigación Urbana de Barcelona, IDRA, en el que disecciona la relación entre las personas migrantes y su acceso a la vivienda.

Más noticias

Comunidad de Madrid

Sanidad privada Inspección propone sancionar a un hospital de Quirón por exponer a la plantilla a sustancias cancerígenas

Sara Plaza Casares

El organismo inicia un procedimiento administrativo sancionador por infracción grave. Tras una visita al Hospital Quirónsalud Sur, de Madrid, constataron deficiencias en la zona de almacenamiento de los productos farmacéuticos y en el mortuorio.

Ciencia De aquellos datos, estas conclusiones