Voy a aprovechar un caso práctico para lanzar un canto a bloglandia, que tanto me gusta. Entre las disciplinas que se le atascan al lego, probablemente la estadística se lleva el premio gordo. Y lo primero que se ve en la discusión sobre el clima y la calentología es que siempre se acaba discutiendo de estadística. En dos campos: la estadística que se aplica para intentar reconstruir la temperatura global de la tierra en el pasado, y la que se aplica para tratar de encontrar una “señal” del aumento de las emisiones de CO2 en la temperatura del presente. Todas las “evidencias” que presentan los calentólogos son estadísticas, y así, la virguería suele acabar consistiendo en algo como si la temperatura de la última década es un desmadre estadísticamente significativo, o lo contrario.

– ¿Mande??

En principio te han jodido vivo. Solo los superespecialistas pueden seguir ese hilo, y a ti solo te queda creerte lo que digan esos especialistas. Esa es la tesis, por supuesto, de todos los alarmistas del clima. -Tú te callas, que no entiendes. Y si no te lo quieres creer, eres un anticiencia. Puedes, sí, empollarte la literatura “peer-reviewed“, sin entender apenas nada. Pero no puedes decidir que entre dos estudios de conclusiones opuestas hay uno que te convence más, puesto que no has entendido a fondo lo que has leído. Eso queda en las manos exclusivas de los especialistas.

¿Quiere eso decir que las decisiones las deben tomar los especialistas, porque solo ellos entienden de lo suyo? No necesariamente. El gobernante sensato siempre tiene la opción de traer a su despacho a los especialistas, y de ponerles a discutir -exigiendo que traten de expresarse para legos. Y ahí ya no hace falta entender los fundamentos últimos, sino aplicar las normas de una discusión académica y ver quien presenta evidencias que se sostienen mejor según esas normas. El fallo es que ese sistema solo lo puede usar el gobernante capaz de sentar a los especialistas en su despacho, y al final tú te tienes que fiar de lo que decida el gobernante.

Pues bien, ese es el chiste de las discusiones en bloglandia. Abren al mundo el “despacho del gobernante”.

– ¿Y se puede entender lo que pasa en el despacho?

Desde luego. En realidad se entiende mucho mejor en bloglandia, porque es por escrito e interviene más gente de la que cabe en el despacho. Solo es más lento (lleva más tiempo), y solo hace falta que el blog esté bien llevado; la sutil frontera entre dejar circular libremente los argumentos, y cortar de inmediato al cafre que no deja evolucionar los argumentos y los desvía. Con esas condiciones, tienes tantas posibilidades de enterarte de una discusión técnica terrible como las pueda tener Obama o Zapatero, o probablemente más.

Al ejemplo. Los climatólogos y la estadística. Te pueden decir (y te dicen) que si la variación de temperatura fuera “natural”, o “aleatoria”, las posibilidades de que los 13 años más calientes entre los últimos 130, hayan ocurrido después de 1990 son de 1/10.000. Y a tí puede no convencerte mucho intuitivamente, porque piensas que en la posibilidad de ciclos, y algún ciclo tiene que ser más alto que los demás. Y que con eso pierde todo sentido la “significación estadística” de unos años record de calor consecutivos, por mucho que sean al final de la (actual) serie. Pero como no lo puedes expresar estadísticamente, ni mucho menos argumentar, al final no te queda más remedio que tragarte la facundia numérica del calentólogo. Por ejemplo el Zorita et al 2008 (GRL) How unusual is the recent series of warm years?. O por ejemplo Not a random walk, de Tamino.

Te lo tienes que tragar, hasta que llega bloglandia. Donde físicos de otras ramas, y estadísticos mucho mejores que los climatólogos les explican a estos que están haciendo las cosas mal. Por ejemplo rechazando la hipótesis “natural + camino aleatorio” a base de construir mal la hipótesis. Con tecnicismos que no son ahora al caso (del tipo de que plantean una hipótesis nula a base de movimiento aleatorio + “ruido blanco”, en vez de usar un “ruido rosa”, que es el que corresponde. O la consecuencia de ignorar “unit roots”, que invalida el análisis alarmista). No importa. El asunto es que tienes los elementos de juicio sobre la cuestión más abstrusa, sin necesidad de delegar en el especialista, ni muchísimo menos en el político ignorante que ha escuchado a los especialistas.

Y si eres un poco raro, hasta te puedes divertir … ¡con la estadística! Muy recomendable para el que le eche huevos:

La diversión está en los comentarios que cuelgan, especialmente los de “VS”. Después de eso ya no te impresiona nada la jerga de especialista de un alarmista climático, porque se trata de estadísticas, y unos estadísticos muchísimo más especializados que ellos te han mostrado que lo de los alarmistas (su estadística) no tiene sentido. Eso, sí, la contrapartida es que tienes que perder unas horas.

En un plan mucho más asequible, Lubos Motl lo explica en su blog:

Y la conclusión es que mirando lo que sabemos de la temperatura global (y regional) en los últimos ciento y pico de años, no puedes rechazar la hipótesis de que se trate de una variación natural y aleatoria, sin intervención de las emisiones de CO2.  O lo que ya sabíamos:

  • 1) Que no hay prueba estadística alguna de lo del CO2
  • 2) Que no puedes saber nada del clima, y mucho menos “predecir”, “proyectar”, o como le quieras llamar, sin antes conocer la variabilidad natural del clima, que no conoces.

Antes de bloglandia era algo intuitivamente evidente, pero no expresable o discutible. Con bloglandia puedes poner la mano en el fuego de que se trata de algo científicamente evidente. Y al imbécil que trate de llamarte “anticiencia”, dale un capón, por mamón.

Y esa es la historia de la inapreciable utilidad de la blogosfera, y sus discusiones.

Añadido:, un resumen de uno de los estadísticos “de verdad” (no climáticos):

The issues being addressed in this thread relate to a single question, “Does available real world data support the hypothesis that increased concentrations of atmospheric greenhouse gases increase global temperature permanently?”

VS has clearly pointed out that, to properly test this hypothesis, one must use statistical techniques that are consistent with the underlying characteristics of the data. As noted in the B&R paper, “… the radiative forcings of greenhouse gases (C02, CH4 and N2O) are stationary in second differences (i.e. I(2)) while global temperature and solar irradiance are stationary in first differences (i.e. I(1)).” B&R refer to five papers that have the same findings – i.e., that radiative forcings and global temperature are non-stationary to the same order.

Ignoring the properties of the time series data used to test a theory (hypothesis) can easily suffer the “pitfall of spurious regression.” That is, you can’t look at the simple correlation between greenhouse gas concentrations and temperature (or simple transformations of these data) and accept the hypothesis that one is caused by the other. In the case before us (i.e., given the characteristics of the time series data being used), cointegration has been demonstrated as the appropriate statistical technique. This has nothing to do with the logic or correctness of the underlying theory being tested. Rather, it has to do with the statistical properties of the time series being used to test the theory – two separate issues.

The B&R paper finds that, when cointegration is applied to available data,” … greenhouse gas forcings do not polynominally cointegrate with global temperature and solar irradiance.” Hence, available data do not support the physics based hypothesis.

This type of statistical result simply demonstrates the relationship (or lack thereof) in available data. It is what is!! This result stands (unless there are problems in execution – e.g., the analysis was implemented incorrectly, or the data are faulty, etc.). No appeal to theory or to alternative analyses of different types of data that support the hypothesis changes this single analytical result. Again, it is what is! It is what the data are telling us. In this case the data are telling us that bumble bees can fly (i.e., real world data – observations — are inconsistent with the formulated, mathematically based hypothesis).

What does all this mean? It could mean that the theory is incorrect. Or, it could mean that the data are not “accurate” enough to exhibit the “theoretical relationship.” It certainly “raises a red flag” as VS has noted several times. And, it does mean that one can’t simply point to highly correlated time series data showing rising CO2 concentrations and rising temperatures and claim the data support the theory.

Yo entiendo que esto implica que hemos estado buscando con gran esfuerzo una señal de las emisiones en la temperatura, y de momento no ha salido nada.