Google y el virus H1N1

Cuentan Viktor Mayer-Schonberger y Kenneth Cukier en su libro “Big Data – A revolution that will transform how we live, work and think”, que en 2009 un nuevo virus de gripa fue descubierto. Combinando elementos de virus que causan gripa aviar y gripa porcina, esta nueva cepa, denominada H1N1, se esparció rápidamente. En cuestión de semanas, las agencias de salud pública alrededor del mundo temieron que una terrible pandemia estaba en camino. Algunos comentaristas advirtieron de un fenómeno de la escala de la gripa española de 1918 que había afecta a 500 millones de personas y matado a decenas de miles. Peor aun, no existía una vacuna disponible contra este nuevo virus. La única esperanza que la agencias de salud pública tenían era demorar la diseminación. Pero para lograr esto, tenían que saber en donde ya se encontraba.

El los Estado Unidos, el Centrol para Control de Enfermedades (CDC por sus siglas en inglés) solicitó que los médicos le informaran de nuevos casos. Si embargo, el escenario de la pandemia que emergía estaba siempre desactualizada por una o dos semanas. Las personas podían estar enferma durante días, pero esperar antes de ir a donde un médico. Enviar la información a las organizaciones centrales tomaba tiempo, y el CDC únicamente tabulaba los números cada semana. Cuando se trata de una enfermedad que se esparce rápidamente, una diferencia de dos semanas es una eternidad. Esta demora dejaba a las agencias de salud pública ciegas en los momentos más críticos.

Algunas semanas antes de que el virus H1N1 llegara a los titulares, ingenieros en el gigante de Internet Google publicaron un artículo sorprendente en la revista científica Nature. Tuvo un gran impacto entre entre oficiales de salud y profesionales de la tecnología pero no trascendió más allá. Los autores explicaron como Google podía “predecir” la diseminación de la gripa de invierno en Estado Unidos, no solo a nivel nacional, sino en regiones e incluso estados específicos. La compañía podía lograr esto observado lo que las personas estaban buscando en Internet. Dado que Google recibe más de 3000 millones de búsquedas al días y las guarda todas, tenía suficiente información con que trabajar.

Google tomó las 50 millones de búsquedas más comunes que los estadounidenses escribían y las comparó con una lista de datos del CDC acerca de la diseminación de gripa estacional entre 2003 y 2008. La idea era identificar áreas infectadas por la gripa según las búsquedas de las personas en Internet. Otros habían intentado lograr esto con búsquedas en Internet pero nadie tenía tantos datos, poder de procesamiento y conocimiento de estadística como Google.

Mientras que los ingenieros de Google supusieron que las búsquedas podía estar orientadas a encontrar información acerca de la gripa – escribir frases como “medicina para la tos y la fiebre” – ese no era el punto; ellos no lo sabían, y diseñaron un sistema al cual no le importaba. Todo lo que su sistema hacía era buscar correlaciones entre la frecuencia de algunas búsquedas y la diseminación de la gripa en el tiempo y el espacio. En total, procesaron la increíble cantidad de 450 millones de modelos matemáticos para probar los términos de búsqueda, comparando sus predicciones contra casos reales de gripa del CDC en 2007 y 2008. Y encontraron oro: el software diseñado encontró una combinación de 45 términos de búsqueda que, cuando eran usados juntos en un modelo matemático, tenía una fuerte correlación entre las predicciones y las cifras oficiales a nivel nacional. Tal como el CDC, podían saber a donde se había esparcido la gripa, pero a diferencia del CDC, podían saber en casi tiempo real, no una o dos semanas después.

Por lo tanto, cuando explotó la crisis del virus N1H1 en 2009, el sistema de Google probó ser un indicador más útil y oportuno que las estadísticas del gobierno con sus retrasos naturales. Los oficiales de salud pública estaban armados con información valiosa.

Sorprendentemente, el método de Google no involucra distribuir isopos bucales o contactar las oficinas de los médicos. Por el contrario, está construido sobre Big Data – la habilidad de la sociedad de aprovechar la información en formas novedosas para producir conocimiento útil o bienes y servicios de valor significativo. Con ello, la próxima ves que ocurra una nueva pandemia, el mundo tendrá una mejor herramienta a su disposición para predecir y por lo tanto prevenir su diseminación.

Anuncios

Soy un fan de la tecnología, de carrera y de convicción. He trabajado en una amplia variedad de empresas del sector ocupando cargos que van desde el soporte técnico hasta la consultoría, la gerencia de proyectos y la arquitectura de soluciones. Pocas tendencias tecnológicas han capturado mi atención (y hasta cierto punto mi obsesión) como este movimiento revolucionario tecnológico, económico y social que ha llegado a definirse como Big Data.

Tagged with: ,
Publicado en Artículo

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: