El blog de Acei: La máquina superinteligente que ordena datos mejor que un humano

Incluso más sofisticado que el ordenador Deep Blue de IBM que logró derrotar a Gary Kasparov al ajedrez. Así describen los artífices del nuevo ordenador PaleoDeepDive a su máquina, capaz de buscar, resumir, cotejar e indexar gran cantidad de datos con asombrosa rapidez y precisión. Su desarrollo, publicado en el último número de la revista PLoS One, "marca un hito" en esta clase de tecnología, según aseguran sus creadores.

PaleoDeepDive desarrolla una tarea más compleja y menos exacta que el ajedrez, "basado en reglas rígidas en las que hay muy pocos movimientos permitidos", explica Shanan Peters, profesor de geociencias de la Universidad de Wisconsin-Madison y autor principal del estudio. "Extraer información estructurada de publicaciones científicas y relacionarla es un reto tanto para los seres humanos como para las máquinas", asegura.

"¡Cambiará las reglas del juego en la Ciencia!", explica entusiasmado Peters a este diario. "En particular, los científicos que trabajan con muestras (como los paleontólogos) se hacen muchas preguntas fundamentales para la investigación, pero para resolverlas necesitan un enfoque que requiere sintetizar todas las mediciones realizadas por cientos de trabajadores durante varias décadas", asegura. Además, a esta dificultad se añade otro obstáculo: estas mediciones están dispersas por "cientos de miles" de publicaciones científicas.

Peters también ha impulsado la creación del repositorio The Paleobiology Database (PaleoBioDB), que se está construyendo con el trabajo de cientos de investigadores internacionales desde 1998. "Recogen datos como la cantidad de especies fósiles que se han encontrado, la edad de los huesos y su situación. La compilación de esta clase de datos de forma manual es un esfuerzo monumental", cuenta Peters.

Sin embargo, gracias a la creación de PaleoDeepDive, se podrá automatizar y acelerar el proceso. Un equipo de un paleontólogo y algunos ingenieros informáticos "han conseguido en unos meses" la misma cantidad de trabajo que desarrollarían 10 personas durante un año de investigación continua en PaleoBioDB.

"Hemos demostrado que el sistema igualaba el trabajo de los científicos en todas las cosas que medimos. En algunas categorías incluso fue mejor", asegura entusiasmado Christopher Ré, director del desarrollo de este software.

Peters afirma que en tareas de Big Data el sistema PaleoDeepDivetiene una gran ventaja. "La información que se ha introducido manualmente en PaleoBioDB no puede ser evaluado o mejorado sin que otra persona tenga que volver a la biblioteca y examinar los documentos originales. El ordenador, por el contrario, puede profundizar y mejorar los resultados sobre la marcha mientras añade nueva información", explica. "PaleoDeepDive también puede extraer información relacionada de fuera de la base de datos original, algo crucial para hacer frente a las nuevas preguntas de la Ciencia, y este sistema lo hace a gran escala", concluye.

Sin embargo, Peters advierte que la infraestructura DeepDive de Chris Ré, es "sólo el principio", pues el sistema es todavía muy joven y por lo tanto apto para "mejorar". Este investigador asegura que con la participación de más paleontólogos habrá "un rápido progreso".

El profesor Miron Livny, de la Universidad de Wisconsin-Madison trabajó codo con codo con Chris Ré para integrar el sistema de gestión de trabajos HTCondor en el sistema de lectura mecánicaDeep Dive. "Tuvimos suerte de que Livny nos facilitase las capacidades de computación de alto rendimiento del campus de Wisconsin-Madison para el soporte. Empezar de cero requiere millones de horas de programación", explica Peters.

Así todo, el profesor Peters lamenta la dificultad para acceder a las publicaciones paleontológicas y poder utilizarlas para que el ordenador pueda cotejarla. No obstante, se muestra esperanzado de que la situación cambie pronto. "Mientras nosotros hablamos, Chris Ré, Livny y el resto de su equipo están trabajando en ello con la biblioteca de la Universidad de Washington".

Peters destaca que muchos campos se enfrentan al reto de optimizar el uso de los hallazgos antiguos y hacer accesibles las clasificaciones de nuevos datos.

"En última instancia, esperamos tener la capacidad de crear un sistema informático capaz de hacer de inmediato lo que muchos geólogos y paleontólogos tratan de hacer durante toda la vida: leer un montón de papeles, organizar un montón de hechos y relacionarlos entre sí con el fin de abordar grandes cuestiones de la vida", afirma Peters. "Espero con interés el día en que el tiempo y el esfuerzo no sean un obstáculo para la Ciencia, sino que la única barrera sea la creatividad y la exploración de las mejores hipótesis mejor formuladas"

El blog de Acei

Visitas

jueves, 4 de diciembre de 2014

La máquina superinteligente que ordena datos mejor que un humano

No hay comentarios:

Publicar un comentario