FICSAC

Estudiantes IBERO desentrañan en el CERN misterio de 'data mining'

• Durante su estancia en el Centro Europeo de Investigación Nuclear en Suiza resolvieron en sólo dos semanas una problemática que llevaba meses sin solución

• Desarrollan un algoritmo de extracción de datos que a partir de miles de millones de registros selecciona información y la filtra sólo con datos necesarios

• Tienen 20 y 26 años y ya les ofrecieron estudiar la maestría en Europa y seguir colaborando con el CER

Durante una estancia de un mes en Ginebra, Suiza, que realizaron en calidad de alumnos-investigadores, dos estudiantes de ingeniería de la Universidad Iberoamericana Ciudad de México resolvieron un problema de súper cómputo del Centro Europeo de Investigación Nuclear (CERN, por sus siglas en francés) que llevaba meses sin solución.

Osvaldo Miguel Colín, de Ingeniería Física, y Miguel Calderón Monroy, de Ingeniería en Computación y Electrónica; son los estudiantes de la IBERO que dieron respuesta a una problemática de uso de bases de datos, y en dos semanas implementaron su solución en el CERN; famoso por contener dentro de sus instalaciones al Gran Colisionador de Hadrones (LHC, por sus siglas en inglés) en el que cerca de 12 mil científicos de 500 instituciones universitarias y centros de investigación de 80 países encontraron el Bosón de Higgs, más conocido como “la partícula de Dios”.

Miguel Colín y Calderón Monroy, alumnos de 20 y 26 años, respectivamente, fueron elegidos para ir a Europa por su dominio del inglés y grandes habilidades en programación, específicamente en data mining o minería de datos (campo de la computación enfocado a encontrar patrones en grandes volúmenes de información), pues el problema del centro era precisamente el manejo de datos, toda vez que con cada experimento producen miles de millones de bites de información.

Ambos fueron asignados al Subdetector de Muones (detector de placas resistivas -RPC, por sus siglas en inglés-) del Compact Muon Solenoid (CMS), experimento sobre  muones; que son las partículas elementales de carga negativa que forman  los canales principales por los que desaparece el Bosón de Higgs.

Algoritmo para procesar la información

El Dr. Anton Dimitrov, coordinador Técnico de las RPC de CMS  y encargado del funcionamiento directo de mil 64 detectores de colisiones y partículas, asignó a los universitarios de la Iberoamericana trabajar con unas tablas con 14 miles de millones de registros, recabados desde 2009, y que al ser asincrónicos (que sólo reconocen cambios) no permitían saber cuáles eran los datos anteriores a un registro.

Este hecho impedía a los investigadores del CERN extraer y procesar la información que iban recabando “porque no conocían ningún método para hacer esto. Fue cuando a Miguel y a mí, que ya teníamos un poco de experiencia trabajando con bases de datos, se nos ocurrió la solución en dos días más o menos, la cual pudimos plantear y mostrárselas. Ellos llevaban algunos meses intentando resolver lo que nosotros logramos en dos semanas, ya con la solución nueva implementada”, explicó Osvaldo.

La solución propuesta por Osvaldo y Miguel consistió en desarrollar un algoritmo de extracción de datos que a partir de esos miles de millones de registros seleccionaba la información y la filtraba para nada más contar con los datos que se iban a estar trabajando y procesando. De esta manera dieron la opción a poder hacer muchos análisis de sistemas, detenidos por más de un año.

“Les dimos una llave para abrir una puerta que tenían cerrada. Ahora tienen un catálogo de datos de muchas variables y parámetros para procesarlos, investigar y analizar el estado del detector, comparar datos prácticos reales contra sus datos teóricos o sus aproximaciones. Al usar nuestro algoritmo ya pueden comprobar lo que estiman y lo que infieren”, abundó Miguel.

La ayuda de los alumnos fue tan importante para el centro de investigación “que a partir de su aportación técnica los trabajos a futuro de: monitoreo, análisis de envejecimiento del detector, análisis de consumo de corriente, entre otros, se harán en el nuevo marco de data mining que ellos implementaron”, resaltó el doctor Salvador Carrillo Moreno, académico del Departamento de Física y Matemáticas de la IBERO.

“La información que ahora se puede procesar y analizar es vital para saber si el detector se tiene que reemplazar en cinco, diez o 15 años. Esa información, que antes no se pudo extraer, ahora permite predecir cuándo se tienen que cambiar los miles de componentes de cada sección del detector”, agregó Carrillo, investigador que lleva diez años colaborando con el CERN y quien coordinó el proceso de selección a partir del cual se llevó a ambos estudiantes a Suiza.

¿Investigadores mexicanos en Europa?

Por su enorme aporte al Centro Europeo de Investigación Nuclear los dos estudiantes recibieron propuestas para permanecer en ese continente. “A mí me ofrecieron estudiar una maestría en Física en Suiza y un empleo en el área de cómputo del CERN”, dijo Miguel Calderón, recientemente egresado de Ingeniería en Computación y Electrónica.

Esas ofertas también se las hicieron a Osvaldo Miguel, pero como él apenas cursa el tercer semestre de Ingeniería Físicase siente más atraído por participar en el programa de summer students del centro, que consiste en un empleo temporal de dos meses en el CERN, donde por sus resultados previos obtenidos en la minería de datos tendrá la posibilidad de proponer su propio proyecto.

Mientras ambos deciden sobre las propuestas recibidas, Osvaldo continúa asesorando desde México al Dr. Anton  y trabaja directamente con otro Coordinador Técnico del Grupo de RPC. Un gran mérito para este joven becario del programa Si quieres ¡PUEDES! de la IBERO (que otorga becas del 100% a alumnos con escasos recursos económicos y enorme talento académico) y quien desde los 15 años de edad se vio obligado a compaginar sus estudios con un empleo en un broker de refacciones de autos donde maneja bases de datos.

Pedro Rendón