Etiquetas

, ,

Artículo publicado por Achintya Rao el 22 de abril de 2016 en Symmetry Magazine

La colaboración CMS ha publicado 300 terabytes de datos de investigación.

La colaboración CMS del CERN ha publicado más de 300 terabytes (TB) de datos abiertos de alta calidad. Estos datos incluyen más de 100 TB de datos procedentes de las colisiones entre protones a 7 TeV, la mitad de los datos recopilados en el LHC por el detector de CMS en 2011. Esta publicación sigue a la realizada en noviembre de 2014, que puso a disposición pública unos 27 TB de datos de investigación recopilados en 2010.

Colisiones en CMS

Colisiones en CMS

Los datos se encuentran disponibles en el Portal de Datos Abiertos del CERN y son de dos tipos. Los conjuntos de datos primarios están en el mismo formato que el usado por la colaboración para realizar su investigación. Los conjuntos de datos derivados, por otra parte, requieren una potencia de cálculo mucho menor, y pueden ser fácilmente analizados por estudiantes de instituto o universidad.

CMS también proporciona datos simulados generados con la misma versión de software que se usaría para analizar los conjuntos de datos primarios. Las simulaciones desempeñan un papel clave en la investigación en física de partículas. Los datos publicados se acompañan de unas herramientas de análisis y ejemplos de código diseñados para los conjuntos de datos. Una imagen de máquina virtual basada en CernVM, que viene precargada con el entorno de software necesario para analizar los datos de CMS, también puede descargarse del portal.

“Una vez que hemos agotado nuestra exploración de los datos, no vemos ninguna razón para no ponerlos a disposición pública”, comenta Kati Lassila-Perini, físico del CMS que dirige los trabajos de conservación de datos. “Los beneficios son numerosos, para inspirar a estudiantes de instituto, o para entrenar a los físicos de partículas del mañana. Y, personalmente, como coordinadora de conservación de datos de CMS, es una parte crucial para asegurar la disponibilidad a largo plazo de nuestros datos de investigación”.

El ámbito de la apertura de datos del LHC ya se ha demostrado con la anterior publicación de datos de investigación. Un grupo de teóricos del MIT quería estudiar la subestructura de los chorros — lluvias de cúmulos de hadrones registradas en los detectores de CMS. Dado que CMS no había realizado esta investigación concreta, los teóricos se pusieron en contacto con los científicos de CMS para asesorarse sobre cómo proceder. Esto generó una provechosa colaboración entre los teóricos del MIT y CMS.

“Como científicos, deberíamos tomarnos muy en serio la publicación de datos en las investigación patrocinadas con dinero público”, comenta Salvatore Rappoccio, físico de CMS que trabajó junto con los teóricos del MIT. “Además de demostrar una buena administración del patrocinio que hemos recibido, también proporciona un beneficio científico a nuestro campo de forma global. Aunque es una tarea difícil y abrumadora con mucho por hacer, la publicación de datos de CMS es un enorme paso adelante en la dirección correcta”.

Además, un físico de CMS en Alemania puso a trabajar a dos estudiantes en la validación de Datos Abiertos de CMS reproduciendo algunas gráficas clave a partir de artículos de CMS muy citados que usaron datos recopilados en 2010. Usando documentación disponible en abierto sobre el análisis de software de CMS, y con una guía del físico, los estudiantes lograron recrear unos gráficos que encajaban casi de forma idéntica con los de CMS, demostrando que puede lograrse usando estos datos.

“Estamos muy contentos de que podamos hacer públicos todos estos datos”, añade Lassila-Perini. “Estamos deseando ver cómo se utilizan fuera de nuestra colaboración, para investigación así como para herramientas educativas”.

Anuncios