Uno de los principales resultados del Consorcio de Investigación del Golfo de México ha sido el “Sistema para la planeación, ejecución, almacenamiento y gestión de datos de cruceros oceanográficos” diseñado por el grupo interdisciplinario de Manejo y Modelado de Datos (MMD) dentro del proyecto Implementación de redes de observación oceanográficas (físicas, geoquímica, ecológicas) para la generación de escenarios ante posibles
contingencias relacionadas a la exploración y producción de hidrocarburos en aguas profundas del Golfo de México, financiado por el CONACYT-SENER Fondo de Hidrocarburos.

El sistema se compone de una base de datos y una interfaz de acceso vía web, y tiene como objetivo garantizar la accesibilidad y permanencia a los datos generados dentro del contexto del proyecto. Aquí se encuentran resguardados un total de 86,480 muestras colectadas en las diferentes campañas (19 cruceros oceanográficos realizados por parte de CICESE, UABC, ICMyL-UNAM, y CINVESTAV-Mérida) y monitoreos de pastos marinos (12 monitoreos de praderas de pastos marinos de Campeche y Yucatán realizados por la UAM-Iztapalapa) dentro de los cuales se midieron cientos de variables hidrográficas, fisicoquímicas, biogeochemical, ecológicas y biológicas.

Al mismo tiempo, se alberga un total de 11,839,601 registros de resultados almacenados en dos tipos de bases de datos: 526,682 resultados están almacenados en una base de datos relacional, mientras que 11,312,919 registros están almacenados en una base de datos no relacional (taxonómica). De estos últimos, 620,223 corresponden a resultados de análisis de identificación morfológica y los restantes 10,692,696 son resultado de análisis de metagenómica. Los datos que son resultados de análisis de la identificación de organismos por medio de características taxonómicas cuentan con el identificador (AphiaID), del World Ocean Register of Marine Species (WoRMS), lo cual permite mantener la clasificación taxonómica de las especies actualizada a lo largo del tiempo.

El sistema ha permitido cumplir con uno de los principales objetivos del proyecto, el cual era establecer una línea base ambiental para las aguas mexicanas del golfo de México. La base de datos es integrativa, comparable, accesible y validada, y dentro del contexto del proyecto, permitiría evaluar impactos y diseñar estrategias de mitigación en casos de derrames de gran escala en la zona de aguas profundas mexicanas. También permite el intercambio de los datos generados entre los participantes del proyecto, sentando las bases para colaboraciones
interdisciplinarias, y en el futuro permitirá identificar cambios en el ecosistema asociados al cambio climático.

Aunque este sistema se diseñó e implementó para cumplir con los objetivos del proyecto, es altamente adaptable a cualquier crucero oceanográfico. En la elaboración del sistema se adoptaron diversos estándares internacionales y se integraron metadatos de referencia de otros sistemas externos para facilitar la comparación y eventual interoperabilidad de los datos con plataformas de análisis y visualización, así como bases de datos marinos y oceanográficos, u otros repositorios científicos.

Con el apoyo de la Dirección de Impulso a la Innovación y Desarrollo (DIID), este sistema para la gestión de expediciones oceanográficas se encuentra en trámite de protección, folio MX/u/2020/000622, ante el Instituto Mexicano de Propiedad Intelectual (IMPI) para registro de propiedad intelectual por parte del CICESE, en donde se desarrolló el sistema.

Este esfuerzo, que inició en 2015, fue liderado por la Dra. Sharon Z. Herzka de la División de Oceanología y el Dr. Alexei Licea Navarro de la División de Biología Experimental y Aplicada, ambos de CICESE. La Dra. Layla Michán Aguirre de la Facultad de Ciencias de la UNAM y experta en recuperación, sistematización, curación y procesamiento de información especializada, se incorporó al grupo al inicio del proyecto (abril 2015) durante una estancia sabática en CICESE, y permaneció como asesora externa a partir del 2017. Además, el grupo estaba integrado por tres programadores: los M. en C. en Ciencias de la Computación Saúl Delgadillo Ramírez, Julio Antonio Juárez Jiménez, y Ana Karen Velázquez Sánchez, y una curadora de datos, la M. en C. en Ciencias de la Vida, Rosa Paola Ramírez. Más adelante dejarían el equipo los M. en C. Juárez Jiménez y Velázquez, y se incorporaron los desarrolladores M. en C. Manuel Combarro Simón y la Ing. Alma Carmina Llamas Valenzuela. Los programadores y curadores son orgullosamente egresados de maestrías del CICESE.

Descripción del “Sistema para la planeación, ejecución, almacenamiento y gestión de
datos de cruceros oceanográficos”

El sistema se organiza en dos componentes principales: el Módulo Cruceros y el Módulo Resultados de Análisis. Ambos componentes son accesibles a través de una interfaz web que permite la edición y consulta de dicha información de forma controlada mediante permisos a diversos niveles.

El Módulo Cruceros es una plataforma diseñada para la captura de planes de campaña, incluyendo el derrotero y esquema de muestreo, así como los resultados de su ejecución, que abarca la generación de inventarios detallados de las muestras recolectadas, el equipo utilizado, y el personal a bordo.

El Módulo Resultados de Análisis centraliza los resultados de todas las mediciones y análisis posteriores a un crucero o monitoreo, y además facilita la evaluación de calidad de los resultados, mediante dos niveles de etiquetas de calidad asignadas, uno por los responsables de generar los datos, y otro por los coordinadores científicos del proyecto. También contiene herramientas para consultar, buscar y descargar datos y metadatos en
formato excel y csv, lo cual permite exportar los datos a Ocean Data View (ODV, https://odv.awi.de) así como otras plataformas de análisis y visualización, según las necesidades o intereses del usuario.

Esquema conceptual del Módulo Cruceros y Módulo Resultados de Análisis.

Las interfaces del sistema se diseñaron para ser amigables para el usuario, así sea un Jefe de Crucero, un investigador, o cualquier persona interesada en la descarga los resultados de análisis de las muestras colectadas y sus metadatos. Además la plataforma cuenta con guías detalladas en las cuales se describe cómo generar informes de campaña, mapas de muestras recolectadas, así como hacer búsquedas generales o específicas de los resultados.

En el sistema se implementó un esquema de metadatos que permite establecer los créditos y licencias de uso de la información. También incluye un esquema de permisos para administrar el acceso a los datos de acuerdo a los convenios establecidos en el proyecto. El sistema puede configurarse para gestionar múltiples expediciones y diversos tipos de datos y adaptarse a las necesidades de otros proyectos e instituciones. Esto se puede hacer de
manera conjunta o independiente a la base de datos actual. El Módulo Cruceros y el Módulo Resultados de análisis representan una herramienta altamente flexible e innovadora en el mercado que puede adaptarse a cualquier tipo de programa de muestreo o monitoreo oceanográfico, y probablemente también a sistemas de agua dulce y terrestres. El grupo MMD y el CICESE esperan promover el uso de este sistema para contribuir al manejo,
almacenamiento y permanencia de datos oceanográficos, así como facilitar el intercambio de datos entre múltiples instituciones.

Esquema conceptual detallado del Módulo Cruceros y Módulo Resultados de Análisis.

Texto e Infografía: Sharon Z. Herzka, Rosa Paola Ramírez, Saúl Delgadillo, Carmina Llamas, Manuel Combarro. Grupo MMD de CIGoM-CICESE.