Noticias

Analizan uso abierto de datos de investigación en la UCR

César A. Parral
Meilyn Garro Acón
11. 08. 16

La Vicerrectoría de Investigación convocó a un grupo de investigadores de unidades que generan grandes volúmenes de datos de investigación para conversar sobre la posibilidad de compartir esos datos para promover la investigación.

De izquierda a derecha: M.Sc. Agustín Gómez Meléndez, Dra. Henriette Raventos Vorst, PhD. Hugo Hidalgo León y M.Sc. Saray Córdoba González, expositores en la mesa redonda sobre uso de datos de investigación.

La actividad se realizó el martes 9 de agosto en la sala Girasol de la Vicerrectoría de Investigación de la Universidad de Costa Rica y contó con la participación de cerca de veinte participantes de diferentes unidades de la UCR.

Los expositores (as) fueron la Dra. Henriette Raventos Vorst, investigadora del Centro de Investigación en Biología Celular y Molecular (CIBCM), el PhD. Hugo Hidalgo León, investigador del Centro de investigaciones Geofísicas (CIGEFI) y el M.Sc. Agustín Gómez Meléndez, investigador del Observatorio del Desarrollo (OdD).  La moderación estuvo  cargo de la M.Sc. Saray Córdoba González, de UCRIndex de la Vicerrectoría de Investigación.

Los (as) investigadores se refirieron al tipo de datos disponibles en sus unidades, la forma en que se almacenan, que uso les ha dado o les podría dar en el futuro, qué limitaciones existen al uso de estos, sus opinión sobre las políticas de acceso abierto impulsadas por la Vicerrectoría y definir elementos para una política institucional sobre el uso de datos de investigación.

¿Datos públicos?

Según manifestaron los expositores, aunque la Universidad de Costa Rica es una Institución financiada con recursos públicos, eso no significa que todos los datos científicos con los que cuenta pueden compartirse con pares académicos o al público general.

En algunos casos los datos provienen de fuentes externas que tienen restricciones legales, no están ordenados o procesados,  el soporte en el que se almacenan no permite utilizarlos en una plataforma informática. Incluso en algunos casos están en formatos para los que se requiere algún programa informático  y su respectiva licencia.

Para la Dra. Raventós, se debe respetar el límite entre lo público y lo privado, límite que también se refleja en los datos, por lo que es fundamental mantener control sobre su uso por parte de terceros para evitar malos usos.

Recalcó que antes de compartir datos en repositorios públicos, es necesario un cuidadoso trabajo de curaduría que requiere personal y recursos económicos. En el caso del CIBCM, una de las preocupaciones más importantes es mantener el anonimato de los participantes, lo cual ha implicado procesos de negociación con los entes financiadores.

Tanto los exponentes como los participantes se refirieron a  algunos datos o  colecciones institucionales estratégicas sobre las cuales no conviene revelar sus características y ubicación, así lo manifestó el M.A. Félix Barboza Retana, encargado de la Sección de Registro de Colecciones de la UCR.

Por su parte el M.Sc. Gómez manifestó que lo primero que se debe hacer,  es definir el tipo de usuario de los datos; a partir de ahí se puede establecer lo que corresponde hacer con la información de que disponen algunas unidades académicas y de investigación.

Considera que los investigadores aún no están preparados para compartir datos; por ahora solo es posible compartir las publicaciones que resultan de dichos datos. Para que eso sea posible hay que cambiar el paradigma sobre la forma en que se utilizan esos datos actualmente.

Para el investigador, algunos criterios a tomar en cuenta para definir políticas en este campo son los costos, el tipo datos, estándares para datos y metadatos, acceso, privacidad, distribución, almacenamiento y preservación, políticas sobre re-uso y redistribución.

Los tres exponentes se refirieron a las limitaciones que tiene la normativa actual, especialmente los lineamientos de acceso abierto que ha impulsado la Vicerrectoría de Investigación, pues para algunos es prácticamente imposible de cumplir.

En este sentido la M.Sc. Córdoba informó a los presentes que justamente el jueves 11 de agosto del 2016 está programado un conversatorio sobre acceso abierto con la participación de investigadores y funcionarios (as) y autoridades de la Vicerrectoría de Investigación para escuchar las sugerencias de los investigadores (as) en este tema.

Los investigadores (as) también comentaron la posibilidad de crear algún tipo de plataforma o repositorio institucional que permita la recuperación y utilización de datos de investigación. Para ello debe tomarse en cuenta si existe alguna iniciativa o plataforma similar en la Institución. Se mencionó como ejemplo las bases de datos del Centro Centroamericano de Población (CCP).

Pero además sería necesario definir cómo se gestionarían, quien o quienes serían los responsables, que tipo de datos contendría, cómo se manejarían los datos y cuáles serían los usuarios de esa información.

En todo caso,  algunos de los participantes manifestaron que desarrollar un repositorio sería un proyecto complejo y caro.

Fomentar la investigación

La M.Sc. Saray Córdoba considera que compartir datos de investigación puede contribuir al fomento de la investigación, sin embargo, admitió que es importante tomar en cuenta algunas condiciones relacionadas con las políticas universitarias sobre el tipo de datos que se pueden compartir.

“Existe la posibilidad de compartir  lo que genera la UCR, pero también hay que valorar aquellos proyectos  que están financiados  externamente y que tienen algún tipo de restricción”, agregó.

La experta considera que lo primero que debe hacerse es generar una cultura y una política  de gestión de datos; para ello hay que tener una mente abierta  a fin de  evitar que las personas dentro de la Institución vean los datos como de su propiedad.

No obstante lo anterior, varios de los expositores y asistentes  expresaron sus reservas sobre una política irrestricta de acceso abierto  al conocimiento,  porque si no se toman algunas medidas,  ese saber puede ser utilizarse para fines que no necesariamente coinciden con la misión de la Universidad de Costa Rica.

Iniciativa de la CEPAL

La UCR participa en iniciativa de  Comisión Económica para América Latina (CEPAL) sobre gestión de datos de investigación desde el 2015, con M. Sc. Saray Córdoba González, Vicerrectoría de Investigación, como representante.  (VER INFORMACIÓN)

Algunos de los objetivos de esta iniciativa son crear conciencia sobre la gestión de datos de investigación y las políticas de investigación; dar a conocer los beneficios inherentes al compartir datos; fomentar la producción de políticas para la gestión de datos de investigación a nivel institucional;  definir buenas prácticas para compartir datos; y estimular la investigación sobre gestión de datos de investigación para descubrir nuevos roles y responsabilidades, infraestructura, capacitación, costos y aspectos legales.

De acuerdo con el proyecto Leaders Activating Research Network (LEARN), los datos de investigación corresponden a aquellos datos creados por los investigadores en el curso de su trabajo y es responsabilidad de la Institución velar por su curaduría y preservación.

Para el proyecto, los datos de investigación representan una fuente potencial de información para propiciar el crecimiento económico e intercambiar conocimiento, mediante su inclusión en el ciclo de la publicación científica. 

Si usted desea saber más sobre esta discusión, póngase en contacto con la M.Sc. Saray Córdoba  al correo-e:saray.cordoba@ucr.ac.cr

La Dra. Henriette Raventos Vorst, investigadora del Centro de Investigación en Biología Celular y Molecular (CIBCM), se refirió a la forma en que almacenan los datos en esa unidad de investigación y las precauciones que hay que tener con ellos.

PRINCIPALES PREOCUPACIONES

EXPRESADAS POR LOS INVESTIGADORES

  • Uso correcto de los datos: se debe mantener control sobre el uso de los datos por parte de terceros para evitar malos usos. Esto incluye la protección de datos sensibles y estratégicos.
  • Aspectos técnicos: almacenamiento de los datos, curaduría, mantener la integridad de los datos, definir formatos y software, y garantizar accesibilidad por parte de terceros.
  • Diversidad de los datos: cada unidad de investigación produce datos de diferente naturaleza que podrían tener diferentes necesidades de curaduría y mantenimiento.
  • Momento en que se hace la divulgación de los datos: se debe definir en qué momento se debe divulgar los datos. Muchas veces las publicaciones contienen datos que aún serán explotados por los investigadores y necesitan periodos de embargo más amplios.
  • Propiedad de los datos, licencias de uso y reconocimiento de los investigadores.
  • Pertinencia de los datos preservados: No es viable preservar todos los datos así que se debe definir los criterios para seleccionar los datos que se preservarán a mediano y largo plazo.