Según la Estrategia Nacional de Ciencia Abierta (ENCA) 2023-2027, “los datos de investigación son todo aquel material que ha sido generado, recopilado, observado o registrado durante el ciclo de vida de un proyecto de investigación y que se utiliza como evidencia de un proceso de investigación, está reconocido por la comunidad científica y sirve para validar los resultados de la investigación y garantizar su reproducibilidad.”  

Siguiendo lo establecido en el artículo 37.5 de la Ley 17/2022, por la que se modifica la Ley 14/2011, de la Ciencia, la Tecnología y la Innovación, así como con el artículo 12 de la Ley Orgánica del Sistema Universitario (LOSU), la Estrategia aborda la necesidad de dotar a los datos de los atributos que componen los principios FAIR, necesarios para garantizar su transparencia y reproducibilidad. 

¿Qué son los Principios FAIR? 

En marzo de 2016, la revista Nature publicó el artículo Principios FAIR para la gestión y administración de datos científicos en el que un amplio grupo participantes del mundo de la investigación académica manifestaba la necesidad urgente de mejorar la infraestructura de apoyo a la reutilización de datos académicos, diseñando un conjunto conciso y medible de directrices para una buena gestión de datos que definieron como Principios de Datos FAIR, un requisito esencial para publicar datos abiertos útiles y de alta calidad.  

FAIR es al mismo tiempo un estado deseado para la ciencia (“fair” significa en inglés ‘justo’, ‘equitativo’, ‘imparcial’…) y un acrónimo de los cuatro principios fundacionales que han de servir para orientar tanto a creadores de datos como a editores: Findable, Accesible, Interoperable, Reusable. 

FINDABLE 

Si queremos abrir nuestros datos de investigación, necesitamos encontrar un lugar para almacenarlos donde resulten fáciles de localizar, esto es, repositorios institucionales o temáticos de acceso abierto, como  e-CienciaDatos en la UNED. Además, tienen que incluir un identificador persistente (DOI, Handle, ARK, SWHID, o una URI/URL única permanente), así como los metadatos necesarios para su localización y uso. 

ACCESIBLE 

Conviene que los datos de investigación sean también accesibles, es decir, lo más abiertos posible, de forma que otros investigadores no tengan que recopilar los mismos datos de nuevo. Es igualmente importante para la verificación durante el proceso de revisión y, además, aumentará el impacto del trabajo de investigación.   

Existen algunas razones legítimas para restringir el acceso a los datos, por ejemplo, en caso de datos sensibles, pero estas razones deben justificarse. En general, la regla de la Comisión Europea es ‘as open as possible and as closed as necessary’ (tan abierto como sea posible y tan cerrado como sea necesario).  

INTEROPERABLE 

Es decir, el conjunto de datos sigue estándares y normas, así como formatos abiertos. 

La interoperabilidad es la capacidad de los datos o herramientas de los recursos de investigación para integrarse o trabajar juntos con un esfuerzo mínimo. Podemos hacer que nuestros datos de investigación sean interoperables utilizando un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento. Esto facilitará la combinación de conjuntos de datos de investigación de diferentes fuentes en un único conjunto de datos. También deberíamos preferir formatos de datos abiertos para hacer que los datos de investigación sean accesibles para todos. 

REUSABLE 

Los datos deben poder reutilizarse y, para ello, es necesario publicarlos bajo licencias de reutilización claras y accesibles, con archivos readme, diccionarios de datos, etc. 

Al asignar una licencia al artículo científico, el investigador conserva los derechos de autor, pero otorga a otros el derecho de utilizar su trabajo bajo ciertas condiciones. Si queremos publicar datos abiertos, necesitamos una licencia abierta. Creative Commons proporciona un conjunto de licencias para trabajos originales y creativos, como artículos de acceso abierto y, en algunos casos, conjuntos de datos de investigación. La atribución CC BY es la licencia Creative Commons más permisiva. También existen licencias libres disponibles para el depósito de datos, en las que se establece que los datos que se depositan son originales y no infringen ningún derecho de otros autores.  

¿Cuándo tengo que depositar los datos de investigación? 

Desde el año 2022, y con la modificación de la Ley de la Ciencia, la Tecnología y la Innovación de 2011, el personal de investigación del sector público o cuya actividad investigadora esté financiada mayoritariamente con fondos públicos, deberá depositar una copia de la versión final aceptada para publicación y los datos asociados a las mismas en repositorios institucionales o temáticos de acceso abierto, de forma simultánea a la fecha de publicación. 

En líneas generales, se recomienda que sea lo antes posible, y dentro de los plazos establecidos en el Plan de Gestión de Datos, asegurando el acceso abierto bajo licencia CC BY, CC 0 o equivalente, siguiendo el principio tan abierto como sea posible, tan cerrado como sea necesario.  

En caso de dudas, existen herramientas como FAIR-Checker que evalúan de forma automática si un conjunto de datos es FAIR al insertar su DOI. 

En la Biblioteca de la UNED te podemos asesorar para el depósito y gestión de tus datos de investigación en e-CienciaDatos, el repositorio de datos de carácter multidisciplinar del Consorcio Madroño. 

Foto de UX Indonesia en Unsplash