Buenas prácticas de publicación
Existen algunas prácticas que se recomiendan para la publicación de información científica y datos de investigación, las que se describen a continuación.
Información
-
Utilizar una licencia abierta
1. Utilizar una licencia abierta
Se recomienda usar alguna de las licencias Creative Commons con atribución para la literatura científica. Estas licencias permiten al titular de los derechos autorizar el uso de las obras por terceras personas sin perder los derechos de atribución de las obras creadas.
Estas licencias no sólo son documentos legales, sino que también incluye una explicación simple de los derechos y obligaciones que confiere al usuario, además de una aplicación en lenguaje de máquina para identificar la obra en Internet mediante el empleo de opciones avanzadas de búsqueda en buscadores como Google y Yahoo!. Además, las licencias Creative Commons están disponibles en más de una treintena de idiomas, incluidos el castellano, francés, inglés, japonés, chino y ruso, entre otros. De esta forma, el idioma no es una traba para los usuarios de las obras licenciadas con licencias Creative Commons.
Estas ventajas justifican la recomendación del uso de las licencias Creative Commons. Sin embargo, otras licencias abiertas también podrían ser usadas.
◂ Volver × - Asesorarse por especialistas
-
Crear repositorios institucionales
3. Crear repositorios institucionales
Si bien, publicar la literatura científica en un sitio web personal es un primer paso para el acceso abierto, tiene el riesgo de que el sitio sea borrado por descuido o que la información deje de estar disponibles si algo le ocurre al dueño del sitio. Para que el acceso a la información perdure, se recomienda publicarla en lugares más estables como repositorios institucionales.
Además de que facilitan la perdurabilidad de la información publicada, los repositorios institucionales aumentan la visibilidad de las publicaciones y permiten establecer vínculos entre ellas a través de los metadatos.
◂ Volver × -
Utilizar repositorios interoperables
4. Utilizar repositorios interoperables
Las principales plataformas de repositorios abiertos permiten la búsqueda federada de documentos y cosechar registros entre ellos de manera automática. Para que ello sea posible se requieren estándares de interoperabilidad para los metadatos de los documentos y para la comunicación entre los repositorios.
El principal estándar de metadatos es Dublin Core, que define un conjunto de atributos mínimos (título, resumen, autores, materias, fechas, etc.) que debieran describir cada documento de un repositorio.
La Open Archive Initiative (OAI) es la principal autoridad en la definición de estándares de interoperabilidad entre repositorios abiertos. Entre los estándares definidos se encuentran un protocolo de cosecha de metadatos, un estándar para describir e intercambiar descripciones de agregación entre componentes de recursos y un marco para sincronización de archivos.
Entre las plataformas de respositorios documentales existentes se recomienda la utilización de DSPace, por su robustez, flexibilidad y satisfactorio soporte de los estándares abiertos de metadatos y comunicación entre repositorios.
◂ Volver ×
Datos
-
Utilizar una licencia abierta
1. Utilizar una licencia abierta
Se recomienda usar la licencia Creative Commons Cero (CC0). CC0 es un modelo de licenciamiento que dedica e identifica una obra como parte del dominio público. Permite al titular de los derechos autorizar el uso de las obras (los datos, en este caso) por terceras personas.
En la actualidad, la Licencia CC0 se emplea en diversas iniciativas para facilitar el acceso. La British Library ha liberado cerca del 20% de su información de catalogación con más de tres millones de registros. La Organización Europea para la Investigación Nuclear, OpenLibrary y OpenJurist han usado CC0 para liberar datos bibliográficos, al igual que la Biblioteca, Archivo y Museo digital Europeana; el repositorio de datos genéticos de Genomes Unzipped; el repositorio de fotografía e imágenes aéreas y satelitales de MichiganView y el portal de datos abiertos del gobierno de Holanda. Otros organismos internacionales consideran usar la Licencia CC0 como la herramienta legal para poner sus contenidos a disposición de los usuarios.
◂ Volver × -
Observar cómo lo hacen los pares
2. Observar cómo lo hacen los pares
Las ciencias son diversas y heterogéneas. Los formatos y procedimientos difieren entre las comunidades. Existen formatos para codificar series de tiempo para sensores meteorológicos, para modelar redes sociales, para codificar secuencias de ADN, etc. Es posible que en su área exista un formato estándar y abierto especializado para los datos de su investigación. Al publicar en ese formato facilitará a sus pares la reutilización de sus datos. Cuando no exista ese formato, lo más conveniente es basarse en un formato estándar y genérico como XML o HDF, que poseen una gran variedad de herramientas para su manipulación. Además, están bien documentados lo que permite ahorrar esfuerzo al momento de describir los datos.
◂ Volver × -
Asesorarse con especialistas
3. Asesorarse con especialistas
La publicación y gestión de datos es una tarea intrínsecamente interdisciplinaria. Por ello puede ser útil pedir asesoría a profesionales del área de las ciencias de la información e informática, en particular a quienes se dedican a la gestión de datos y que tienen vocación por el acceso abierto.
◂ Volver × -
Describir los datos
4. Describir los datos
Para ayudar a usar los datos publicados, hay que proveer una descripción de los mismos: lo que contienen, quién los obtuvo, cuándo, qué metodología se usó, el identificador del artículo donde se generaron, cómo se estructuran y cómo se pueden usar. Estas descripciones (o metadatos) pueden ir incrustadas en los datos (como parte del archivo descargable) o en la ficha de un catálogo de datos. Siempre que un formato de archivo permita incrustar metadatos, es recomendable hacerlo.
La Web es el estándar mundial para el intercambio de información y de datos. En ella también existe un estándar denominado RDF que permite describir datos y enlazarlos (en el nivel de los metadatos) con otros datos publicados en la Web. Usar RDF para describir los datos es una buena práctica.
◂ Volver × -
Asignar un identificador a los datos
5. Asignar un identificador a los datos
Para poder referenciar los datos hay que identificarlos con un sistema estándar. De este modo, ese identificador se podrá usar tanto en el artículo para el que se generaron los datos como en artículos de otros investigadores que reutilicen esos datos. En la web, un buen identificador son las URL, por su globalidad y porque permiten acceder a información sobre el objeto identificado. De este modo, la manera más sencilla de publicar los datos es asignarles una URL que permita descargar el archivo y acceder a su descripción.
Si bien las URL pueden facilitar el acceso a los datos, en el largo plazo pueden presentar limitaciones. Un problema común es la desaparición del sitio donde se publicaban archivos de datos o cambios en su dominio. Una solución son los identificadores generados a partir de los datos y que son independientes del lugar donde éstos se publiquen.
El uso adecuado de identificadores en los datos y en los artículos facilitará la formación de una red virtuosa entre la literatura científica y los datos.
◂ Volver × -
Asegurar la perdurabilidad de los datos
6. Asegurar la perdurabilidad de los datos
Publicar los datos en un sitio web personal tiene el riesgo de que el sitio sea borrado por descuido o que los datos dejen de estar disponibles si algo le ocurre al dueño del sitio. Para que los datos perduren se recomienda publicarlos en lugares más estables como repositorios institucionales de datos o en repositorios abiertos. Si en su organización no existe un repositorio para datos, se debe fomentar la creación de uno.
◂ Volver × -
Considerar el uso de bases de datos
7. Considerar el uso de bases de datos
En muchos casos puede que los datos estén contenidos en un archivo y sean procesados mediante alguna aplicación disponible o que haya sido creada durante la investigación. En estos casos, cuando se trate de archivos pequeños, publicarlos en un repositorio pareciera ser el camino adecuado. En cambio, cuando los investigadores necesitan gestionar los datos de manera colaborativa, resulta más apropiado usar una base de datos.
Garantizar el acceso a datos contenidos en una base de datos implica aspectos adicionales a tomar en cuenta. Entregar acceso de lectura a una base de datos puede ser algo complejo cuando hay operaciones que implican mucho costo de cómputo. Además, gestionar una base de datos requiere definir permisos de lectura y de escritura para los distintos recursos albergados. Por ello, no resulta claro cómo extender la definición de “abierto” a las bases de datos, pero un requisito razonable es permitir a todos la posibilidad de replicar los datos en una base de datos propia.
◂ Volver ×