La investigación basada en datos es cada vez más común en todas las disciplinas científicas. Siendo éstos, una fuente de conocimiento fundamental para validar los resultados de investigación. Se utilizan como fuente para sustentar la investigación científica. Tanto es así su importancia que, una buena gestión de los datos de investigación, da como resultado una investigación eficiente y excelente. [FOSTER]
La «Ciencia en Abierto» (Open Science), implica una mayor transparencia, accesibilidad, reutilización, reproducibilidad de la investigación, que afecta a los datos generados para llegar al resultado de dicha investigación. Su objetivo es mejorar la calidad y la fiabilidad de la investigación. [Bezjak, Sonja, 2019]
Los Datos de Investigación se enmarcan en el movimiento "Open Science". Implica el acceso abierto no sólo a los resultados de investigación, (publicaciones científicas), si no también a los datos de investigación.
Los DATOS de INVESTIGACIÓN son aquellos materiales generados o recolectados durante el transcurso de una investigación. Son recursos valiosos que pueden usarse y reutilizarse para nuevas investigaciones o para duplicar y validar investigaciones existentes..
Existen múltiples definiciones sobre qué son los datos de investigación:
► Los datos de investigación son aquellos datos que son recolectados, observados o creados para ser analizados y producir resultados de investigación originales. [Fuente: Cepal]
► Los datos de investigación son aquellos materiales que sirven para certificar los resultados de la investigación que se realiza, que han sido registrados durante ella y que han sido reconocidos por la comunidad científica (Torres-Salinas; Robinson-García; Cabezas-Clavijo, 2012)
► La Universidad Australiana de Melbourne define en su política institucional de datos:
“Los datos de la investigación son hechos, observaciones o experiencias en que se basa el argumento, la teoría o la prueba. Los datos pueden ser numéricos, descriptivos o visuales. Los datos pueden ser en estado bruto o analizado, pueden ser experimentales u observacionales. Los datos incluyen: cuadernos de laboratorio, cuadernos de campo, datos de investigación primaria (incluidos los datos en papel o en soporte informático), cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografías, películas, y las comprobaciones y las respuestas de la prueba. Las colecciones datos para la investigación pueden incluir diapositivas; diseños y muestras. En la información sobre la procedencia de los datos también se podrían incluir: el cómo, cuándo, donde se recogió y con que (por ejemplo, instrumentos). El código de software utilizado para generar, comentar o analizar los datos también pueden ser considerados datos.” [Fuente: Melbourne Policy Library]
► Los datos de investigación abiertos se refieren a los datos que sustentan los resultados de la investigación científica, no tienen restricciones de acceso, lo que permite que cualquiera pueda acceder a ellos. [Fuente: European Commision]
Se reconoce que un óptimo intercambio internacional de datos, información y conocimiento contribuye de manera decisiva al avance de la investigación científica y la innovación.[Fuente: OCDE]
El conjuntos de datos reunidos durante la ejecución de un proyecto de investigación, se denominan DATASETs.
En Ciencia, los datos se recogen o recolectan para validar los resultados de una investigación original. Por esto es tan importante una adecuada selección de datos y su posterior recopilación. Una buena gestión de los datos, da como resultado una investigación eficiente y excelente.
Organizar y lograr que los datos sean accesibles es algo que cada vez adquiere mayor relevancia en el mundo de la ciencia, con el objetivo de mejorar la trazabilidad y fomentar el intercambio de datos. De esta forma se mejora la transparencia de los estudios, pero también se impulsa la reutilización de los datos en nuevas investigaciones que generen conocimiento en beneficio de la sociedad.[Fuente: Biodiversa.org]
El Instituto Universitario de Investigación en Gestión Forestal Sostenible (iuFOR), de la Universidad de Valladolid, hace especial himcapié en la importancia de la selección y recopilación de los datos [Fuente: Portal de datos del iuFOR. Fundamentos]:
Selección adecuada de datos
Los datos selecionados deben tener valor y precisión y además ser relevantes para solucionar el problema de estudio para el que se tomaron.
Es importante a la hora de seleccionar los datos, valorar también, qué técnica estadística se va a emplear para comprobar las hipótesis o conseguir el objetivo, y ser consciente de la naturaleza del objeto de estudio y del fenómeno que se quiere estudiar para elegir el método de muestreo más adecuado, el tamaño de la muestra, el número de repeticiones y las escalas de medida.
Recopilación de Datos
Una vez seleccionados los datos hay que volcarlos a una hoja de cálculo u hoja de datos en el ordenador. La estructura de la hoja o base de datos se tendrá que diseñar en función de la naturaleza del estudio. Se debe intentar conservar los datos brutos, en su estado original, con un identificador único. Esto nos permitirá conocer qué conjunto de datos se ha utilizado para un análisis, así como revisar/reutilizar estos datos en el futuro. Igualmente, la metodología de obtención de datos debe quedar también registrada. (Rodríguez-Sánchez, F., Pérez-Luque, A.J. Bartomeus, I., Varela, S. 2016)
Biblioteca CEPAL (Comisión Económica para América Latina y el Caribe) Biblioguías. Gestión de datos de investigación https://biblioguias.cepal.org/gestion-de-datos-de-investigacion
Bezjak, Sonja; [et al.] Manual de Capacitación sobre Ciencia Abierta. Foster, 2019 https://www.rebiun.org/acceso-abierto/manual-de-capacitacion-sobre-ciencia-abierta
Goudeseune L., Le Roux X., Eggermont H., Bishop W., Bléry C., Brosens D., Coupremanne M., Davis R., Hautala H., Heughebaert A., Jacques C., Lee T., Rerig G., Ungvári J. (2019). Guidance document for scientists on data management, open data, and the production of Data Management Plans. BiodivERsA report. https://doi.org/10.5281/zenodo.3448251
"iuFORdata". Portal de Datos. Instituto Universitario de Investigación en Gestión Forestal Sostenible (iuFOR), Universidad de Valladolid – INIA
OECD, Declaration on Access to Research Data from Public Funding, OECD/LEGAL/0321, 2021
Rodríguez-Sánchez, F., Pérez-Luque, A.J. Bartomeus, I., Varela, S. 2016. Ciencia reproducible: qué, por qué, cómo. Ecosistemas 25(2): 83-92. Doi.: https://doi.org/10.7818/ECOS.2016.25-2.11
Torres-Salinas, D., Robinson-García, N., & Cabezas-Clavijo, Álvaro. (2012). Compartir los datos de investigación en ciencia: introducción al data sharing. Profesional De La Información, 21(2), 173-184.https://doi.org/10.3145/epi.2012.mar.08
Iconos diseñados por Freepik desde www.flaticon.com con licencia CC 3.0 BY
Biblioteca de la Universidad de Valladolid. licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional.