Passer au contenu principal

Les données stockées dans un entrepôt externe

À l'inverse du versement au service des archives par un bordereau, c'est le cas de figure du dépôt par le chercheur dans un entrepôt externe qui est présenté ici. Il en existe de plusieurs types et de différentes envergures, en voici quelques exemples :

  • Recherche Data Gouv est un entrepôt interdisciplinaire et gouvernemental, mis à disposition par le ministère de l'enseignement supérieur et de la recherche pour ses communautés. Il propose une documentation fournie et notamment un outil d'aide à la rédaction de data paper pour les données qu'il accueille.
  • Nakala est un entrepôt de données spécialisé dans les sciences humaines et sociales, mis à disposition par la TGIR (pour Très grande infrastructure de recherche) HumaNum. Il propose différents outils d'exposition notamment par le biais de son plug-in Nakala-Press qui permet de créer un site comme un vitrine pour les jeux de données accueillis.
  • Zenodo, enfin, est une infrastructure à l'échelle européenne et interdisciplinaire qui propose un stockage sécurisé et pérenne pour des jeux de données académiques.

Ces entrepôts se caractérisent par le fait que le dépôts est effectué par le chercheur lui-même sur la plateforme, sans accompagnement de la part du service des archives. Il reste donc entièrement responsable de leur mise à disposition, par le choix ou non de l'application d'une barrière de consultation ou d'un embargo. Les entrepôts externes, de leur côté, se limitent à offrir une solution d'hébergement pérenne et sécurisé aux données, avec l'application d'un identifiant stable de type DOI, Handle ou ARK.

Les identifiants pérennes et référencements/liens établis entre les différents corpus sert de base au travail d’analyse des données, pour une exposition par le biais d’une publication ou d’une actualité sur un site internet, d’une base de données publiée ou d’un data paper.paper. On peut se référer à ce sujet au schéma explicitant le cycle de vie de la donnée à l’EFA, mettant en lumière les étapes entre le dépôt d’une donnée et la mise en valeur des résultats acquis.

Une fois les résultats publiés, il est recommandé d’établir un lien entre la publication et les jeux de données entreposés grâce à l’identifiant pérenne, afin d’assurer une meilleure reproductibilité et capacité de citation.

20210915-plateformes.png