Pourquoi verser mes données ?
- Un constat de départ
- Enjeux techniques
- Enjeux éthiques et légaux
- Enjeux d'exploitation des données scientifiques
- Enjeux de valorisation de mes données
Un constat de départ
- 90% des chercheurs disent « effectuer de manière individuelle le stockage, l’archivage ou la transmission de leurs données. » (European Commission, Directorate-General for Research and Innovation, O'Carroll, C., Hyllseth, B., Berg, R., et al., Providing researchers with the skills and competencies they need to practise Open Science, Publications Office, 2017, https://data.europa.eu/doi/10.2777/121253. Cité par DATACC, “Gestion des données : une nouvelle exigence, de nouvelles compétences », disponible sur le Web : https://www.datacc.org/bonnes-pratiques/adopter-un-plan-de-gestion-des-donnees/gestion-des-donnees-une-nouvelle-exigence-de-nouvelles-competences/#note. Consulté le 26/04/2023.)
- En 2016, on estimait que 80 % des données produites durant les 20 dernières années étaient « perdues faute de politique de sauvegarde coordonnée », tous domaines de recherche confondus. (Exposé des motifs de la loi pour une République numérique, consulté sur Legifrance. Cité par DATACC, « Gestion des données : une nouvelle exigence, de nouvelles compétences », disponible sur le Web : https://www.datacc.org/bonnes-pratiques/adopter-un-plan-de-gestion-des-donnees/gestion-des-donnees-une-nouvelle-exigence-de-nouvelles-competences/#note. Consulté le 26/04/2023. )
Le dépôt des données répond à des enjeux éthiques et légaux, techniques, mais aussi d’exploitation et de valorisation de la production scientifique.
Enjeux techniques
- L’étude et la publication des données se fait sur le temps long alors que les supports de stockage (disques durs et clés USB) sont fragiles et soumis aux contingences matérielles. Si les données d’une mission de 2021 sont stockées sur un disque dur mais non déposées au service des archives, et que celui-ci est remporté sur le terrain l’année suivante et égaré, volé ou endommagé, l’ensemble des données sera perdu.
- Certains supports de stockage sont concernés par une obsolescence rapide. Qui plus est l’érosion de ces supports est invisible : ils peuvent ne plus fonctionner du jour au lendemain. Les CD-Rom versés il y a quelques années sont d’ores et déjà devenus difficiles à lire.
- Les logiciels et les formats deviennent rapidement obsolètes. Les fichiers déposés aux service des archives sont régulièrement migrés afin qu’il soit toujours possible de les ouvrir.
- Les serveurs des archives de l’EFA sont répliqués et sauvegardés. Ils sont donc mieux protégés qu’un ordinateur individuel.
Enjeux éthiques et légaux
- Les données produites dans le cadre des missions de l’EFA sont des données publiques même si le chercheur en est l’auteur. Pour en savoir plus, voir la fiche : Le statut des données.
- Elles s’inscrivent donc dans le cadre de gestion des archives publiques. La gestion, et parfois le dépôt des données, est une exigence des financeurs. Pour en savoir plus, voir la fiche : Les aspects législatifs.
- Verser mes données permet de me prémunir contre le plagiat : le dépôt authentifie le producteur et la date de dépôt. La base Archimage indique ainsi de manière explicite la date de découverte, l’auteur, le statut (inédit ou publié) de chaque donnée.
- Le versement des données n’est pas synonyme de diffusion immédiate. Pour en savoir plus, voir la fiche : Que deviennent mes données déposées à l’EFA ?
Enjeux d'exploitation des données scientifiques
- Le dépôt des données me permet de retrouver et de retravailler mes données, alors que la masse de données est de plus en plus importante.
- Les missions nécessitent de pouvoir exploiter les données précédemment produites. Une étude est impossible si les données précédemment versées au retour d’une mission de terrain n’ont pas été versées et ne sont pas correctement construites et décrites.
- Le dépôt des données permet d’exploiter dans un nouveau contexte de recherche des outils précédemment produits, une base de données par exemple, permettant ainsi à la recherche de gagner en efficacité.
→ Pour être utilisables, les données déposées doivent donc être documentées. Pour en savoir plus, voir les fiches : Qu’est-ce qu’une donnée de qualité ? ; Quels référentiels utilise-t-on à l’EFA ? ; Quelles métadonnées utilise-t-on à l’EFA ?
Enjeux de valorisation de mes données
- Déposer mes données permet de les rendre visibles, ou du moins leur existence visible : le dépôt des données constitue un second point d’accès vers mes travaux en sus de mes publications, grâce à leur signalement sur différentes plateformes.
- Déposer mes données me permet d’être facilement identifié comme leur inventeur : mes travaux pourront être facilement cités. Il est aussi plus facile de citer d’autres travaux. Ce peut être aussi un moyen de susciter de nouvelles collaborations scientifiques. Pour en savoir plus : Données et identité numérique du chercheur.
- Mes données déposées peuvent être utilisées pour accompagner des publications, comme dans les récents articles du BAEFE. Pour en savoir plus : Comment valoriser mes données produites à l’EFA ?