Les guides de l'entrepôt
Avant de déposer
S’assurer que les données n’ont pas été déposées dans un autre entrepôt.
-
Si les données ont été déposées dans un autre entrepôt et qu’un identifiant unique et pérenne leur a été attribué lors du dépôt, il ne faut pas les déposer à nouveau dans l’entrepôt Recherche Data Gouv (car ce dernier leur attribuerait automatiquement un nouveau DOI).
-
Si les données ont déjà été déposées mais qu’un identifiant unique et pérenne ne leur a pas été attribué lors du dépôt, il est possible de créer un jeu de données dans l'entrepôt Recherche Data Gouv pour obtenir un DOI, mais sans y déposer les fichiers. Un lien vers les données sera précisé dans la métadonnée dédiée : « Lien vers les données ».
L’identifiant unique et pérenne de données répond aux principes Facile à trouver et Accessible. Cela permet, via un lien hypertexte, de retrouver le jeu de données même si sa localisation a changé.
Vérifier que les données peuvent être partagées, en tenant compte :
- de l’accord des co-auteurs
- des contrats ou réglementations
- des réglementations autour des données à caractère personnel et/ou données sensibles.
Préparer les données
- Vérifier que les fichiers sont conformes aux bonnes pratiques suivantes, ainsi qu’aux recommandations de la discipline si elles existent :
-
suivre une convention de nommage
-
préférer des formats de fichier ouverts ou largement utilisés par la communauté, compatibles avec une préservation à long terme (voir l’outil FACILE)
-
s'assurer de la bonne cohérence et organisation des données au sein d’un jeu de données.
-
Utiliser une convention de nommage, organiser et utiliser des formats ouverts pour les fichiers répond au principe Interopérable. L’utilisation de recommandations communautaires répond au principe Réutilisable.
Préparer la documentation des données
Fournir toutes les informations nécessaires à la compréhension de vos données.
- Certaines informations seront fournies par le biais des métadonnées au moment du dépôt, en particulier les références des documents (publications, plan de gestion de données), financements, projets, jeux de données ou autres produits de recherche en lien avec le dépôt. Mentionner autant que possible les identifiants pérennes associés à ces objets.
- Chaque fichier ou ensemble de fichiers doit être accompagné des informations sur les données permettant leur réutilisation. Ceci peut se présenter sous différentes formes :
- Un format de données auto-documenté (exemple NetCDF - Network Common Data Form)
- Un dictionnaire de données qui répertorie et définit les métadonnées des données contenues dans une base de données, un fichier ou une application. Le dictionnaire de données est fourni dans un fichier tabulé distinct afin de faciliter l’analyse des données.
- Un fichier README qui apporte des informations complémentaires.
Fournir une documentation aussi complète que possible suivant les pratiques énoncées ci-dessus facilite la Réutilisation des données.
Identifier son espace de dépôt
-
Identifier l’espace institutionnel de l’un des auteurs, puis la collection dans laquelle le jeu de données sera accessible (par exemple : collection de laboratoire, de projet, etc.).
-
Se rendre dans la collection identifiée et vérifier que le bouton Ajouter des données > Nouveau jeu de données s’affiche :
Si ce bouton n’apparaît pas, cela signifie que des droits sont requis pour déposer. Dans ce cas, contacter l’administrateur de la collection, via le bouton Contact. -
Si aucune collection appropriée n’est identifiée, contacter l’administrateur de l’espace institutionnel, via le bouton Contact.
-
-
Si ni le déposant ni les co-auteurs n'ont d'espace institutionnel, se rendre dans l'espace générique et demander les droits, via le bouton Contact.