Les guides de l'entrepôt
L'essentiel sur l'entrepôt Recherche Data Gouv
Présentation de l’entrepôt
L'entrepôt Recherche Data Gouv permet à la communauté scientifique française de publier les données de recherche issues de la recherche publique. Il est développé à partir de la solution logicielle libre Dataverse.
Le dépôt des données dans l’entrepôt Recherche Data Gouv permet de satisfaire en partie les principes FAIR (Facile à trouver, Accessible, Interopérable et Réutilisable). Quelques actions qui permettent de renforcer la mise en pratique de ces principes sont mises en évidence dans ce guide. |
En déposant dans l’entrepôt, le déposant s’engage à respecter les Conditions Générales d'Utilisation et ainsi à contribuer à la qualité de l’entrepôt. Le déposant est responsable des données, métadonnées et contenus qu’il publie.
Organisation des contenus
L’entrepôt Recherche Data Gouv contient des jeux de données (datasets) organisés en collections arborescentes (dataverses).
Qu’est-ce qu’un jeu de données ?
Un jeu de données est un ensemble cohérent de données brutes ou dérivées, auquel sont associées des métadonnées qui permettent de décrire ces données (présentation, date de publication, identifiant pérenne, mots-clefs, couverture géographique, couverture temporelle, etc.). Les données qui composent un jeu de données peuvent être de natures différentes (textes, chiffres, images, etc.). Un fichier peut être relié au jeu de données.
Un DOI est attribué automatiquement à chaque jeu de données déposé dans l'entrepôt Recherche Data Gouv.
Qu’est-ce qu’une collection ?
Une collection est un espace dédié aux jeux de données d’un collectif (laboratoire, projet de recherche, etc.) ou d’une thématique.
Chaque collection peut contenir :
- des sous-collections
- des jeux de données
- des fichiers
Qu’est-ce qu’un espace institutionnel ?
Un espace institutionnel est une collection créée à la demande d’un établissement de recherche français et dont l’administration et la curation lui sont déléguées. Un espace institutionnel contient des jeux de données pouvant être réunis en collections ou sous-collections.
Qu’est-ce que l’espace générique ?
L’espace générique désigne la collection dans laquelle les déposants ne disposant pas d’un espace institutionnel peuvent déposer leurs jeux de données. L’espace générique peut contenir des collections d’unités dans le cas particulier où aucune tutelle ne dispose d’espace institutionnel. Pour créer une collection d’unité, remplir le formulaire de demande.
Sur la page d’accueil, un carrousel permet d’accéder directement aux collections associées aux établissements (espaces institutionnels), et à l’espace générique.
Curation des jeux de données
Afin de garantir un niveau minimal de qualité, le jeu de données fait l’objet d’une curation, c’est-à-dire une série de vérifications portant sur la conformité et la complétude de certaines métadonnées et de la documentation, la validité des liens, etc. Cette opération peut avoir lieu avant ou/et après la publication du jeu de données. Des modifications peuvent être demandées à l’auteur du dépôt à cette occasion. Pour plus d’informations, voir le guide du curateur.
Organisation de l’accompagnement
Si l’un des auteurs du jeu de données est rattaché à un espace institutionnel, c’est l’équipe support de cet espace qui accompagne le déposant (si plusieurs auteurs sont rattachés à plusieurs espaces institutionnels, les auteurs se mettront d’accord).
Dans le cas contraire, l’accompagnement du déposant relève du Centre de ressources de l’entrepôt.
Les Ateliers de la donnée peuvent également apporter une aide de proximité tout au long du cycle de vie des données. Pour identifier l’Atelier de la donnée qui peut vous accompagner, consultez le portail Recherche Data Gouv.