Les guides de l'entrepôt
Les plans de gestion de données et l'entrepôt Recherche Data Gouv
Les plans de gestion de données
Les plans de gestion de données (PGD) sont des documents opérationnels qui fournissent des informations importantes sur les données produites, des conditions de leur collecte ou de leur production jusqu’à leur publication. Les agences de financement, dont l’ANR, demandent qu’ils soient produits après le début du projet et régulièrement mis à jour. Au delà de ces aspects contractuels, il s’agit d’une « bonne pratique » dans le cadre du montage ou du déroulement d’un projet de recherche qui permet d’explorer toutes les problématiques autour de la gestion et du partage des données.
La publication des plans de gestion de données doit être encouragée dans le cadre d’une démarche de science ouverte car elle facilite la réutilisation des jeux de données. Concernant l’entrepôt Recherche Data Gouv, il est conseillé d’observer les consignes suivantes :
Pratique recommandée
- Le dépôt des PGD dans HAL et la réalisation du référencement transversal (liens réciproques entre le(s) jeu(x) de données et le plan de gestion de données).
Pratique fortement déconseillée
- Le dépôt de PGD dans Recherche Data Gouv, comme unique élément d’un jeu de données.
Cette recommandation s’adresse à tous mais chaque espace institutionnel conserve sa politique propre.
Précisions
Il existe aujourd’hui dans HAL un sous-type de document « Plan de gestion de données » (sous-ensemble de « Rapport » ), permettant de les publier en tant qu’objets numériques dûment signalés, de les citer et de générer des liens depuis, et vers, les autres productions scientifiques.
Compte tenu de cette évolution, le centre de ressource entrepôt-catalogue déconseille vivement le dépôt dans l’entrepôt Recherche Data Gouv d'un jeu de données constitué du seul PGD, sans les données qui lui sont rattachées. Cette pratique revient à faire faussement compter les PGD comme des jeux de données. Elle détourne la finalité première de l’entrepôt, qui est d’accueillir des données structurées.
La pratique de dépôt d’un PGD en tant que partie et document d’accompagnement d’un jeu de données n’est pas mauvaise, mais elle est limitante. En effet, elle ne permet pas de lier un même PGD à plusieurs jeux de données, ni de décrire le PGD par des métadonnées autres que celles du jeu de données dont celui-ci fait partie. Elle implique que le PGD n’est publié que si un jeu de données associé l’est également. Elle n’est donc pas recommandée.
Pour approfondir
- https://anr.fr/fr/lanr/engagements/faq-pgd/
- https://dmp.opidor.fr/static/glossary
- https://doranum.fr/plan-gestion-donnees-dmp/le-plan-de-gestion-de-donnees-pas-a-pas_10_13143_t94g-9j96/
- https://science-ouverte.inrae.fr/fr/les-donnees-et-le-numerique-scientifiques/gerer-des-donnees-et-des-codes/comment-rediger-un-plan-2
- https://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
- https://coop-ist.cirad.fr/gerer-des-donnees/rediger-un-pgd/1-qu-est-ce-qu-un-pgd