Quelles données de recherche ?

Mis à jour : 13/03/2023

Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche.

Définition proposée par l’OCDE dans son rapport « Principes et lignes directrices pour l’accès aux données de la recherche financée sur fonds publics de 2007 ». https://www.oecd.org/fr/science/inno/38500823.pdf

 

Recherche Data Gouv met à disposition des jeux de données de recherche achevées. Ces jeux de données sont ouverts ou partagés en accès restreint quand des exceptions légitimes encadrées par la loi l’imposent, par exemple en ce qui concerne le secret professionnel, les secrets industriels et commerciaux, les données personnelles.

Les ateliers de la donnée accompagnent les équipes de recherche tout au long du cycle de vie de la donnée, par contre l’entrepôt et le catalogue de données de Recherche Data Gouv ne soutiennent que la partie aval du cycle de vie de la donnée relatif à la diffusion de jeux de données achevées.

Le premier tiers de ce cycle qui couvre les étapes de collecte, création, stockage et de traitement des données pour aboutir à des données scientifiquement validées, se déroule au sein des laboratoires en mobilisant des services de stockage et de calcul. L’entrepôt de données de Recherche Data Gouv n’est pas une solution de stockage pour les données en cours de traitement.
L’entrepôt de données Recherche Data Gouv intervient à partir du deuxième tiers du cycle de vie des données, au niveau du dépôt et de la publication des données scientifiques validées et de la curation des jeux de données en effectuant une vérification des métadonnées et des fichiers de données déposés dans l’entrepôt.

 

L’entrepôt et le catalogue Recherche Data Gouv interviennent également au niveau du troisième tiers du cycle de vie des données, qui consiste à exposer des données citables, à travers l’ouverture ou le partage (accès restreint) des données et leur réutilisation.

L’entrepôt de données de Recherche Data Gouv offre un entrepôt pluridisciplinaire souverain pour la publication des jeux de données. Cette offre s’adresse à toutes les communautés qui ne disposeraient pas encore d’un entrepôt thématique reconnu.

Quand les données sont déjà partagées ou ouvertes grâce à un entrepôt thématique français ou international, le catalogue de Recherche Data Gouv se charge de les repérer et de les signaler.