How to choose a data warehouse ?

Updated at: 02/06/2022

Pour partager ou ouvrir des données de recherche, il est nécessaire de les déposer dans un entrepôt de données qui permettra de les rendre plus visibles et accessibles.

 

Dans le cas de disciplines structurées pour le partage des données (astronomie, génomique, etc.), les producteurs de données ont à disposition des entrepôts spécifiques à leur discipline. Ils utiliseront alors naturellement l’ensemble des standards et bonnes pratiques déjà en place pour documenter et mettre en forme leurs données.

En alternative, les producteurs de données pourront se tourner vers l’entrepôt institutionnel auquel ils sont affiliés, s’il existe, ou utiliser l’entrepôt pluridisciplinaire Recherche Data Gouv.

Des exigences minimales seront imposées par ces entrepôts de confiance pour que les données soient FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable) notamment grâce à l’attribution d’un identifiant pérenne unique (par exemple un DOI).

Dans le cas où les données soutiennent une publication scientifique et pour des besoins de preuves, il est important de choisir un entrepôt tel que celui de Recherche Data Gouv qui permet d’accéder de manière pérenne et fiable à la version du jeu de données qui a servi à l’obtention des résultats.

La pratique de sa communauté est le meilleur guide, mais des annuaires de ces entrepôts existent. L'annuaire re3data recense les entrepôts et permet de filtrer selon plusieurs critères (par exemple la discipline, l’attribution d’un identifiant pérenne aux jeux de données, les types de données ou de formats acceptés, la préservation sur le long terme des données, le choix de la licence, etc.).

Pour toute question, s’adresser à l’atelier de la donnée de proximité, ou contacter le centre de ressources entrepôt-catalogue.

 

Source : Aide en ligne