« Sans dépôt, les données sont invisibles », Pierre Cantelaube

Mis à jour : 23/09/2025

Pierre Cantelaube, ingénieur d’études à INRAE est dans le top 3 des déposants les plus actifs de l’entrepôt Recherche Data Gouv avec 254 jeux de données déposés depuis l’inauguration en juillet 2022. Un nombre vertigineux qui va sans doute fondre pour mieux correspondre aux besoins de la communauté scientifique. Rencontre

Vue Aérienne de champ en Picardie région de Péronne dans la Somme. © INRAE / Jean-Pierre TISSIER

Qui êtes-vous ?

Je suis un ingénieur statisticien et géomaticien, producteur de données, à l’Observatoire du développement rural (ODR) sur le centre INRAE Occitanie-Toulouse.
J’accompagne les acteurs de la recherche dans l’accessibilité et le traitement de leurs données, notamment celles relatives aux systèmes de cultures et de productions agricoles. Cela implique une multitude de jeux de données associés : par exemple pour les données annuelles relatives aux parcelles agricoles de France (cultures rencontrées, pratiques agricoles, etc.) 
Nous sommes une quinzaine de collègues à apporter un appui à la recherche et à l’évaluation de politiques publiques particulièrement sur des sujets relatifs à la Politique Agricole Commune.

Pourquoi déposer vos données de recherche ?

Si de nombreuses données exigent une confidentialité (données personnelles, à diffusion restreinte, etc.), de plus en plus de données d’occupation du sol sont publiques. Et ce, notamment depuis l’essor des données géographiques qui possèdent une référence spatiale. Chacun peut y avoir accès.
 

Vue aérienne de champs en Picardie, région de Péronne dans la Somme © INRAE / Jean-Pierre TISSIER

Auparavant, nous étions directement contactés par e-mail ou via notre site internet (odr.inrae.fr) pour partager nos données et leurs mises à jour. Encore fallait-il savoir que lesdites données existaient ! Désormais l’entrepôt Recherche Data Gouv offre une visibilité immédiate sur l’éventail de nos productions de données de recherche, particulièrement en dehors d’INRAE. C’est complémentaire à l’offre de produits et de services autour des données disponibles historiquement sur notre site web, où nous proposons aussi des ressources plus élaborées et diverses (indicateurs composites, tableaux dynamiques, cartes, documentations, etc.).

Outre cette visibilité, que vous apporte l’entrepôt Recherche Data Gouv ?

La production de ce type de données est régulière - en général une fois par an - et les jeux de données sont parfois utilisés dans des publications. Déposer sur Recherche Data Gouv permet aussi d’officialiser les données, de faire reconnaitre notre travail et de suivre leur usage dans la durée, notamment via l’attribution d’un DOI.
Déposer dans l’entrepôt Recherche Data Gouv, c’est aussi souvent le préalable à la rédaction d’un datapaper, faisant le lien entre le jeu de données dans l’entrepôt et la publication décrivant ces données déposée dans HAL par exemple ou chez un éditeur.

Exemple avec un de nos récents datapapers : An integrated pedo-climatic dataset at the agricultural parcel level, où l’on retrouve 9 jeux de données de l’entrepôt Recherche Data Gouv qui y sont décrits.
> https://hal.science/hal-05246049v1

Que prévoyez-vous pour vos prochains dépôts ?

La prochaine étape est de repenser la structuration de nos dépôts. Avec l’expérience, on réalise qu’avoir beaucoup de jeux de données découpés -  dans notre cas -  n’est pas optimal pour l’utilisateur ; même si chaque utilisateur peut avoir un optimal différent !

Nous allons regrouper les données d’occupation du sol sur un périmètre plus large, celui de la région et non du département comme précédemment. Ce regroupement permettra de simplifier l’accès aux jeux de données que nous proposons. Cela simplifiera sans doute les réutilisations de nos données, par les acteurs tels que des agences environnementales, des instituts de recherche etc. qui utilisent au quotidien nos données. Nous prévoyons donc de déposer moins mais mieux, au risque de perdre notre « top position » !  

Même si la démarche de dépôt d’un jeu de données est plutôt facile, je souhaiterais aussi travailler sur un « modèle » récapitulant les métadonnées que nous renseignons à chaque dépôt, ceci afin d’accélérer encore la démarche.

 

Découvrir les jeux de données déposés par Pierre Cantelaube   
Découvrir l’ODR   
Devenir un pro du dépôt grâce aux classes virtuelles