Les guides de l'entrepôt
Afficher et explorer des données
Affichage d’un jeu de données
Pour afficher un jeu de données, cliquer sur son titre ou sur son DOI. La page d’affichage d’un jeu de données joue le rôle de landing page (ou page d’atterrissage) associée au DOI (le DOI est déclaré auprès de DataCite).
Elle permet :
- d’afficher et d’exporter la citation du jeu de données aux formats EndNote XML, RIS, BibTex
- de contacter le déposant et de partager le jeu de données sur Facebook, Twitter et LinkedIn ;
- d’afficher les statistiques d’utilisation du jeu de données
- d’afficher la liste des fichiers associés au jeu de données (filtres possibles sur le type de fichier, le type d’accès et le libellé / tris possibles par dossier, par libellé) ;
selon les droits de l’utilisateur : de visualiser ou de télécharger un fichier, ou de demander l’accès à un fichier en accès restreint.
Si plusieurs fichiers sont sélectionnés, ils seront téléchargés ensembles au format .zip, accompagnés d’un fichier « Manifest.txt » généré au moment du téléchargement. Ce fichier liste les fichiers téléchargés, et le cas échéant ceux qui n’ont pas pu l’être ;
Note : Pour des raisons de performance de l’application, le téléchargement de ces fichiers zip générés est actuellement limité à 50Go ; - de voir et d’exporter les métadonnées décrivant le jeu de données (exports aux formats Dublin Core, DDI, Json et Schema.org JSON-LD),
- de voir les conditions d’utilisation (en particulier la licence) du jeu de données, les conditions d’accès aux fichiers et le registre des visiteurs éventuellement utilisé.
- de consulter et de comparer différentes versions du jeu de données (versions générées suite aux modifications de métadonnées ou aux ajouts/suppressions de fichiers).
Affichage d’un fichier
Pour afficher la page descriptive d’un fichier : cliquer sur son titre.
Cette page permet :
- d’afficher et d’exporter la référence bibliographique du fichier. Celle-ci est basée sur la citation du jeu de données à laquelle s’ajoutent le nom du fichier, son DOI (différent de celui du jeu de données) et son empreinte numérique (selon le format du fichier UNF : universal numeric fingerprint ou MD5 : Message Digest 5).
La version est celle du jeu de données ; - de contacter le déposant et de partager le jeu de données sur les réseaux sociaux Facebook, Twitter et LinkedIn ;
- de voir les modalités d’accès au fichier, qui dépendent de l’autorisation accordée par le déposant et du format du fichier.
- Si l’accès au fichier n’est pas restreint, tout utilisateur peut le visualiser et le télécharger : Modalités d’accès au fichier > Read document (ou Read Text, View Data, View HTML.... selon le format du fichier), ou Modalités d’accès au fichier > Télécharger
Les options de visualisation dépendent du format du fichier (voir Prévisualiser les données d’un fichier). Pour certains formats, des outils d’exploration sont également proposés (voir Explorer les données).
Les options de téléchargement dépendent également du format du fichier. Exemple de formats proposés pour les fichiers tabulés :
- Si l’accès au fichier est restreint et que le déposant a autorisé la demande d’accès, tout utilisateur peut demander l’accès au fichier :
- Si l’accès au fichier est restreint et que le déposant n’a pas autorisé la demande d’accès, il n’est pas possible d’accéder au fichier autrement qu’en s’adressant directement au contact du jeu de données.
- Si l’accès au fichier n’est pas restreint, tout utilisateur peut le visualiser et le télécharger : Modalités d’accès au fichier > Read document (ou Read Text, View Data, View HTML.... selon le format du fichier), ou Modalités d’accès au fichier > Télécharger
- d’afficher et d’exporter les métadonnées décrivant le fichier selon différents format : Dublin Core, DDI, DataCite, Codebook HTML DDI, JSON, OAI-ORE, OpenAIRE et Schema.org JSON-LD.
- de consulter les modifications concernant le fichier au cours des différentes versions du jeu de données.
Prévisualiser les données d’un fichier
Si des conditions d’utilisation associées au jeu de données le permettent, il est possible de prévisualiser certains fichiers directement dans l’interface de l'entrepôt Recherche Data Gouv, sans avoir à les télécharger. Cette fonction de prévisualisation, basée sur le format des données (identifié par le type MIME du fichier), est proposée sur la page d’affichage du jeu de données et sur celle du fichier.
Les prévisualisations suivantes sont disponibles pour les extensions correspondantes :
- Texte brut : fasta, fastq, tab, tsv, txt ;
- Markdown : md ;
- Pages web : html ;
- Images : gif, jpeg, png ;
- Audio : ogg, mp3, mpeg, wav ;
- Vidéo : mp4, ogg, quicktime. Note : pour prévisualiser un fichier .ogg dans le lecteur vidéo, il faut modifier son extension en .ogv ;
- PDF : pdf ;
- Archives : zip. Note : possibilité de voir l’arborescence des dossiers zippés et de télécharger les fichiers individuellement ;
- Cahier de laboratoire électronique : eln.
Sur la page du jeu de données, les fichiers qui peuvent être prévisualisés sont signalés par un bouton Aperçu permettant d’afficher la page du fichier.
La prévisualisation des données est alors possible via le menu Modalités d’accès au fichier > Read document (ou Read Text, View Data, View HTML.... selon le format du fichier), ou via l’onglet Prévisualisation.
La prévisualisation n’est pas possible lorsque le fichier est en accès restreint.
Explorer les données
Certains types de fichiers peuvent être explorés par des outils externes accessibles via les options de visualisation de la commande Modalités d’accès au fichier.
- Data Explorer explore les données tabulées (fichier .tab). Il propose une représentation graphique ou en tableau pour des analyses croisées des données du fichier ou d’un sous-ensemble de ces données obtenus en sélectionnant les variables à prendre en compte. Il permet également de télécharger les données ou le sous-ensemble étudié.
Notes
[1]. L’UNF: universal numeric fingerprint, est une petite chaîne de caractères alphanumériques de longueur fixe résumant le contenu de l’ensemble de données. Toute modification des données, aussi minime soit-elle, entraîne une nouvelle signature électronique universelle. L’UNF assure la non corruption du fichier.
[2]. L’algorithme MD5, pour Message Digest 5, est une fonction de hachage qui permet d’obtenir l’empreinte numérique d’un fichier pour vérifier l’intégrité d’un fichier téléchargé.