European genome-phenome archive (EGA)

Génomique

Données acceptées

Données médicales et de santé, Phénotypes, Puces à ADN

Institutions porteuses

European Molecular Biology Laboratory European Bioinformatics Institute (EMBL-EBI)

Centre de Régulation Génomique

Identifiants pérennes

DOI

Limite de volume

Limite de volume par fichier : Pas de limite précisée

Limite de volume par jeu de données : La soumission des données se fait via une "submission box" qui ne peut excéder 8To.

Modération assurée par l'entrepôt

Automatique et humaine. Tout dépôt donne lieu à un contrôle qualité documenté (File Quality Control Report). Délai moyen constaté entre la soumission et la publication : 1 mois.

Remarques

Données sensibles issues de recherches biomédicales. Séquences génétiques (formats génériques ou spécifiques). Puces à ADN : des fichiers de signaux bruts aux matrices. Phenotypes (tous formats).

L'entrepôt est recommandé pour les données potentiellement réidentifiables et nécessitant un contrôle d'accès. Toute soumission requiert l'utilisation d'un outil de cryptage (crypt4gh). Pour les autres types de données génétiques, d'autres entrepôts sont à privilégier. https://ega-archive.org/submission/metadata/submission/FAQ/ 

L'entrepôt recommande le recours à des vocabulaires contôlés (Experimental Factor Ontology Database) pour décrire les données de phénotypes.

Schéma de métadonnées basé sur XML, JSON et celui de l'entrepôt ENA :  https://ega-archive.org/submission/metadata/ega-schema/

Embargo : 1 an avec possibilité d'extension sur justification. Seule les métadonnées sont rendues publiques. L'accès aux données est soumis à une demande d'autorisation très encadrée, nécessitant l'approbation d'un comité (Data Access Committee) désigné pour chaque jeu de données.