European genome-phenome archive (EGA)

Génomique

Données acceptées

Données sensibles issues de recherches biomédicales. Séquences génétiques (formats génériques ou spécifiques). Puces à ADN : des fichiers de signaux bruts aux matrices. Phenotypes (tous formats). L'entrepôt est recommandé pour les données potentiellement réidentifiables et nécessitant un contrôle d'accès. Toute soumission requiert l'utilisation d'un outil de cryptage (crypt4gh). Pour les autres types de données génétiques, d'autres entrepôts sont à privilégier. https://ega-archive.org/submission/metadata/submission/FAQ/

Institutions porteuses

European Molecular Biology Laboratory European Bioinformatics Institute (EMBL-EBI)

Centre de Régulation Génomique

Identifiants pérennes

DOI

Limite de volume

La soumission des données se fait via une ''submission box'' qui ne peut excéder 8To

Modération assurée par l'entrepôt

Automatique et humaine. Tout dépôt donne lieu à un contrôle qualité documenté (File Quality Control Report). Délai moyen constaté entre la soumission et la publication : 1 mois.

Pérennité

Plateforme lancée en 2008. Pas de durée limite, la conservation est dite ''permanente''. Les données sont répliquées sur les serveurs du Centre de calcul public de Barcelone (BSC). L'entrepôt fait partie du réseau international ELIXIR.

Remarques

L'entrepôt recommande le recours à des vocabulaires contrôlés (Experimental Factor Ontology Database) pour décrire les données de phénotypes. 

Schéma de métadonnées basé sur XML, JSON et celui de l'entrepôt ENA (https://ega-archive.org/submission/metadata/ega-schema). 

Embargo : 1 an avec possibilité d'extension sur justification. Seules les métadonnées sont rendues publiques. 

L'accès aux données est soumis à une demande d'autorisation très encadrée, nécessitant l'approbation d'un comité (Data Access Committee) désigné pour chaque jeu de données.