En quoi les données sont-elles sécurisées ? - Réponse de Stéphane Paris

Updated at: 31/01/2023

Interview de Stéphane PARIS, Responsable du services d’infrastructures pour le traitement et la gestion de la donnée, DSI-Infrastructures

 

Quel est votre rôle dans l’équipe Recherche Data Gouv ?

Je suis co-animateur, avec Michel Bamouni, du Workpackage 4 de Recherche Data Gouv. Ce WorkPackage vise à mettre en œuvre les infrastructures techniques qui portent le portail, l’entrepôt de données de Recherche Data Gouv.

Où sont stockés les jeux de données dans Recherche Data Gouv ?

Les données de Recherche Data Gouv sont hébergées, à l’heure actuelle, dans deux data centres sécurisés. Le stockage primaire est hébergé dans un data center Inrae en Occitanie. Il est dupliqué dans un data center d’Ile de France qui héberge le plan de reprise d’activité de Recherche Data Gouv. 

En quoi ces données sont-elles sécurisées ?

Comment être sûr que les données déposées ne seront pas perdues ?  Les deux data centres disposent a minima d’un contrôle d’accès authentifié et de systèmes de détection d’incendie. Ils disposent de redondances sur la chaîne électrique : deux alimentations électriques secourues via des onduleurs distincts avec au moins 20 minutes d’autonomie. Ils bénéficient également d’au moins un groupe électrogène et une double adduction sur le réseau ERDF. Les systèmes de climatisation sont également secourus, soit via des redondances sur les groupes froid, soit via un système de réserve d’eau glacée et par des redondances sur les systèmes de refroidissement en salle. L’ensemble de ces équipements est supervisé et bénéficie de contrats de maintenance. Les systèmes de stockage des données ont été conçus pour que la disponibilité de Recherche Data Gouv ne soit pas impactée en cas de perte sur chaque site d’un serveur et deux disques durs. L’ensemble des mises à jour de la solution sont testées sur des serveurs de test, puis en préproduction avant de passer en production. La solution bénéficie de maintenances matérielles et de support sur la solution logicielle. Une comparaison de la base de données de Recherche Data Gouv et des données réellement stockées sur les systèmes de stockage est également réalisée chaque nuit de manière automatisée afin de vérifier la cohérence entre la base et les données réellement stockées. Ceci afin de pouvoir réagir rapidement en cas de bug détecté. Le risque de perte de données suite à un incident technique est donc extrêmement faible. La solution permet également de versionner chaque fichier de données déposé sur Recherche Data Gouv, ce qui permet de retrouver d’anciennes versions des fichiers de données  en cas d’erreur humaine. Pour répondre aux risques liés à de la malveillance, y compris aux cryptolockers, une sauvegarde externe a également été mise en œuvre en partenariat avec l’Université de Strasbourg. Celle-ci permet de sauvegarder chaque nuit les données de Recherche Data Gouv en bénéficiant d’une rupture technologique. Ainsi même si les systèmes informatiques d’Inrae devaient être compromis, les données seraient conservées de manière sécurisée dans le data centre de cette université.

> Découvrez l'équipe projet "entrepôt et catalogue"