Gouvernance
Solutions
Technologies
- Archivage et sauvegarde
- Hardware
- Localisation, traçabilité
- Locaux, sécurité physique
- Programmation, développement
- Réseaux et communications
- Sécurité logique, virus et intrusions
- Site Internet
-
Stockage, SAN, NAS
- - Quelle solution de stockage ?
- - NGDP : Next Generation Data Protection
- - NAS
- - SAN
- - WORM sur disque magnétique
- - CAS (Content Adressed Storage)
- - SRM
- - Virtualisation
- - HSM
- - Sauvegardes des SAN et NAS
- - ILM - Information Lifecycle Management
- - iSCSI, FCIP, iFCP
- - SMI-S
- Stockage cellulaire et Synchrotron SOLEIL
- - RAID
- - Mirroring
- - Normes disques
- - La panne disque
- Systèmes et infrastructure
Marchés
Stockage cellulaire et Synchrotron SOLEIL
Stockage, SAN, NAS
Définir des espaces de stockage basés sur une architecture distribuée, garantir la continuité de service, la sécurisation des données et l’optimisation des ressources en s’appuyant sur l’utilisation de matériel standard, tel est le but du stockage cellulaire.
Plusieurs concepts se rapprochent de cette idée de NAS distribué dont notamment ceux d'HP et de la jeune société Active Circle.
C'est l'offre de cette dernière que le Synchrotron SOLEIL a choisit pour stocker l'important volume de données produites et qui est présenté ici.
Principe du stockage cellulaire
Le stockage cellulaire est conçu pour l’utilisation d’un environnement matériel standard et hétérogène (disque SCSI, SATA, bandes, supports optiques, etc.) en toute transparence pour les utilisateurs sans modifier leur visibilité des fichiers stockés. Il n’impose aucune contrainte en terme de réseau et utilise les infrastructures LAN/WAN existantes à des débits très variés sans distinction.
L'utilisateur accède à un "circle", qui se présente comme un système de fichiers virtualisé et illimité. Il agit comme une couche intermédiaire entre ses ressources physiques (disques de tous types, bandes magnétiques, etc.) et les utilisateurs (personnes ou applications). L’espace de stockage est donc complètement transparent pour l’utilisateur, la sauvegarde et l’optimisation des ressources étant effectuée par le système lui-même (placement des données au bon endroit au bon moment en respect des Classes de Service).
Le système repose sur une architecture cellulaire en 3 couches principales :
- la cellule : un serveur dédié à l’exécution du système. Une cellule peut avoir deux rôles principaux : servir de point de stockage au circle et/ou lui servir de point d’entrée.
- le domaine : un ensemble de cellules étroitement liées et administrables séparément des autres domaines. Le regroupement des cellules au sein du domaine répond à des contraintes propres à l’organisation de l’entreprise (localisation géographique des sites, structure des différents départements, etc.). Les différents domaines communiquent entre eux pour partager leurs ressources, selon les directives définies dans les « Classes de Service ».
- le circle : espace de stockage composé d’un ensemble de serveurs de stockage (appelés des « cellules ») qui sont interconnectés sous IP. Les Cellules d’un même circle peuvent se situer indifféremment sur un même site ou sur plusieurs sites géographiquement distants.
Principales caractéristiques
Il n’existe aucune hiérarchie entre les cellules d’un circle. Toutes sont interconnectées par IP et contrôlent en permanence la présence des autres cellules sur le circle. De ce fait, elles réagissent automatiquement aux différents types d’événement les concernant : incidents, apparition ou disparition de cellules, nouveaux médias de stockage disponibles, pannes matérielles, etc.
Les cellules se partagent les tâches de stockage et de pilotage en fonction de la disponibilité de leurs ressources. Si une cellule est défaillante, les autres cellules prendront automatiquement le relais. Du fait de l’absence totale de centralisation, il n’y a aucun point de fragilité, ce qui confère une robustesse et une continuité de service exceptionnelle au fonctionnement d’ensemble.
Le contrôle se fait à l'aide de "Classes de Services". Une Classe de Service est un ensemble de règles s’appliquant à une donnée. Ces règles sont définies par l’administrateur du système et prennent en charge diverses contraintes telles que :
- le nombre d’exemplaires d’une donnée sur le circle
- la suppression automatique et programmée
- la distance physique entre les exemplaires sur le circle
- le temps d’accès à la donnée – oriente différents types de supports (HSM)
- le type de media de stockage
- les dispositions légales (horodatage, non répudiation, etc.).
Ces règles permettent d’élaborer un cycle de vie des données complet et peuvent être modifiées à tout moment. Le système réagit immédiatement à toute modification ou à tout événement remettant en cause le respect de ces règles.
Le système étant réparti sur plusieurs sites, les données sont toujours accessibles à partir d’un autre site en cas de sinistre et un logiciel de sauvegarde devient inutile.
Cas pratique : synchrotron SOLEIL
Le Synchrotron SOLEIL est une société civile créée par le CNRS et le CEA. Sa vocation est l’exploration de la matière, vivante ou inerte, grâce à l’émission d’un rayonnement lumineux extrêmement puissant via un accélérateur.
Ce rayonnement est fourni par un anneau de stockage de 354 mètres de périmètre, dans lequel des électrons de très haute énergie circulent à une vitesse proche de celle de la lumière.
Des électrons de très haute énergie sont soumis à l’action d’un champ magnétique, pour courber leur trajectoire. Ils perdent alors de leur énergie, libérée sous la forme d’un rayonnement lumineux.
Cette lumière, 10 000 fois plus intense que la lumière solaire, est émise de l’infrarouge aux rayons X, en passant par les ultraviolets. Elle est si intense qu’elle pénètre la matière très profondément : les photons émis viennent frapper une cible, un objet, une matière, une molécule et permettent ainsi de l’étudier en surface, en volume et en profondeur.
Capté à différents endroits de l’anneau, le rayonnement sera canalisé vers 24 sorties : les lignes de lumières. Chaque ligne sera un véritable laboratoire qui pourra être utilisé par différents organismes, publics ou privés.
Problématique de stockage
Le synchrotron permet de réaliser des expériences dont les résultats sont mesurés et doivent être stockés en temps réel d'une manière très fiable.
Les chercheurs prennent rendez-vous jusqu'à un an à l'avance pour réaliser des manipulations pouvant durer plusieurs jours. Longues et coûteuses ces manipulations ne peuvent être ni interrompues, ni recommencées.
La fiabilité du système de stockage est donc un critère prépondérant.
La volumétrie de stockage initial sera d'environ 210 To.
Le coût de stockage est également un critère de choix.
Enfin, contrairement au HPC, la rapidité d'accès aux données n'est pas un critère fondamental (bien sûr, un système lent ne serait toutefois pas souhaitable).
Solution retenue
Le stockage cellulaire d'Active Circle a été choisi. Devoteam a été retenu comme maître d'oeuvre ainsi que responsable du support.
Chaque ligne de lumière recevra une cellule de stockage permettant aux chercheurs de s’affranchir de la dépendance du réseau et de travailler de manière autonome sur les données les plus récentes.
De plus, deux salles informatiques, réparties sur deux sites, seront équipées chacune de deux cellules pilotant respectivement :
- 1 baie EMC Clarion de 40 To, équipée de disques SATA de 500 Go,
- 1 librairie de bandes GRAU de 1344 slots (LTO3 400/800 Go dans une salle et S-AIT 500/1300 Go dans l'autre salle).
Les données seront répliquées dans chacune des deux salles et migrées automatiquement des disques vers les bandes en fonction d’un plan de temps défini pour chaque ligne de lumière.
Bilan de la solution
Le synchrotron va commencer sa phase de test. Il faudra attendre la fin 2006 pour obtenir des résultats en pleine charge.
Déjà, les premières conclusions portent :
- sur la souplesse, l'évolutivité, la robustesse et la sécurité qu'offre la solution,
- son prix modéré au Teraoctet (parmi les plus bas). L'un des arguments réside dans le type de licence indexée sur le prix du matériel et non en fonction de la volumétrie de stockage, toujours appelée à croître.
Merci à Philippe Martinez, Synchrotron Soleil - Informatique Scientifique, pour son aide.
Pour aller plus loin
Forum
Vous voulez avoir l'avis d'un expert sur ce sujet ?
Les autres sites
Toute l'actu sur ce sujet
-
Le format PDF devient un standard ISO
Le Mag IT
03 Juillet 2008
-
Rimage présente DiscFlow™ pour Mac OS X
Categorynet
03 Juillet 2008
-
Interview de Shamir Ramjan, Boss de Flickr France + 25 Comptes Flickr Pro à gagner !
Jeremie Berrebi
03 Juillet 2008
Gouvernance
Document, connaissances, GEDEmploi informatique
Législation
Licences, open source
Politique informatique
Qualité, certification, référentiels
Solutions
BI, reporting, décisionnelBureautique
Finances, gestion, trésorerie
Gestion commerciale, CRM
Mobilité
Production, logistique, SCM
Solutions globales, ERP
Solutions RH
Technologies
Archivage et sauvegardeHardware
Localisation, traçabilité
Locaux, sécurité physique
Programmation, développement
Réseaux et communications
Sécurité logique, virus et intrusions
Site Internet
Stockage, SAN, NAS
Systèmes et infrastructure
Editorial
ActualitésAgenda
Annuaire
Blogs
Contributeurs
Dictionnaire
Dossiers
Emploi
Forum
Lettre
Libraire


