ITPT

Jun 30, 2006

Une segmentation nécessaire

Le marché est en ébullition et il convient de comprendre les technologies utilisées dans chaque catégorie pour mieux appréhender les offres associées. Passons donc en revue ces catégories que nous allons traiter sur ce blog et les grandes caratéristiques de chacune:
  • Cluster File System (CFS): L'idée est d'avoir un système de fichiers (SF), hébergé sur une ou plusieurs unités de stockage connectées à tous les serveurs (mode shared-disk), accédé nativement par chaque machine c'est-à-dire que le SF est compris par tous les noeuds qui souhaitent accéder aux données. Au sens Unix, cela veut dire que la structure du super-block, des structures dérivées et de la partition sont interprétables par les systèmes et que le SF est "monté" en tant que SF disque local. Les CFS sont possibles entre OS identiques et sont de parfaits candidats pour les applications parallèles comme Oracle 9i RAC ou 10g, des fermes applicatives ou de services fichiers (http, ftp, nfs/cifs...). Les solutions CFS ne tolèrent qu'un nombre de noeuds limité, soit rarement plus d'une douzaine vu les protocoles utilisés, et obéïssent à la notion de SFSI (Single File System Image) qui garantit une parfaite cohérence de cache entre tous les systèmes.
  • SAN File System: le vrai nom à utiliser est SAN File Sharing System car il ne s'agit pas vraiment d'un SF partagé sur un SAN mais plutôt d'un système de partage de fichiers sur un SAN. Une ou plusieurs machines dites "Master" possède le SF et sert les réquêtes de placement et de demande d'accès des clients qui représentent l'ensemble du reste de la population. Sans Master, les clients sont incapables d'accéder aux données. Le(s) Master(s) comme les clients sont bien sûr connectés au stockage. Certaines implémentations utilisent NFS ou CIFS pour les Meta-Data et cour-circuitent le protocole pour le trafic données. L'idée est de bénéficier de la souplesse du NAS et la performance du SAN pour les applications exigeantes. Les derniers développements touchent le stockage objet (OSD - Object-based Storage Device) et Parallel NFS (pNFS) issus des travaux de Panasas et repris dans NFS v4 par l'IETF. L'avantage d'un SAN FS est l'hétérogénéité et le nombre important de noeuds au sein d'un même partage. On le trouve plutôt dans les mondes métiers ou verticaux comme le pétrole ou le multimédia...
  • Aggrégation de NAS (NFV/NFM*): Cette approche répond directement à la conséquence du succès des NAS. Au bout de 5 serveurs, il devient délicat voire difficile d'administrer le pool de serveur de fichiers. D'où les méthodes nouvelles pour proposer une vue unique de tous les filers pour faciliter l'administration et rendre transparent les services associés. 2 méthodes existent ici: l'In-Band (dans le chemin de données) où un frontal est positionné entre le(s) client(s) et les serveurs de fichiers. Les clients "passent" donc par ce frontal qui ne traduit pas le protocole et redirige la requête vers le bon serveur. L'approche WAFS (Wide Are File Services) dédiée au service de fichiers pour les postes ou bureaux distants fait parti de la catégorie In-Band. La seconde méthode, plus confidentielle sur le marché, est l'Out-of-Band où un serveur gére une association de filers et de noms sans que le flux de données ait besoin de passer par lui.
    * Network File Virtualization / Network File Management
  • Global/Distributed et Parallel FS: C'est la dernière catégorie et aussi la plus récente pour une bonne fraction des offres du marché. L'idée est ici d'agréger des serveurs de stockage et d'aller au-delà de la simple union de filer. 2 approches existent ici: asymmétrique et symmétrique, les solutions asymétriques étant souvent des offres du domaine publique non commerciales. Plusieurs des offres existantes utilisent un stripe entre serveurs, les données reçues par celui-ci étant potentiellement stripées entre les unités connectées. Les architectures serveurs obéïssent souvent à l'acronyme RAIN.
Plusieurs de ces méthodes utilisent l'agrégation, l'unification ou la globalisation des espaces de noms (et arboresences), appelée sur le marché Global Namespace, que nous aborderons au travers de plusieurs produits et approches dans les prochaines semaines.

Jun 28, 2006

Un programme en guise d'introduction...

Et oui ça me démangeait depuis déja quelques mois et j'avais même hésité à d'abord créer ce blog à la place de celui dédié à la protection de données initialement créé pour évoquer le CDP. C'est donc parti et vous trouverez sur ce site, comme indiqué sur le bandeau, toutes les approches innovantes, récentes et émergentes de stockage fichier, que celles-ci soient d'origine universitaire ou commerciales.

En terme de sujets couverts, l'aggrégation de NAS aussi connue sous les acronymes NFM (Network File Management) ou NFV (Network File Virtualization), le WAFS (Wide Area File Services), les approches Cluster et SAN et les approches globales-distribuées-paralléles, les derniéres arrivées, seront traitées au fur et mesure. La majorité de ces technologies s'appuit sur l'unification des espaces de noms de fichiers.

Pour parler fournisseurs ou technologies, voici par ordre alphabétique, ceux qui seront couverts ici: Acopia Networks, Actona Technologies (Cisco), Adic, AFS/OpenAFS, Apple, Attune Systems, Availl, BlueArc, Brocade, Cloverleaf Communications, Crosswalk, DataPlow, DFS, DiskSites (Expand Networks), EMC, Exanet, FineGround (Cisco), Google, HP, IBM, Ibrix, Isilon, Lustre, MacroImpact, NeoPath Networks, Network Appliance, NuView (Brocade), ONStor, Panasas, PolyServe, PVFS, Rainfinity (EMC), Riverbed, RFS (Remote File Sharing), Sanbolic, SGI, Signiant, Sistina (RedHat), Spinnaker Networks (NetApp), Sun, Swan Labs (F5 Networks), Tacit Networks (Packeteer), TerraScale, VERITAS Software (Symantec), XOsoft... La liste est longue, le marché actif, le sujet est donc plein de promesses...