2025-03-18 21:40:00
Les fournisseurs de solutions de stockage rivalisent une nouvelle fois pour se positionner comme les leaders dans l’infrastructure dédiée au traitement des charges de travail d’intelligence artificielle, lors de la conférence GPU Technology Conference (GTC) d’Nvidia à San Jose, en Californie.
Une tendance marquante parmi ces fournisseurs est l’intégration d’outils et de services de gestion des métadonnées dans leurs plateformes. L’objectif est de créer des lacs de données non structurées, qui serviront de référentiels d’informations centraux pour les applications d’IA.
Certains acteurs se concentrent sur des offres matérielles uniques, tandis que d’autres optent principalement pour des solutions logicielles. Les stratégies pour un stockage efficace d’IA sont encore en cours d’élaboration, selon Simon Robinson, analyste chez Enterprise Strategy Group, désormais partie d’Omdia. “Comme toujours avec l’IA, le domaine est en constante évolution”, a-t-il précisé.
Métadonnées : Une Ressource Essentielle
Les métadonnées se distinguent comme un composant clé pour de nombreuses solutions de stockage orientées vers l’IA, chaque fournisseur cherchant à se démarquer par ses capacités en matière d’automatisation, de compréhension des données et de vitesses d’accès. Selon Brent Ellis, analyste chez Forrester Research, les applications IA performantes requièrent des vitesses d’accès plus élevées pour les services de stockage et logiciels, tandis que les métadonnées fournissent une intelligence cruciale aux données.
Les métadonnées apportent un contexte immédiat aux données, comme la date de création ou la sensibilité des informations. Ces informations peuvent également établir d’importantes connexions pour les bases de données vectorielles, essentielles pour les applications d’IA générative. Des métadonnées détaillées peuvent extraire des informations cachées dans des environnements hybrides basés sur le cloud.
“L’accent mis sur les métadonnées est vraiment essentiel pour le développement d’IA, les applications et les modèles”, a souligné Ellis. “Quand on parle d’ajouter de l’intelligence à la couche d’application, le contexte est primordial”.
[Les métadonnées sont] si utiles et sont devenues si standardisées que chaque système en a besoin.
Brent Ellis, Analyste, Forrester Research
Intégrer la gestion des métadonnées dans l’environnement de stockage pourrait éventuellement éliminer la nécessité d’une couche de gestion des données distincte. Les balises et marquages des métadonnées sont généralement universels, permettant ainsi la création de lacs de données à partir de diverses sources sur le cloud ou en local, quel que soit le matériel ou les services spécifiques employés.
Les Solutions Logicielles en Tête
NetApp et DataDirect Networks (DDN) se positionnent comme des acteurs majeurs mettant l’accent sur les métadonnées pour leurs solutions logicielles destinées à l’IA, tant à la GTC que dans leurs développements futurs. La plate-forme de stockage hybride OnTap de NetApp prend désormais en charge les conceptions de référence de la plate-forme Nvidia AI Data, intégrée dans plusieurs architectures de référence pour des systèmes tels que le Nvidia DGX SuperPod ou les Systèmes HGX.
En septembre dernier, NetApp a introduit son moteur de métadonnées, une nouvelle fonctionnalité d’OnTap qui promet de révolutionner la gestion du stockage pour les tâches d’IA. Bien qu’aucune date de lancement n’ait été annoncée, l’importance de la découverte des métadonnées et de l’automatisation ne cesse d’augmenter. Jonsi Stefansson, CTO chez NetApp, a déclaré que le catalogage efficace des métadonnées permettrait aux entreprises de découvrir des données utiles pour l’IA, peu importe leur localisation.
“Tout le monde peut bénéficier du catalogue de métadonnées, quel que soit le type de projet”, a-t-il ajouté. “Les silos de stockage de données entravent la progression de l’IA”. DDN vise également à supprimer ces silos à l’aide de sa plateforme Infinia, conçue pour offrir un stockage d’objets défini par logiciel, incluant des capacités de gestion de données et de multi-tenance.
Spécialisation Matérielle pour l’IA
Des entreprises telles que HPE et Pure Storage s’efforcent de démontrer que des solutions matérielles spécialisées sont nécessaires pour optimiser les services d’IA, tout en reconnaissant la nécessité d’une certaine flexibilité pour les clients. HPE compte tirer parti de son ensemble de services hybrides interconnectés en GreenLake pour optimiser son matériel de stockage dans le cadre de cloud privés d’IA, en collaboration avec Nvidia.
Le système de stockage Alletra Storage MP X10000 d’HPE prend désormais en charge le logiciel HPE Data Fabric, servant de couche de données hybride pour les applications d’IA dans le cloud privé. Ce modèle inclut des capacités de marquage automatique des métadonnées pour les données stockées.
Pure Storage, de son côté, a récemment présenté sa nouvelle architecture FlashBlade EXA, qui dissocie les informations sur les métadonnées des données elles-mêmes. Un élément essentiel du matériel FlashBlade EXA, qui devrait sortir prochainement, est la capacité d’optimiser la performance en dégageant les goulots d’étranglement associés aux métadonnées. Cela se traduit par une scalabilité et une performance constante, sans compresser les métadonnées, comme le souligne Chadd Kenney, vice-président chez Pure Storage.
Cette architecture marque une première pour Pure, qui envisage de faire fonctionner son logiciel avec du matériel tiers, bien qu’elle prévoit également de vendre ses propres nœuds de stockage pour le matériel Exa à l’avenir.