Baidu a récemment fait sensation sur le marché des modèles d’intelligence artificielle en dévoilant ses nouvelles créations, ERNIE 4.5 et ERNIE X1. L’entreprise propose ces modèles gratuitement pour les utilisateurs individuels via ERNIE Bot, marquant une avancée significative dans l’accessibilité des technologies avancées.
Des performances avancées à un prix attractif
L’objectif de Baidu est clair : élargir les horizons des modèles multimodaux et de raisonnement tout en offrant des capacités avancées à des tarifs plus compétitifs. Ces modèles seront intégrés dans l’écosystème de produits de Baidu, comprenant Baidu Search et l’application Wenxiaoyan, avec l’ambition d’améliorer l’expérience utilisateur à travers ces outils.
ERNIE 4.5 : Une nouvelle référence en matière de compréhension multimodale
ERNIE 4.5 est présenté comme un modèle de fondation multimodal de nouvelle génération, apportant des améliorations significatives à la compréhension du langage, la génération de contenu, le raisonnement et la mémoire. Ce modèle, grâce à une optimisation collaborative sur plusieurs modalités, promet de mieux gérer les différents types de contenus, qu’ils soient textuels, visuels, sonores ou vidéos. Son aptitude à interpréter des contenus complexes, tels que les mémés internet et les dessins satiriques, illustre sa forte conscience contextuelle.
Des benchmarks révèlent que ERNIE 4.5 devance son principal concurrent, GPT-4.5, dans plusieurs domaines, tout en étant proposé à un prix défiant toute concurrence, représentant seulement 1 % du coût de GPT-4.5.
Les avancées de ce modèle s’appuient sur des technologies innovantes telles que le masquage dynamique de l’attention ‘FlashMask’, un mélange hétérogène de spécialistes multimodaux, et une compression de représentation spatiotemporelle. De plus, la construction de données d’entraînement axée sur les connaissances et un post-entraînement enrichi par l’auto-feedback renforcent ses capacités.
ERNIE X1 : Un raisonnement approfondi et polyvalent
ERNIE X1, le nouveau modèle ded’évaluation cognitive de Baidu, met l’accent sur la compréhension approfondie, la planification et l’évolution, en ajoutant la capacité d’utiliser des outils. Ce modèle multimodal s’avère particulièrement compétent pour des tâches comme les questions-réponses sur des connaissances chinoises, la création littéraire ou encore des calculs complexes.
Les fonctionnalités pratiques d’ERNIE X1 incluent une recherche avancée, des réponses à des documents, la reconnaissance d’images, la génération d’images par IA et la lecture de pages web. Ces applications sont soutenues par la méthode d’apprentissage par renforcement progressif et un système de récompense multifacette intégré.
Accès et opportunités pour les développeurs
Pour les utilisateurs professionnels et les développeurs, ERNIE 4.5 est accessible via des API sur la plateforme Qianfan de Baidu AI Cloud, qui propose des structures tarifaires compétitives. ERNIE X1 sera également disponible sur cette plateforme dans un avenir proche.
Baidu annonce également son engagement à continuer ses investissements dans l’intelligence artificielle, les centres de données et les infrastructures cloud, soulignant que 2025 pourrait être une année charnière pour le développement et l’itération des grands modèles de langage et des technologies associées.
Perspectives et écosystème technologique
À l’heure où les avancées en intelligence artificielle se multiplient, Baidu se positionne comme un acteur clé sur le marché, cherchant à faire de ses modèles des références incontournables. Les prochaines innovations promettent de redéfinir la manière dont les utilisateurs interagissent avec l’IA, tant dans le cadre professionnel que quotidien.
Pour découvrir davantage sur les tendances de l’IA et des données massives, plusieurs événements tels que l’AI & Big Data Expo se tiendront prochainement à Amsterdam, Californie et Londres, réunissant des leaders de l’industrie autour des enjeux technologiques contemporains.