Baidu frappe fort : le mastodonte chinois de l’IA dévoile Ernie 5.0

Baidu Ernie 5.0

➡️ Vos réponses rapides :

  • Baidu présente ERNIE 5.0, un modèle multimodal puissant, soutenu par de nouvelles puces IA, pour renforcer son autonomie technologique face aux géants mondiaux.
  • Les nouvelles puces Kunlun M100 et M300 permettent de réduire la dépendance étrangère et d’optimiser l’entraînement des modèles IA de dernière génération.
  • ERNIE 5.0 est conçu dès sa base pour traiter simultanément le texte, les images, l’audio et la vidéo au sein d’une structure unifiée.
Sommaire

Le géant technologique chinois Baidu a levé le voile sur Ernie 5.0, son modèle d’intelligence artificielle le plus ambitieux à ce jour. Présenté lors de l’événement annuel Baidu World 2025 à Pékin, ce système est annoncé avec des capacités multimodales inédites et une architecture comptant 2,4 trillions de paramètres.

Une architecture nativement multimodale qui change la donne

Contrairement à ses concurrents qui adoptent généralement une approche de fusion a posteriori, Ernie 5.0 se distingue par son architecture « nativement omni-modale ». Le modèle est conçu dès sa base pour traiter simultanément le texte, les images, l’audio et la vidéo au sein d’une structure unifiée. Cette approche technique, développée sur le framework PaddlePaddle de Baidu, permet une compréhension et une génération de contenu bien plus fluides entre différents formats.

Selon Wang Haifeng, directeur technique de Baidu, cette méthode représente une rupture avec les standards de l’industrie. Le modèle intègre une architecture de Mixture-of-Experts ultra-éparse. Bien qu’il compte plus de 2,4 trillions de paramètres au total, moins de 3 % de ces paramètres sont activés lors de chaque inférence. Cette conception vise à maintenir des performances exceptionnelles tout en optimisant l’efficacité énergétique et computationnelle.

Robin Li, cofondateur et PDG de Baidu, a souligné l’importance stratégique de cette avancée : « L’intelligence elle-même est la plus grande application, et la vitesse d’itération technologique est le seul fossé défensif. Nous continuerons d’investir dans le développement de modèles de pointe pour repousser les limites de l’intelligence« .

Des performances qui rivalisent avec les leaders mondiaux

Baidu ne s’est pas contenté de dévoiler les spécifications techniques de son nouveau modèle. L’entreprise a également publié des benchmarks comparatifs audacieux, affirmant qu’Ernie 5.0 rivalise avec, voire surpasse, les modèles phares de ses concurrents occidentaux.

Dans plus de quarante évaluations faisant autorité, les capacités de compréhension linguistique et multimodale d’Ernie 5.0 se mesureraient à celles de Gemini 2.5 Pro de Google et de GPT-5 d’OpenAI. Plus impressionnant encore, Baidu revendique une supériorité dans des domaines critiques pour les entreprises, notamment la compréhension de documents complexes, où le modèle aurait obtenu des scores record sur des tests comme OCRBench et DocVQA.

Les capacités de génération d’images et de vidéos du modèle atteindraient également le niveau de modèles spécialisés dans ces domaines verticaux. Cette polyvalence pourrait faire d’Ernie 5.0 un outil attractif pour les entreprises cherchant une solution unifiée plutôt qu’une multitude d’outils spécialisés.

Baidu Ernie 5.0

Une stratégie d’indépendance technologique face aux restrictions américaines

Le lancement d’Ernie 5.0 s’inscrit dans un contexte géopolitique tendu. Baidu a simultanément annoncé deux nouvelles puces Kunlun conçues en interne : la M100, dédiée à l’inférence et prévue pour début 2026, et la M300, capable de gérer à la fois l’entraînement et l’inférence de modèles multimodaux géants, attendue pour début 2027.

Shen Dou, vice-président exécutif de Baidu et responsable de sa division cloud, a expliqué que ces puces fourniront « une puissance de calcul IA puissante, économique et contrôlable » pour soutenir la quête d’autosuffisance de la Chine en matière d’IA. Cette initiative répond directement aux restrictions d’exportation imposées par les États-Unis sur les puces avancées, qui limitent l’accès de la Chine aux technologies de pointe comme les processeurs Nvidia.

Baidu a également dévoilé ses « supernœuds » Tianchi, capables de connecter 256 ou 512 puces P800, dont le déploiement s’échelonnera sur 2026. Cette approche par grappes illustre la stratégie chinoise visant à compenser les limitations sur les puces individuelles par des interconnexions plus intelligentes et une orchestration système sophistiquée.

Un écosystème d’applications IA en pleine expansion

Au-delà du modèle fondamental, Baidu a profité de cet événement pour présenter une série d’améliorations à son écosystème d’applications IA. GenFlow 3.0, l’agent IA général de l’entreprise, compte désormais 20 millions d’utilisateurs et simplifie les tâches et flux de travail complexes.

L’entreprise a également lancé Famou, un agent auto-évolutif disponible commercialement sur invitation, ainsi qu’Oreate, un espace de travail IA tout-en-un qui compte déjà 1,2 million d’utilisateurs. Le constructeur d’applications sans code Miaoda a franchi le cap des 400 000 applications créées, tandis que MeDo commence son déploiement sur les marchés internationaux.

La transformation de Baidu Search par l’IA illustre l’ambition de l’entreprise. En effet, environ 70 % des premiers résultats de recherche sont désormais présentés en format média enrichi. Robin Li a précisé que cette transformation ne se limite pas à insérer des résumés générés par IA, mais reconstruit fondamentalement l’expérience de recherche autour d’images et de vidéos plutôt que de textes et de liens.

Baidu Ernie 5.0

Une expansion internationale progressive

Si Ernie 5.0 vise d’abord le marché chinois, Baidu ne cache pas ses ambitions mondiales. Le modèle est actuellement accessible au public via l’application Ernie Bot, tandis que les entreprises peuvent y accéder via la plateforme cloud Qianfan de Baidu.

L’entreprise déploie progressivement certaines de ses technologies à l’international, notamment sa technologie d’humains numériques et MeDo. Cette stratégie prudente contraste avec le discours agressif de Robin Li sur la structure de l’industrie, qu’il voit évoluer vers une « pyramide inversée » où les applications créent une valeur cent fois supérieure à celle des modèles fondamentaux.

Le service de robotaxis Apollo Go, qui a dépassé les 17 millions de courses cumulées à travers le monde (le plus important au niveau mondial) témoigne de la capacité de Baidu à concrétiser ses innovations IA dans des applications grand public.

Partager à votre entourage :
TU ES FREELANCE ?
Entoure toi d'autres freelances près de chez toi !
Discord