Google riposte à OpenAI : Veo 3.1 débarque avec de nouvelles fonctionnalités de création vidéo

Google Veo 3.1

➡️ Vos réponses rapides :

  • Veo 3.1 de Google améliore textures, lumière et continuité visuelle. L’audio intégré et la cohérence des personnages sont deux nouveautés intéressantes.

  • Flow, la plateforme de création de Google, s’enrichit : prolongation de clips, insertion et suppression d’éléments, génération d’images vers vidéo et nouveaux outils audio.

  • Face à Sora 2, Google mise sur précision, réalisme et contrôle créatif. Veo 3.1 cible les professionnels cherchant un rendu cinématographique.

Sommaire

Quelques jours seulement après le lancement tonitruant de Sora 2 par OpenAI, Google contre-attaque avec Veo 3.1, une version améliorée de son générateur de vidéos alimenté par IA. Cette mise à jour, accompagnée d’importantes évolutions de la plateforme Flow, témoigne de l’intensification de la course technologique entre les deux géants. Avec l’intégration de l’audio, une meilleure cohérence narrative et des outils d’édition avancés, Google affirme sa volonté de dominer le secteur émergent de la création vidéo par intelligence artificielle.

Des améliorations techniques au service de la cohérence narrative

Veo 3.1 n’est pas une révolution radicale par rapport à son prédécesseur Veo 3, lancé en mai dernier, mais il apporte des perfectionnements significatifs. La principale nouveauté réside dans l’intégration native de l’audio, permettant désormais de générer automatiquement des dialogues, des ambiances sonores et des effets synchronisés avec l’image. Google met particulièrement en avant sa synchronisation labiale, qu’elle présente comme supérieure à celle de ses concurrents.

Le réalisme visuel franchit également un palier. Les textures, l’éclairage et les mouvements gagnent en naturel, tandis que la gestion des transitions entre les plans devient plus fluide. Un défi majeur pour ce type de technologie est la cohérence des personnages d’une scène à l’autre. Veo 3.1 répond à cette problématique en permettant aux personnages de conserver leur apparence tout au long d’une séquence, un élément crucial pour maintenir la continuité narrative.

Le modèle se décline en deux versions. La version standard, plus précise mais nécessitant un temps de génération plus long, coûte 0,40 dollar par seconde de vidéo. La version Fast, privilégiant la rapidité d’exécution, est proposée à 0,15 dollar par seconde. Les vidéos peuvent atteindre une durée d’une minute en résolution 1080p, dans un format horizontal ou vertical selon les besoins.

Flow s’enrichit de fonctionnalités d’édition professionnelles

Google ne se contente pas d’améliorer son moteur de génération. La plateforme Flow, lancée il y a cinq mois, reçoit une mise à jour majeure qui transforme l’outil en véritable studio de création. Cinq nouvelles fonctionnalités élargissent considérablement les possibilités créatives.

La fonction « Ingrédients vers vidéo » permet d’utiliser jusqu’à trois images de référence pour définir le style, les personnages ou les décors d’une scène. Cette approche garantit une meilleure maîtrise de l’univers visuel créé. Le mode « Images vers vidéo » génère, quant à lui, une séquence complète entre une image de début et une image de fin, produisant une transition fluide et cohérente.

En outre, l’outil « Extend » répond à une limitation importante de Veo 3, qui ne pouvait produire que des clips de 30 secondes. Il prolonge désormais un clip à partir de sa dernière image, permettant de créer des plans plus longs et homogènes. Cette fonctionnalité ouvre la porte à la réalisation de vidéos continues, se rapprochant ainsi des outils de montage professionnels.

Les créateurs disposent également d’options d’édition avancées. La fonction « Insérer » ajoute de nouveaux éléments dans une scène existante tout en respectant l’éclairage et les ombres présents. À l’inverse, l’option « Supprimer » reconstruit automatiquement le décor lorsqu’un objet ou un personnage est retiré, en veillant à produire un rendu naturel. Ces capacités témoignent d’une approche axée sur le contrôle créatif plutôt que sur la simple génération automatique.

Google Veo 3.1

Un positionnement stratégique face à la concurrence

Avec le lancement de Veo 3.1, Google adopte une stratégie distincte de celle d’OpenAI. Tandis que Sora 2 mise sur une approche grand public avec une application mobile inspirée de TikTok, favorisant le partage viral et le remix, Google cible les créateurs professionnels et les utilisateurs exigeants. Cette orientation se reflète dans l’interface de Flow, qui demande une certaine maîtrise et une compréhension du langage des prompts pour obtenir des résultats optimaux.

Le modèle privilégie la précision et la stabilité au détriment de la rapidité d’action. Les mouvements apparaissent parfois plus lents que chez certains concurrents, mais les éléments restent cohérents d’un plan à l’autre. Ce qui diffère de celle adoptée par Meta ou Luma Labs, qui misent davantage sur le dynamisme visuel et l’effet spectaculaire immédiat.

L’accessibilité reste néanmoins limitée. Si Flow s’est étendu à de nombreux pays, dont la France, après avoir été initialement réservé aux États-Unis, l’outil demeure accessible principalement via les abonnements payants Google AI Pro et Google AI Ultra. Les utilisateurs gratuits disposent d’un accès très restreint. Les développeurs peuvent intégrer les fonctionnalités via l’API Gemini, tandis que les entreprises y accèdent par Vertex AI.

Depuis son lancement, Flow aurait généré plus de 275 millions de vidéos, témoignant d’une adoption significative. Face à Sora 2, dont l’application a été téléchargée plus d’un million de fois en cinq jours, Google cherche à s’imposer non par la viralité, mais par la qualité et la profondeur de ses outils.

Partager à votre entourage :
TU ES FREELANCE ?
Entoure toi d'autres freelances près de chez toi !
Discord