Sora 2 : OpenAI améliore la génération de vidéo IA

Sora 2 OpenAI

➡️ Vos réponses rapides :

  • Sora 2 marque un saut générationnel avec une compréhension avancée des lois physiques et la génération synchronisée d’audio. Le modèle produit des vidéos de 10 secondes en Full HD au réalisme inédit.
  • OpenAI lance une application iOS exclusive, « Sora », fonctionnant sur invitation. Cette plateforme sociale permet de créer, partager et remixer des vidéos, incluant la fonctionnalité Cameo pour s’intégrer dans les scènes.
  • La technologie soulève des questions sur les deepfakes et l’usage de contenus protégés. OpenAI a intégré des métadonnées C2PA et des filtres contre les contenus inappropriés pour limiter les abus.
  • L’accès reste limité aux États-Unis et Canada sur iOS, avec une version Pro pour les abonnés ChatGPT. Aucune date n’est annoncée pour un déploiement international ou une version Android.
Sommaire

OpenAI a dévoilé Sora 2, la seconde mouture de son générateur de vidéos par intelligence artificielle. Cette version dépasse largement les capacités du modèle original avec des séquences plus réalistes, une compréhension améliorée des lois physiques et l’intégration du son synchronisé. Alors que l’entreprise renforce sa position face à la concurrence, des questions émergent sur les usages éthiques de cette technologie disruptive.

Une évolution technique majeure

OpenAI présente Sora 2 comme un saut générationnel comparable au passage de GPT-1 à GPT-3.5 dans le domaine textuel. Le nouveau modèle dépasse les simples séquences animées pour proposer une compréhension implicite des lois physiques du monde réel. Le générateur maîtrise désormais des concepts comme la gravité, la flottabilité, et même les erreurs humaines dans les mouvements.

Contrairement aux versions antérieures où un ballon de basket pouvait se téléporter mystérieusement dans le panier, Sora 2 simule maintenant des rebonds réalistes sur le panneau en cas de tir manqué. Cette attention aux contraintes physiques représente une étape cruciale vers la création de simulateurs mondiaux fiables, objectif à long terme d’OpenAI dans le domaine vidéo.

Le système excelle également dans le suivi d’instructions complexes impliquant plusieurs plans caméra, tout en préservant la cohérence environnementale. Il prend en charge divers styles visuels, du réalisme cinématographique à l’animation japonaise, tout en générant simultanément sons d’ambiance, voix et effets sonores parfaitement synchronisés avec l’action.

Une application sociale et des fonctionnalités immersives

En parallèle du moteur de génération, OpenAI lance une application mobile exclusive sur iOS, baptisée simplement « Sora ». Disponible en accès limité aux États-Unis et au Canada via un système d’invitation, cette plateforme sociale permet de créer, partager et découvrir des vidéos générées par IA à la manière de TikTok.

La fonctionnalité phare, Cameo, permet aux utilisateurs d’intégrer leur propre visage dans n’importe quelle scène générée par Sora 2. Après un court enregistrement vidéo et audio destiné à vérifier l’identité et capturer la ressemblance, le système crée un double numérique qui peut être placé dans divers contextes. Cette option est également disponible pour les amis, moyennant leur autorisation.

Pour les professionnels, Sora 2 ouvre des perspectives inédites. En effet, les marketeurs peuvent créer des publicités immersives en quelques minutes. De même, les producteurs audiovisuels peuvent tester des effets spéciaux ou storyboarder des scènes avant le tournage. Pour leur part, les éducateurs peuvent simuler des situations pédagogiques complexes. La technologie rend la création vidéo accessible sans compétences techniques avancées.

Entre innovation et controverse

Dès son annonce, Sora 2 soulève des questions éthiques et légales. Dans une démonstration audacieuse, OpenAI a utilisé un deepfake de son PDG Sam Altman pour présenter le nouveau modèle, illustrant ainsi les potentielles dérives de la technologie. Officiellement, l’entreprise bloque la création de deepfakes de personnalités publiques. Cependant, certains utilisateurs rapportent avoir généré des contenus problématiques mettant en scène des personnages sous licence comme Bob l’éponge ou Pikachu dans des situations inappropriées.

La politique de formation du modèle suscite également des inquiétudes. OpenAI a prévenu différentes agences que Sora 2 utiliserait des contenus protégés par le droit d’auteur, sauf opposition explicite. Cette approche proactive n’a pas empêché les critiques concernant le respect de la propriété intellectuelle.

Face à ces enjeux, OpenAI a mis en place plusieurs garde-fous. Chaque vidéo générée inclut des signaux visibles et invisibles permettant de l’identifier comme étant créée par IA, ainsi que des métadonnées C2PA, standard du secteur. L’entreprise a également renforcé les filtrages pour bloquer la création de contenus violents ou sexuels.

Accessibilité et perspectives futures

L’accès à Sora 2 reste restreint pour le moment. L’application n’est disponible que sur iOS dans une version bêta limitée aux États-Unis et au Canada. OpenAI n’a pas encore communiqué de calendrier pour le déploiement international ou le développement d’une version Android.

Les utilisateurs de ChatGPT Pro bénéficient d’un accès privilégié à Sora 2 Pro, une version expérimentale offrant une qualité supérieure, disponible sur onsora.ai et prochainement dans l’application Sora. Une version API destinée aux développeurs et éditeurs est également annoncée, promettant d’élargir les cas d’usage professionnels.

Partager à votre entourage :
TU ES FREELANCE ?
Entoure toi d'autres freelances près de chez toi !
Discord