OpenAI dévoile Sora : révolution dans les jeux vidéo grâce à l’intelligence artificielle

26 février 2024
Ces dernières années, l’intelligence artificielle a fait de grands progrès dans le domaine des jeux vidéo. L’IA a été utilisée pour améliorer l’expérience de jeu, créer des personnages virtuels de plus en plus réalistes et développer des environnements immersifs. Mais que se passerait-il si l’IA pouvait générer elle-même des jeux vidéo entiers ? C’est le défi qu’OpenAI a relevé avec son nouveau modèle de génération vidéo, appelé Sora.
La puissance de Sora
Sora est le premier modèle de génération vidéo développé par OpenAI, et ses capacités sont vraiment impressionnantes. Initialement, l’objectif principal de Sora était de générer des vidéos cinématiques de haute qualité, mais les développeurs ont découvert que le modèle était capable de bien plus.
Selon un document technique publié par les chercheurs d’OpenAI eux-mêmes, Sora peut générer des vidéos d’une résolution et d’un rapport d’aspect arbitraires, jusqu’à 1080p. Cela signifie que le modèle peut effectuer un large éventail de tâches d’édition d’images et de vidéos, telles que la création de vidéos en boucle, la prolongation de vidéos dans le temps ou la modification de l’arrière-plan d’une vidéo existante.
Mais ce qui rend Sora encore plus intéressant, c’est sa capacité à « simuler des mondes numériques ». Lors d’une expérience, OpenAI a envoyé à Sora des messages contenant le mot »Minecraft » et le modèle a été capable de générer une interface utilisateur et un gameplay qui ressemblaient beaucoup au célèbre jeu vidéo. Sora est également capable de contrôler le personnage du joueur et de simuler la physique du jeu.
L’architecture de Sora
Selon le document technique publié par OpenAI, l’architecture de Sora est basée sur un moteur physique piloté par les données. Cela signifie que le modèle ne se contente pas de générer une seule photo ou vidéo, mais qu’il détermine également la physique de chaque objet de l’environnement virtuel. Les calculs effectués par Sora sont ensuite utilisés pour générer des photos, des vidéos ou même des mondes 3D interactifs.
Selon Jim Fan, chercheur principal chez Nvidia, Sora est davantage un moteur physique basé sur des données qu’un outil créatif. Cette caractéristique de Sora ouvre de nouvelles possibilités pour le développement de simulateurs performants de mondes physiques et numériques, ainsi que des objets, des animaux et des personnes qui les habitent.
Les limites de Sora
Malgré ses capacités extraordinaires, Sora présente également certaines limites. Par exemple, dans le domaine des jeux vidéo, le modèle ne peut pas approximer avec précision la physique d’interactions simples telles que briser une vitre. En outre, même avec les interactions qu’il peut modéliser, Sora peut parfois manquer de cohérence. Par exemple, il peut générer l’image d’une personne mangeant un hamburger, mais ne pas rendre les marques de morsure.
En raison de ces limitations, OpenAI a choisi de diffuser Sora dans le cadre d’un programme d’accès très limité. Cela permet aux développeurs de tester le modèle dans des environnements contrôlés et d’évaluer ses performances avec plus de précision.
L’avenir des jeux générés par l’IA
Malgré ses limites actuelles, Sora représente une avancée importante dans le domaine des jeux vidéo générés par l’IA. Le modèle pourrait ouvrir la voie à des jeux générés de manière procédurale et basés uniquement sur des descriptions textuelles. Cela pourrait conduire à des expériences de jeu encore plus réalistes, voire photoréalistes.
Cependant, il est également important de considérer les implications plus larges de cette technologie. La génération de contenus vidéo réalistes à partir de textes pourrait être utilisée pour créer des « deepfakes » de plus en plus convaincants, ce qui pourrait avoir des conséquences négatives pour la société. C’est pourquoi l’OpenAI a choisi de restreindre l’accès à Sora pour le moment.