You are currently viewing Vidu : l’IA chinoise qui veut révolutionner la création vidéo

Vidu : l’IA chinoise qui veut révolutionner la création vidéo


Le 27 avril 2024, la société chinoise Shengshu a dévoilé Vidu. Cet outil d’intelligence artificielle est capable de générer des vidéos ultra-réalistes à partir d’un simple texte. Cette annonce marque une avancée majeure dans la course à l’IA vidéo. La Chine entend bien se positionner dans ce domaine comme un acteur de premier plan face aux géants américains comme OpenAI.

Vidu, le rival chinois de Sora

Vidu se présente comme un concurrent direct de Sora, l’outil de création vidéo lancé par OpenAI en février 2024. Tout comme son homologue américain, Vidu permet de générer des vidéos à partir d’un texte, mais avec quelques différences notables :

  • Vidu génère des vidéos de 16 secondes en haute définition (1080p), contre 60 secondes pour Sora.
  • L’architecture de Vidu, basée sur un Universal Vision Transformer (U-ViT), lui permettrait de simuler le monde physique réel avec une génération de vues multi-caméras.


Des vidéos bluffantes de réalisme

Les démonstrations de Vidu ont impressionné par la qualité et le réalisme des vidéos générées. L’IA est capable de créer des scènes complexes respectant la physique du monde réel. Ainsi, cet IA génère un éclairage et des ombres réalistes, ainsi que des expressions faciales détaillées.
Parmi les exemples mis en avant par Shengshu, on retrouve des scènes improbables mais très réalistes :

  • un bateau pris dans une tempête dans le studio d’un peintre
  • un panda jouant de la guitare
  • un aquarium couvrant la tête d’une femme et dans lequel évolue un poisson rouge

Vidu de Shengshu

Un outil prometteur pour l’industrie créative

Vidu se positionne comme un outil idéal pour le cinéma, la production audiovisuelle, la publicité et les arts créatifs en général. Sa capacité à générer du contenu unique et réaliste en fait un allié de choix pour les professionnels de ces secteurs.
Bien que encore en phase expérimentale, Vidu montre déjà un potentiel prometteur. Selon Shengshu, il s’agit du “premier modèle vidéo de cette performance au monde depuis la sortie de Sora”.

Les limites actuelles de Vidu

Malgré ses prouesses, Vidu présente encore quelques limites par rapport à son concurrent Sora. Les vidéos générées, bien qu’impressionnantes, n’atteignent pas encore le niveau de réalisme de celles produites par l’IA d’OpenAI.
De plus, Vidu peut parfois omettre des détails importants et rencontrer des difficultés avec les scènes dynamiques complexes. Enfin, la génération de vidéos par IA nécessite d’importantes ressources de calcul. Cela limite pour l’instant son utilisation à grande échelle.

Conclusion

L’arrivée de Vidu sur le marché de l’IA vidéo marque une étape importante dans la compétition entre la Chine et les États-Unis. L’outil de Shengshu n’égale pas encore les performances de Sora, Il témoigne cependant des progrès rapides de la recherche en IA en Chine et laisse présager de futures innovations dans ce domaine.
Avec Vidu, la Chine affirme sa volonté de devenir un acteur majeur de l’intelligence artificielle. Elle est donc en mesure de bousculer la domination américaine dans ce secteur stratégique. Reste à voir comment cette technologie évoluera dans les mois et années à venir. Il faudra notamment considérer ce que seront ses applications concrètes dans l’industrie créative.

Voir le site de Shengshu