in

Les générateurs vidéo d’IA gratuits sont sur le point de franchir un point de basculement crucial.

AI Video Tipping Point Fast Forward Business 1363842631



L’AVANCEMENT IMPRESSIONNANT DE LA VIDÉO AI EST INQUIÉTANT

Ces dernières semaines, vous avez peut-être remarqué quelques mèmes vidéo impressionnants créés avec l’IA. Harry Potter réimaginé en publicité Balenciaga et des images cauchemardesques de Will Smith mangeant des spaghettis sont devenues virales récemment. Elles mettent en évidence l’avancée rapide de la capacité de l’IA à créer des vidéos, ainsi que les problèmes posés par certaines utilisations de la technologie.

La capacité des outils de création d’images par IA est devenue courante l’année dernière, avec des programmes comme Craiyon (anciennement connu sous le nom de DALL-E Mini) permettant à tous de créer des images reconnaissables, bien que souvent crues et surréalistes, telles que des images de surveillance de bébés volant une station-service, des dessins de tribunal Dark Vadar, et Elon Musk mangeant des crayons. Craiyon était une imitation open source du générateur d’images DALL-E 2 auparavant soigneusement restreint à OpenAI, la société derrière ChatGPT. L’outil était le premier à montrer la capacité de l’IA à transformer une instruction textuelle en ce qui ressemblait à des photos réelles et à des illustrations dessinées par des humains. Depuis lors, DALL-E est devenu accessible à tous, et des programmes comme Midjourney et Dream Studio ont développé et perfectionné des outils similaires, rendant relativement trivial la création d’images complexes et réalistes en tapotant simplement sur un clavier.

À mesure que les ingénieurs ont peaufiné les commandes algorithmiques et les leviers derrière ces générateurs d’images, ajouté davantage de données d’entraînement et payé pour plus de puces GPU pour tout faire fonctionner, ces outils de création d’images sont devenus incroyablement doués pour falsifier la réalité. Pour prendre quelques exemples d’un subreddit dédié aux images IA étranges, regardez Alex Jones à une parade de la fierté gay ou l’Arche d’Alliance en vente lors d’une vente de garage. L’accès généralisé à cette technologie, ainsi que sa sophistication, nous oblige à repenser notre façon de voir les images en ligne, comme l’a souligné l’incident de la diffusion virale d’images AI prétendant montrer l’arrestation de Donald Trump le mois dernier. L’incident a conduit Midjourney à annoncer qu’il ne proposerait plus d’essai gratuit de son service, une solution qui pourrait dissuader certains acteurs malveillants méchants, mais ne résout pas le problème plus large.

Les algorithmes ont toutefois encore du mal à créer une vidéo convaincante à partir d’une instruction. La création de nombreuses images individuelles est coûteusement informatique, et comme le montrent les vidéos actuelles qui tremblent et se gargarisent, il est difficile pour les algorithmes de maintenir suffisamment de cohérence entre elles pour produire une vidéo qui a du sens. Les outils d’IA sont cependant de plus en plus doués pour l’édition de vidéos. Le mème Balenciaga, ainsi que des versions faisant référence à Friends et Breaking Bad, ont été créés en combinant plusieurs outils d’IA différents, d’abord pour générer des images fixes, puis pour ajouter des effets d’animation simples. Mais le résultat final est toujours impressionnant. Runway ML, une startup qui développe des outils d’IA pour la création et l’édition d’images et de vidéos professionnelles, a lancé cette semaine une nouvelle technique plus efficace pour appliquer des modifications stylistiques aux vidéos.

Différentes techniques d’apprentissage automatique ouvrent de nouvelles possibilités. Une entreprise appelée Luma AI, par exemple, utilise une technique connue sous le nom de champs de radiation neuronale pour transformer des photographies 2D en scènes 3D détaillées. Donnez quelques instantanés à l’application de l’entreprise, et vous disposerez d’une scène 3D entièrement interactive à manipuler.

Ces clips suggèrent que nous sommes à un point d’inflexion pour la création de vidéos d’IA, comme pour la génération d’images IA, une ruée croissante de mèmes pourrait être suivie d’améliorations significatives de la qualité et de la contrôlabilité des vidéos IA qui inscrivent la technologie dans toutes sortes de domaines. L’IA pourrait bien devenir une muse pour certains auteurs. Les outils de Runway ont été utilisés par les artistes d’effets visuels travaillant sur TOUT A LA FOIS, partout et en même temps. Darren Aronofsky, réalisateur de La baleine, Black Swan et Pi, est également un fan de Runway. Mais il suffit de regarder à quel point les images avancées de Midjourney et Dream Studio sont maintenant pour avoir une idée de l’orientation que prend la vidéo IA, et de la difficulté qu’elle pourrait nous poser pour distinguer les clips réels des faux. Bien sûr, les gens peuvent déjà manipuler des vidéos avec la technologie existante, mais c’est encore relativement coûteux et difficile à réaliser.

Les avancées rapides de l’IA générative peuvent s’avérer dangereuses à une époque où les médias sociaux ont été utilisés comme une arme et que les deepfakes sont les jouets des propagandistes. Comme Jason Parham l’a écrit pour WIRED cette semaine, nous devons également sérieusement considérer comment l’IA générative peut récupérer et réutiliser des stéréotypes laids.

Pour l’instant, l’instinct de faire confiance aux clips vidéo est surtout fiable, mais il se pourrait que les images que nous voyons deviennent moins solides et véridiques qu’auparavant.


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

grande pompe chou blanc et faux pas

grande pompe, chou blanc et faux pas

Il rend hommage à son frère en construisant une maison-avion