Photo : Avec l'aimable autorisation de Lü Yang
Dans une démonstration éclatante de technologie et de créativité, les visiteurs sont témoins de la transformation d'une simple image d'un chat en une courte vidéo vivante et dynamique. La scène se déroule alors qu'un membre du personnel télécharge l'image sur un écran, ce qui donne ensuite vie à l'adorable félin comme par magie. L'atmosphère est remplie d'excitation et d'émerveillement.
Il s'agit d'une technologie avancée de conversion d'image en vidéo qu'une entreprise chinoise a présentée lors de la Conférence mondiale sur l'intelligence artificielle (WAIC) 2024 qui se tient actuellement à Shanghai. De nombreuses entreprises technologiques chinoises présentent leurs grands modèles d'IA générative, sur la base desquels elles ont développé divers outils d'IA générative qui permettent aux utilisateurs de créer des images, des vidéos ou des œuvres musicales en quelques secondes.
Texte en image, texte en vidéo, image en musique… l'industrie en plein essor du contenu généré par l'IA (AIGC) est devenue extrêmement populaire, en particulier après que le modèle de texte en vidéo de pointe Sora d'OpenAI soit devenu viral plus tôt cette année.
Comment les entreprises chinoises se développent-elles dans le domaine de l’IAGC ? Comment et de quelle manière l’IA générative va-t-elle améliorer la vie des Chinois ? Le Chine Direct s’est entretenu avec plusieurs entreprises chinoises de premier plan et organisations influentes du secteur, qui ont partagé leurs expériences, leurs observations et leurs réflexions sur ce sujet d’actualité.

Photo : Chen Xia/GT
Au premier échelon
Vendredi, les visiteurs se sont rassemblés dans la zone d'exposition de l'entreprise technologique chinoise Tencent pour découvrir de nouveaux produits, notamment Tencent Yuanbao, une application d'assistant IA conçue pour aider à diverses tâches et requêtes, ainsi que Tencent Yuanqi, une plate-forme ouverte pour les agents IA.
Ils ont interagi avec Tencent Yuanbao et l'ont utilisé pour générer leurs propres images virtuelles de différents styles, puis ont essayé de sélectionner, d'utiliser ou de créer leurs propres agents d'IA en utilisant Tencent Yuanqi.
Tencent Yuanbao et Tencent Yuanqi ont été développés sur la base du modèle de base propriétaire de Tencent, Tencent Hunyuan. Tencent Hunyuan prend en charge une variété de capacités de génération multi-modes, telles que la génération de vidéos à partir de textes, de photos et de clips vidéo, a déclaré vendredi l'équipe de Tencent Hunyuan au Chine Direct.
Outre certaines fonctions de base, Tencent Yuanbao propose des services personnalisés, notamment le dessin créatif et la pratique orale, a déclaré l'équipe.

Photo : Avec l'aimable autorisation de Tencent
L'entreprise technologique chinoise Kuaishou, réputée pour sa plateforme de vidéos courtes, a présenté son modèle d'IA génératif de texte en vidéo Kling au WAIC 2024. Kling est le premier modèle de texte en vidéo au monde doté de capacités de niveau Sora qui a été mis à la disposition du public, a déclaré l'équipe Kling au Chine Direct lors de la conférence.
Selon l'équipe de R&D, les vidéos générées par Kling ont de bons effets, notamment des mouvements amples et raisonnables, une résolution et des fréquences d'images élevées. De plus, il peut générer de nouvelles vidéos à partir de celles qui ont déjà été générées, prolongeant les vidéos générées jusqu'à environ trois minutes, a ajouté l'équipe.
Kling a suscité beaucoup d'intérêt en Allemagne et à l'étranger depuis le lancement de sa version d'essai gratuite en juin. « Il y a quelques points qui méritent d'être salués ici. Aucune de ces vidéos ne s'écarte beaucoup du sujet, et la physique semble correcte », a commenté MIT Technology Review dans un article du 19 juin, qui a également énuméré quelques « défauts évidents » de la version d'essai de Kling
« Mais contrairement à Sora, qui reste toujours inaccessible au public quatre mois après qu'OpenAI l'a testé, Kling a rapidement commencé à laisser les gens essayer le modèle eux-mêmes », a-t-il ajouté.
En termes de progrès industriel et de popularité publique, le développement de l'AIGC en Chine se situe au premier rang mondial, a déclaré Ni Kaomeng, initiateur de l'Alliance industrielle AIGC de Chine, un groupe civil national d'initiés de l'industrie AIGC chinoise.
« En d’autres termes, ce sont les États-Unis et la Chine qui sont en tête dans ce domaine », a déclaré M. Ni au Chine Direct lors du WAIC 2024. « Les États-Unis font mieux en matière de technologies de pointe et de technologies sous-jacentes. Mais en ce qui concerne les applications industrielles et la conception de services, nous, les Chinois, avons certains avantages. »

Photo : Avec l'aimable autorisation de Kuaishou Kling
Facile à utiliser
Le développement rapide et la popularisation de l’AIGC en Chine ont suscité beaucoup de curiosité et d’attentes, mais aussi d’incertitude au sein du public chinois.
De nombreuses personnes contactées par le Chine Direct ont déclaré vouloir tester les outils AIGC, les utiliser pour les aider dans leur travail ou leurs loisirs, comme la création musicale. Mais elles ont peur de la complexité technique.
Vendredi après-midi, un salon destiné aux visiteurs généraux s'est tenu sur le site du WAIC, au cours duquel de nombreux créateurs de contenu d'IA chinois et des initiés de l'industrie ont parlé de la manière dont l'IA affecte les gens ordinaires et apporte des opportunités à tous les horizons.
Li Yichen, co-organisateur du salon, a déclaré que l'événement était spécialement destiné au grand public qui ne connaît pas bien l'AIGC. « Grâce à cet événement, nous espérons que notre public pourra comprendre que l'IA n'est pas inaccessible ; elle est étroitement liée à nos vies », a déclaré Li au Chine Direct.
« L'AIGC est une tendance majeure de développement futur. Nous espérons que davantage de personnes connaîtront le secteur, s'y intéresseront et y participeront probablement un jour », a-t-il déclaré.
Li est l'un des créateurs AIGC les plus influents de Chine. En février, Li et des dizaines de créateurs ont organisé le tout premier gala du Nouvel An chinois en ligne. Le gala de 150 minutes, composé de plus de 50 programmes vidéo ou musicaux générés par l'IA, a attiré des millions de vues.
Le seuil d'accès à l'AIGC est en réalité très bas pour le grand public, car n'importe qui peut créer une image, une vidéo ou un morceau de musique en une minute seulement à l'aide d'outils d'IA, a déclaré M. Li. « Néanmoins, la création de contenu de haute qualité nécessite une accumulation de connaissances et d'esthétique des créateurs, ainsi que leur capacité en termes d'apprentissage continu », a-t-il ajouté.
Li a été l'un des premiers membres de l'Alliance industrielle AIGC de Chine. L'alliance est principalement engagée dans la vulgarisation des connaissances et des compétences AIGC auprès des start-ups liées au domaine et du grand public, a déclaré Ni.
M. Ni a déclaré que l'alliance organise régulièrement des cours et des ateliers ouverts à but non lucratif, invitant des experts en recherche et en application de l'IA générative à partager leurs expériences de première ligne en matière de création de contenu IA et d'entrepreneuriat. « Nous avons également créé des packages d'outils d'IA générative pour divers groupes, tels que les étudiants, les fonctionnaires et les concepteurs, qui peuvent télécharger ces packages d'outils gratuitement », a-t-il déclaré au Chine Direct.
En parlant de l'avenir prometteur des applications de l'AIGC, Li a déclaré que l'application pouvait apporter beaucoup dans des domaines professionnels tels que la finance et la santé. « Pour les gens ordinaires, l'IA générative peut être une nouvelle forme de divertissement, car les utilisateurs peuvent créer leurs propres images, vidéos et œuvres musicales pour le plaisir avec des outils d'IA conviviaux », a-t-il ajouté.