Une photo concept de l’intelligence artificielle (IA) Photo : VCG
Au cours d'une série de démonstrations en direct, la remarquable capacité de compréhension, la réactivité rapide et la capacité humaine à faire preuve d'empathie et à transmettre des émotions de GPT-4o ont laissé le public impressionné. En 24 heures, Google a publié ses principales mises à jour avec notamment le lancement de Gemini 1.5 Flash et du Project Astra, entre autres.
Selon OpenAI, le GPT-4o a formé un nouveau modèle unique de bout en bout pour le texte, la vision et l'audio, ce qui lui permet de présenter une interaction homme-machine beaucoup plus naturelle, avec un temps de réponse aux entrées audio de 232 millisecondes. ce qui est similaire au temps de réponse humain dans une conversation.
La norme établie par ce modèle, combinant toutes les modalités de texte, d'image et d'audio, est quelque chose que les grandes entreprises chinoises tentent également d'atteindre. Au milieu des mises à jour rapides des produits OpenAI et Google, à quelles étapes en sont les grandes entreprises nationales ?
« Un coup de poing différent »
« Il est bien trop naturel de dire que c'est en réalité une machine qui parle. La variété de son ton, de son intonation et sa capacité à comprendre les émotions sont très similaires à celles d'un être humain », Xiao Yanghua, professeur d'informatique à Fudan. University, également directeur du Shanghai Key Laboratory of Data Science, a déclaré au Chine Direct en décrivant le GPT-4o.
Les humains sont incapables d’apprendre à comprendre et à exprimer leurs émotions sans s’adapter à un environnement social. OpenAI a relevé ce défi technique important en formant des données multimodales, a déclaré Xiao. « L'émergence du GPT-4o a essentiellement atteint l'objectif d'une interaction naturelle entre l'homme et la machine que l'informatique poursuivait au cours des 80 dernières années. »
De nombreuses entreprises chinoises, dont ByteDance, Alibaba et MiniMax, recherchent et développent des produits dotés de capacités de compréhension complètes. Pourtant, les experts affirment que de plus en plus de produits sur le marché sont axés sur des agents légers tels que les moteurs de recherche IA et les assistants professionnels. Ceux-ci sont difficilement capables de rivaliser avec GPT, même au niveau de l’interaction audio en temps réel.
Le produit C-end « Small Conch » récemment lancé par la startup chinoise MiniMax peut fournir des conversations vocales en temps réel. Il présente un sens clair de l’IA en termes de vitesse de réaction, d’expression, de timbre et d’émotion, comme le montrent les vidéos de démonstration de l’entreprise.
Rattraper le GPT-4o est quelque chose qui peut être fait par les entreprises nationales lorsque le déficit de capacité informatique nationale aura été progressivement comblé, a déclaré Li Baiyang, professeur adjoint au centre de recherche sur l'innovation en gestion des données de l'Université de Nanjing, au Chine Direct.
Le développement de grands modèles de base devrait être réalisé par des sociétés d’IA de premier plan possédant une solide expérience financière. De ce point de vue, la Chine possède des produits exceptionnels et compétitifs, a indiqué M. Li.
Par exemple, Alibaba Cloud, l'épine dorsale de la technologie numérique et de l'intelligence du groupe Alibaba, a récemment annoncé le lancement de Tongyi Qianwen 2.5, devenant ainsi l'un des grands modèles les plus populaires auprès des entreprises chinoises.
Selon les dernières données, Tongyi compte plus de 90 000 entreprises de services via Alibaba Cloud et plus de 2,2 millions d'entreprises de services via Dingding, et a désormais atterri dans les domaines des ordinateurs, des téléphones portables, de l'automobile, de l'aviation, de l'astronomie, des mines, de l'éducation, des soins médicaux et de la restauration. , jeux, tourisme culturel et autres domaines.
Mais Li a souligné que toutes les entreprises n’ont pas besoin de développer leurs propres grands modèles linguistiques. Un plus grand nombre de petites et moyennes entreprises d’IA en Chine devraient continuer à rivaliser pour l’espace au niveau des applications.
Li a poursuivi en affirmant que l'écart actuel avec les États-Unis réside dans le fait que les capacités sont toujours orientées vers un produit personnel de consommation, comme le GPT-4o. Cependant, a ajouté Xiao, la Chine peut exploiter de grands modèles pour réaliser des applications révolutionnaires.
« Lorsque les États-Unis lancent un coup de poing du gauche, la Chine pourrait contrer avec un coup de poing du droit. Quelle que soit la force de son coup de poing du gauche, nous pouvons toujours donner notre coup de poing du droit », a illustré de manière frappante la recherche actuelle par la Chine d'un avantage dans le développement de la technologie de l'IA.
Des outils techniques aux « assistants » capables de comprendre les besoins individuels, dans le processus d'industrialisation de l'IA, en répartissant plus équitablement la charge de travail des grands modèles entre les cloud publics, les cloud privés, les périphéries et les terminaux, elle contribue à conduire la transformation intelligente de diverses industries. , ont déclaré les observateurs de l’industrie.
Il est important de noter que les smartphones basés sur l'IA en Chine devraient apporter une avancée majeure en termes de fonctionnalités aux smartphones. Au début de cette année, les smartphones Honor ont lancé une nouvelle génération de systèmes d'exploitation à scénario complet, avec une utilisation mensuelle de son grand modèle atteignant 15 millions de fois et une utilisation maximale quotidienne atteignant 850 000 fois, selon le Beijing Youth Daily. .
Un autre point fort de l’utilisation accélérée de l’IA est son déploiement d’applications dans les véhicules connectés intelligents, allant de l’interaction plus naturelle avec les personnes dans des cabines intelligentes à la reconnaissance précise des personnes et des objets à l’intérieur et à l’extérieur du véhicule. Les grands modèles peuvent également améliorer l’efficacité et la sécurité des systèmes de conduite autonome. Selon l'agence de presse Xinhua, il existe plus de 10 marques de voitures proposant de grands modèles.
S'attaquer au noyau
Depuis le premier semestre, les principaux acteurs de la course aux grands modèles, tels que iFlytek et SenseTime, ont continuellement itéré de nouvelles fonctionnalités de leurs grands modèles au niveau des produits, visant exclusivement à accroître l'efficacité du segment des flux de travail.
En termes d'amélioration de l'efficacité, la contribution des applications de l'IA est significative, en particulier dans la rédaction de documents et augmente même de 30 à 50 % l'écriture de code des programmeurs, a déclaré Xiao.
La valeur des applications de l'IA peut être pleinement utilisée lorsque la technologie est capable de jouer un rôle dans la lutte contre les « liens essentiels des industries », élargissant ainsi davantage la recherche par la Chine d'un avantage dans les applications de l'IA avec les États-Unis, a expliqué Xiao.
Il a mentionné que l’IA aide les investisseurs à prendre des décisions d’investissement dans le secteur financier, par exemple en repérant les failles potentielles dans les contrats. Dans le domaine médical, lorsque les experts médicaux ne le peuvent pas, l’IA est capable d’identifier les maladies spécifiques dont souffrent les patients.
L'IA peut compenser les limites et les défauts de la cognition humaine dans diverses industries, a résumé Xiao. À cet égard, aucune application de niveau tueur n’a émergé de l’étranger, et il en va de même en Chine, a-t-il ajouté.
Li, qui a récemment mené des tests approfondis sur de grands modèles, a déclaré au Chine Direct que « l'amélioration de la culture numérique à l'échelle nationale permettra en outre de libérer l'immense potentiel des applications d'IA sur le marché ».
La Chine possède un vaste marché et le potentiel de cette technologie de pointe ne sera pleinement exploité qu'à mesure que davantage d'utilisateurs se familiariseront avec les dernières avancées et obtiendront un accès complet.