La branche de recherche en intelligence artificielle (IA) de Huawei a nié les allégations selon lesquelles une version de son grand modèle de langage Pangu Pro aurait copié des éléments d'un modèle Alibaba, insistant sur le fait que le modèle avait été développé et formé de manière indépendante.
La division, appelée Noah Ark Lab, a fait cette annonce à la fin de la semaine dernière après qu'une entité appelée HonestAGI a publié un article en anglais sur la plateforme de partage de code source Github, affirmant que le modèle Pangu Pro Moe (mélange d'experts) de Huawei avait une « corrélation inhabituelle » avec le modèle Qwen 2.5 14B d'Alibaba.
L'article soutient que cela montre que le modèle de Huawei a été créé par le biais du « upcycling » et non formé à partir de zéro.
Les informations ci-dessus ont suscité de nombreuses discussions au sein de la communauté de l’IA et dans les médias chinois.
Dans un communiqué, Noah Ark Lab a déclaré que le modèle « ne s'appuie pas sur une formation supplémentaire provenant de modèles d'autres fabricants ».
Ils affirment avoir apporté des innovations significatives dans la conception architecturale et les caractéristiques techniques, affirmant qu'il s'agit du premier modèle à grande échelle entièrement construit sur les puces Ascend de Huawei.
La division a également déclaré que son équipe de développement respectait strictement les exigences de licence open source pour tout code tiers utilisé, mais n'a pas précisé quels modèles open source ils consultaient.
Le lancement du modèle open source R1 par la startup DeepSeek en janvier 2025 a choqué la Silicon Valley avec son faible coût et ses performances comparables à d'autres modèles coûteux.
Dans le même temps, DeepSeek a également déclenché une concurrence féroce entre les géants technologiques chinois pour développer des produits d’IA à des prix compétitifs.
Le Qwen 2.5-14B, sorti en mai 2024, est l'un des petits modèles de la série Qwen 2.5 d'Alibaba. Il peut être déployé aussi bien sur les ordinateurs personnels (PC) que sur les smartphones.
Alors que Qwen s'adresse aux consommateurs grand public et propose des services similaires à ChatGPT, les modèles Pangu de Huawei ont tendance à être davantage utilisés dans les opérations gouvernementales ainsi que dans les secteurs financier et manufacturier.
Alors que Huawei a été l'un des premiers à entrer dans le grand jeu de la modélisation linguistique avec le lancement initial de Pangu en 2021, il aurait depuis pris du retard sur ses rivaux.
Huawei a ouvert le code source de ses modèles Pangu Pro Moe sur la plateforme de développement chinoise GitCode fin juin.
L'objectif est de promouvoir l'adoption de la technologie d'IA de Huawei en offrant un accès gratuit à ces modèles aux développeurs./.
Source : https://www.vietnamplus.vn/huawei-phu-nhan-sao-chep-mo-hinh-ai-cua-alibaba-post1048537.vnp
Comment (0)