La división de investigación de inteligencia artificial (IA) de Huawei ha negado las acusaciones de que una versión de su modelo de lenguaje grande Pangu Pro copió elementos de un modelo de Alibaba, insistiendo en que el modelo fue desarrollado y entrenado de forma independiente.
La división, llamada Noah Ark Lab, hizo el anuncio a fines de la semana pasada después de que una entidad llamada HonestAGI publicara un documento en inglés en la plataforma de intercambio de código fuente Github, diciendo que el modelo Pangu Pro Moe (Mezcla de expertos) de Huawei tenía una "correlación inusual" con el modelo Qwen 2.5 14B de Alibaba.
El artículo sostiene que esto demuestra que el modelo de Huawei se creó a través de “upcycling” y no se entrenó desde cero.
La información anterior ha provocado amplios debates en la comunidad de IA y en los medios de comunicación chinos.
En un comunicado, Noah Ark Lab dijo que el modelo “no depende del entrenamiento adicional de los modelos de otros fabricantes”.
Afirman haber realizado innovaciones significativas en diseño arquitectónico y características técnicas, diciendo que este es el primer modelo a gran escala construido completamente con chips Ascend de Huawei.
La división también dijo que su equipo de desarrollo se adhirió estrictamente a los requisitos de licencia de código abierto para cualquier código de terceros utilizado, pero no especificó qué modelos de código abierto consultaron.
El lanzamiento del modelo de código abierto R1 por la startup DeepSeek en enero de 2025 sorprendió a Silicon Valley por su bajo coste y un rendimiento comparable al de otros modelos caros.
Al mismo tiempo, DeepSeek también provocó una feroz competencia entre los gigantes tecnológicos chinos para desarrollar productos de IA a precios competitivos.
El Qwen 2.5-14B se lanzó en mayo de 2024 y es uno de los modelos pequeños de la serie Qwen 2.5 de Alibaba. Este modelo es compatible tanto con ordenadores personales (PC) como con smartphones.
Si bien Qwen está dirigido a los consumidores generales y tiene servicios similares a ChatGPT, los modelos Pangu de Huawei tienden a usarse más en operaciones gubernamentales , así como en los sectores financiero y manufacturero.
Si bien Huawei fue uno de los primeros en ingresar al gran juego del modelado del lenguaje con el lanzamiento inicial de Pangu en 2021, desde entonces se informa que se ha quedado atrás de sus rivales.
Huawei publicó el código abierto de sus modelos Pangu Pro Moe en la plataforma de desarrolladores china GitCode a fines de junio.
El objetivo es promover la adopción de la tecnología de inteligencia artificial de Huawei proporcionando acceso gratuito a estos modelos a los desarrolladores.
Fuente: https://www.vietnamplus.vn/huawei-phu-nhan-sao-chep-mo-hinh-ai-cua-alibaba-post1048537.vnp
Kommentar (0)