Der Forschungszweig für künstliche Intelligenz (KI) von Huawei hat Vorwürfe zurückgewiesen, eine Version seines großen Sprachmodells Pangu Pro habe Elemente eines Alibaba-Modells kopiert, und betont, das Modell sei unabhängig entwickelt und trainiert worden.
Die Abteilung mit dem Namen Noah Ark Lab machte die Ankündigung Ende letzter Woche, nachdem eine Entität namens HonestAGI ein englischsprachiges Dokument auf der Quellcode-Sharing-Plattform Github veröffentlicht hatte, in dem es hieß, dass Huaweis Modell Pangu Pro Moe (Mixture of Experts) eine „ungewöhnliche Korrelation“ mit Alibabas Modell Qwen 2.5 14B aufweise.
Der Artikel argumentiert, dass dies zeige, dass das Modell von Huawei durch „Upcycling“ entstanden sei und nicht von Grund auf neu trainiert wurde.
Die oben genannten Informationen haben in der KI-Community und in den chinesischen Medien breite Diskussionen ausgelöst.
In einer Erklärung sagte Noah Ark Lab, das Modell sei „nicht auf zusätzliches Training durch Modelle anderer Hersteller angewiesen“.
Sie behaupten, bedeutende Neuerungen im architektonischen Design und bei den technischen Merkmalen vorgenommen zu haben, und sagen, dass dies das erste Großmodell sei, das vollständig auf den Ascend-Chips von Huawei basiere.
Die Abteilung erklärte außerdem, dass ihr Entwicklungsteam sich bei der Verwendung von Code von Drittanbietern strikt an die Open-Source-Lizenzanforderungen hielt, gab jedoch nicht an, welche Open-Source-Modelle sie konsultiert hatten.
Die Einführung des Open-Source-Modells R1 durch das Startup DeepSeek im Januar 2025 schockierte Silicon Valley mit seinen niedrigen Kosten und einer Leistung, die mit anderen teuren Modellen vergleichbar ist.
Gleichzeitig löste DeepSeek einen erbitterten Wettbewerb unter den chinesischen Technologiegiganten um die Entwicklung preislich konkurrenzfähiger KI-Produkte aus.
Qwen 2.5-14B wurde im Mai 2024 veröffentlicht und ist eines der kleinen Modelle der Qwen 2.5-Serie von Alibaba. Dieses Modell kann sowohl auf Personal Computern (PCs) als auch auf Smartphones eingesetzt werden.
Während sich Qwen an den Mainstream-Konsumenten richtet und ähnliche Dienste wie ChatGPT bietet, werden die Pangu-Modelle von Huawei eher im Regierungsbereich sowie im Finanz- und Fertigungssektor eingesetzt.
Obwohl Huawei mit der Markteinführung von Pangu im Jahr 2021 schon früh in das große Spiel der Sprachmodellierung eingestiegen ist, ist das Unternehmen seitdem Berichten zufolge hinter seine Konkurrenten zurückgefallen.
Huawei hat seine Pangu Pro Moe-Modelle Ende Juni auf der chinesischen Entwicklerplattform GitCode als Open Source veröffentlicht.
Ziel ist es, die Einführung der KI-Technologie von Huawei zu fördern, indem Entwicklern kostenloser Zugriff auf diese Modelle gewährt wird./.
Quelle: https://www.vietnamplus.vn/huawei-phu-nhan-sao-chep-mo-hinh-ai-cua-alibaba-post1048537.vnp
Kommentar (0)