ファーウェイの人工知能(AI)研究部門は、同社の大規模言語モデル「Pangu Pro」のバージョンがアリババのモデルの要素をコピーしたという疑惑を否定し、同モデルは独自に開発され、トレーニングされたと主張した。
ノアアークラボと呼ばれるこの部門は、HonestAGIと呼ばれる団体がソースコード共有プラットフォームGithubに英語の論文を投稿し、ファーウェイのPangu Pro Moe(専門家の混合)モデルがアリババのQwen 2.5 14Bモデルと「異常な相関関係」があると述べたことを受けて、先週末にこの発表を行った。
記事は、これはファーウェイのモデルが「アップサイクリング」を通じて作成されたものであり、ゼロからトレーニングされたものではないことを示していると主張している。
上記の情報は、AIコミュニティや中国のメディアで幅広い議論を引き起こしました。
ノアアークラボは声明の中で、このモデルは「他社のモデルによる追加トレーニングに依存していない」と述べた。
同社は、アーキテクチャ設計と技術的特徴において大きな革新を遂げたと主張しており、これは完全にファーウェイのAscendチップで構築された初の大規模モデルであるとしている。
同局はまた、開発チームが使用するサードパーティのコードについてオープンソースのライセンス要件を厳格に遵守していると述べたが、どのようなオープンソースモデルを参考にしたかは明らかにしなかった。
2025年1月にスタートアップ企業DeepSeekがオープンソースのR1モデルを発売すると、その低コストと他の高価なモデルに匹敵する性能でシリコンバレーに衝撃を与えた。
同時に、DeepSeekは、競争力のある価格のAI製品を開発するために、中国のテクノロジー大手の間で激しい競争を引き起こした。
Qwen 2.5-14Bは2024年5月に発売され、アリババのQwen 2.5シリーズの小型モデルの一つです。このモデルは、パソコン(PC)とスマートフォンの両方に展開できます。
Qwen は一般消費者を対象としており、ChatGPT と同様のサービスを提供していますが、Huawei の Pangu モデルは政府業務や金融、製造業でより多く使用される傾向があります。
ファーウェイは2021年にPanguを初めて発売して言語モデリングの大きなゲームに早くから参入したが、その後、競合他社に遅れをとっていると報じられている。
ファーウェイは6月下旬、中国の開発者プラットフォームGitCodeでPangu Pro Moeモデルをオープンソース化した。
開発者にこれらのモデルへの無料アクセスを提供することで、Huawei の AI テクノロジーの採用を促進することが目標です。
出典: https://www.vietnamplus.vn/huawei-phu-nhan-sao-chep-mo-hinh-ai-cua-alibaba-post1048537.vnp
コメント (0)