A Qwen-3-Max-Preview modell több mint egybillió paraméterrel rendelkezik. Fotó: Reuters . |
Az Alibaba Group Holding bemutatta eddigi legnagyobb mesterséges intelligencia modelljét, amely újabb lépést jelent a globális MI-versenyben. A Qwen-3-Max-Preview névre keresztelt modell a kínai technológiai csoport első olyan modellje, amely átlépte az egybillió paraméteres küszöböt, ezzel az Alibabát olyan „óriások” sorába helyezve, mint az OpenAI, a Google DeepMind vagy az Anthropic.
A szeptember 5-én kiadott új modell már elérhető az Alibaba Cloudon és a főbb nyelvi modell piactéren, az OpenRouteren. A Qwen-3-Max-Preview a Qwen3 sorozatot követi, amelyet először májusban mutattak be 600 milliótól 235 milliárd paraméterig terjedő verziókkal.
A mesterséges intelligenciában a paramétereket a rendszer „intelligenciájának” tekintik, azaz azokat a változókat, amelyeket a betanítás során módosítanak. A nagyobb számú paraméter jellemzően nagyobb teljesítményt jelent, de hatalmas számítási teljesítményt is igényel. Összehasonlításképpen, az OpenAI GPT-4.5-e, az egyik legnagyobb ma elérhető modell, a becslések szerint 5-7 billió paraméterrel rendelkezik.
A bejelentés szerint a Qwen-3-Max-Preview egy szövegfeldolgozó modell, amely felülmúlja a Qwen3-235B-A22B-2507-et. Belső tesztekben a Qwen-3-Max-Preview jobban teljesített, mint a MoonShot AI Kimi K2-je, a Claude Opus 4 nem következtetéses verziója, és a DeepSeek V3.1, amely támogatja az Anthropic formátumát. Ezeket a benchmarkokat azonban nem tartalmazták a hivatalos technikai jelentésben.
„A Qwen-3-Max-Preview jelentős fejlesztéseket mutat az általános képességek terén, a kínai és angol szövegek megértésétől kezdve az összetett utasítások végrehajtásán, a szubjektív feladatok kezelésén, több nyelv támogatásán át az eszközök használatáig. A bővítés még folyamatban van, és a hivatalos kiadás további meglepetéseket tartogat majd” – áll az Alibaba közleményében.
Az évek során a Qwen segített az Alibabának kitűnni a globális nyílt forráskódú mesterséges intelligencia ökoszisztémában. Ezek a modellek több mint 20 millió letöltést értek el, és 100 000 származékos modellt generáltak a Hugging Face platformon. A Qwen-3-Max-Preview azonban nem nyílt forráskódú. A felhasználók csak az Alibaba Cloudon vagy az OpenRouteren keresztül férhetnek hozzá, hasonlóan a Qwen2.5-Maxhoz.
A közösségi médiában Binyuan Hui, az Alibaba mesterséges intelligencia mérnöke elárulta, hogy a modell „érvelésen alapuló” változata még fejlesztés alatt áll.
A Qwen-3-Max-Preview elérésének költsége az Alibaba Cloudon szintén a legmagasabbak közé tartozik a Qwen családban. A kezdőár 0,861 dollár millió bemeneti tokenenként és 3,441 dollár millió kimeneti tokenenként. Eközben a Qwen3-235B-A22B-2507 verzió mindössze 0,287 dollárba kerül millió bemeneti tokenenként és 1,147 dollárba millió kimeneti tokenenként.
Forrás: https://znews.vn/alibaba-cong-bo-mo-hinh-thach-thuc-openai-post1583459.html
Hozzászólás (0)