Společnosti zabývající se umělou inteligencí hledají velké zisky z „drobných jazykových modelů“

Společnosti Apple, Microsoft, Meta a Google nedávno vydaly nové modely umělé inteligence s menším počtem „parametrů“, ale stále výkonnými funkcemi. Tento krok je součástí snahy technologických skupin povzbudit finančně omezené podniky k používání umělé inteligence.

Firmy, které chtějí dosahovat velkých zisků z modelů malých podniků, obrázek 1 — Ilustrace: FT

Obecně řečeno, čím vyšší je počet parametrů, tím lepší je výkon softwaru umělé inteligence a tím složitější a propracovanější jsou jeho úkoly. Nejnovější model GPT-4o od OpenAI a Gemini 1.5 Pro od Googlu, oba oznámené tento týden, mají odhadem více než 1 bilion parametrů. Meta mezitím trénuje verzi svého open-source modelu Llama se 400 miliardami parametrů.

Obavy ohledně dat a odpovědnosti za autorská práva vedly velké technologické společnosti jako Meta a Google k vydání malých jazykových modelů s pouhými několika miliardami parametrů, které jsou levnější, energeticky úspornější, přizpůsobitelné, vyžadují méně energie k trénování a provozu a mohou také zabránit ukládání citlivých dat.

„Získáním této vysoké kvality za nižší cenu ve skutečnosti získáte přístup k více aplikacím pro zákazníky,“ řekl Eric Boyd, viceprezident společnosti Microsoft pro platformu Azure AI, která prodává modely umělé inteligence firmám.

Google, Meta, Microsoft a francouzský startup Mistral také vydaly malé jazykové modely, ale stále vykazují pokrok a mohou se lépe soustředit na konkrétní úkoly.

Nick Clegg, prezident společnosti Meta pro globální záležitosti, uvedl, že nový model Llama 3 s 8 miliardami parametrů je srovnatelný s GPT-4. Microsoft uvedl, že jeho malý model Phi-3 se 7 miliardami parametrů překonává GPT-3.5, předchozí verzi modelu OpenAI.

Mikročipy mohou také zpracovávat úkoly lokálně v zařízení, namísto odesílání informací do cloudu, což by mohlo oslovit zákazníky, kteří dbají na soukromí a chtějí zajistit, aby informace zůstaly v síti.

Charlotte Marshallová, partnerka v advokátní kanceláři Addleshaw Goddard, uvedla, že „jednou z výzev, kterým podle mě mnoho našich klientů čelí“ při zavádění generativních produktů umělé inteligence, je dodržování regulačních požadavků týkajících se zpracování a přenosu dat. Řekla, že menší modely nabízejí „podnikům příležitost překonat“ regulační a nákladové obavy.

Menší modely také umožňují běh funkcí umělé inteligence na zařízeních, jako jsou mobilní telefony. Model „Gemini Nano“ od Googlu je zabudován do nejnovějších telefonů Pixel a nejnovějšího smartphonu S24 od Samsungu.

Apple také oznámil, že vyvíjí modely umělé inteligence, které budou fungovat na jeho nejprodávanějším iPhonu. Minulý měsíc tento gigant ze Silicon Valley vydal OpenELM, malý model určený k provádění textových úkolů.

Boyd z Microsoftu uvedl, že menší modely povedou k „zajímavým aplikacím, a to až po telefony a notebooky“.

Ředitel společnosti OpenAI Sam Altman v listopadu uvedl, že společnost nabízí zákazníkům modely umělé inteligence různých velikostí „pro různé účely“. „Existují věci, které menší modely zvládnou opravdu dobře. Z toho jsem nadšený,“ řekl.

Altman však dodal, že OpenAI se i nadále zaměří na budování větších modelů umělé inteligence se škálovatelností, včetně schopnosti uvažovat, plánovat a provádět úkoly a v konečném důsledku dosáhnout inteligence na lidské úrovni.

Hoang Hai (podle FT)

Zdroj: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html