Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

Dr. Dao Duc Minh: „Zvládnutí vietnamských dat je prvním krokem k rozvoji a zvládnutí vietnamských technologií“

Báo Thanh niênBáo Thanh niên27/05/2024

obrázek Poté, co jste v USA pracoval pro velkou organizaci zabývající se umělou inteligencí, proč jste se rozhodl vrátit do Vietnamu a připojit se k VinBigdata? Během práce v USA jsem se sice účastnil mnoha velkých vládních projektů, ale výsledky, kterých jsem dosáhl, byly často jen několika kroky ve velkém procesu zpracování. Mnohokrát jsem kvůli velmi přísným postupům důvěrnosti projektů ani nevěděl, jak se řešení, která jsem vyvinul, používají. V roce 2017 jsem se vrátil do Vietnamu, když byl Vietnam ve fázi vývoje a bylo třeba vyřešit mnoho problémů souvisejících s velkými daty a umělou inteligencí. Přijal jsem pozvání profesora Vu Ha Vana, abychom společně realizovali cíl vývoje vietnamských technologických řešení, která budou sloužit životům vietnamských lidí. Svůj návrat do Vietnamu považuji za mnohem smysluplnější, protože budu moci pracovat na problémech s větším dopadem.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr. Dao Duc Minh na workshopu

NVCC

Jaká je role a vliv velkých dat ve strategii rozvoje umělé inteligence? Data hrají velmi důležitou a cennou roli při trénování umělé inteligence. Pro trénování vysoce kvalitního modelu umělé inteligence často začínáme trénováním velké databáze. Abychom tedy měli kvalitní umělou inteligenci, musíme nejprve mít kvalitní data. Dobrá data musí splňovat standardy z hlediska kvantity a rozsahu, kvality, rozmanitosti a univerzálnosti. Proces sběru a zpracování tisíců hodin dat od kroku čištění surových dat až po vytvoření dat nejvyšší kvality, která se použijí v modelu umělé inteligence, je velmi nákladný a složitý. Naopak, pro analýzu velkých dat musíme umělou inteligenci použít, abychom zajistili schopnost přesně zpracovávat data ve velkém měřítku, a tím vytvářeli rozhodnější nebo prediktivní výsledky. Například při vývoji produktu virtuálního asistenta pro Vietnamce (ViVi) jsme museli shromáždit a zpracovat desítky tisíc hodin vysoce kvalitních zvukových dat, od stovek tisíc hlasů z různých regionů, různého věku a pohlaví, s obsahem zahrnujícím stovky oblastí... Nebo nejnověji spuštění ViGPT - „první vietnamské verze ChatGPT pro koncové uživatele“ vyvinuté z modelu Big Language Model, který plně vlastní VinBigdata. Tento model byl natrénován na základě 600 GB zpřesněných vietnamských dat z mnoha různých oblastí. Díky našemu porozumění vietnamským datům a jazyku jsme našli nový přístup, jak zkrátit dobu spuštění ViGPT na pouhých 9 měsíců od zrodu ChatGPT. Toto je rezonance mezi velkými daty a umělou inteligencí.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
Jaký je váš názor na propojení výzkumu s praktickou hodnotou ve prospěch komunity? - Věřím, že technologický výzkum je skutečně úspěšný pouze tehdy, když skutečně vstupuje do života, řeší sociální problémy a zlepšuje životy lidí. Abychom mohli vytvářet praktické komerční produkty a řešit obchodní a sociální problémy, musíme si vždy klást otázku: jakou hodnotu data přinesou životu? Doposud jsme zkoumali řadu produktů a řešení v různých odvětvích a oblastech, typicky ViGPT, VinDr - poskytující řešení umělé inteligence v lékařské zobrazovací diagnostice, VinBase - platformu pro umělou inteligenci nebo Vizone - sadu inteligentních řešení pro analýzu obrazu.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

S klíčovými pracovníky VinBigdata na akci společnosti Vingroup Corporation

NVCC

4. průmyslová revoluce probíhá silně v globálním měřítku. Jaké výhody podle vás Vietnam má? Ve srovnání s předchozími revolucemi si myslím, že Vietnam má v současné době mnoho výhod, které může v této 4.0 průmyslové revoluci prorazit a pomoci tak zlepšit postavení země na mapě světa . Dva klíče k dosažení tohoto cíle jsou data a lidé. Vietnam má v současné době téměř 100 milionů obyvatel, z nichž vysoký podíl mladých lidí používá telefony a osobní počítače. Kromě toho máme prestižní odborníky na umělou inteligenci a mladý, vysoce kvalitní personál v oblasti informačních technologií a máme velmi dobrý základ v matematice. A co omezení? Prvním omezením, které lze pozorovat, je, že i přes velkou populaci máme stále potíže se zvládáním dat, konkrétně se standardizací a synchronizací dat v zařízeních, obchodních jednotkách a administrativách. Kromě toho čelíme i dalším omezením, jako jsou omezené investiční zdroje, zejména investice do vysoce výkonné výpočetní infrastruktury.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
Jak důležité je podle vašeho názoru zvládnutí vietnamských dat při vytváření a osvojování technologií sloužících životům Vietnamců? V současné době existuje mnoho předních produktů umělé inteligence na světě, typicky produktů s aplikacemi umělé inteligence vytvořených na základě velkých jazykových modelů, jako je ChatGPT od OpenAI nebo Bard od Googlu. Vietnamština však není klíčovou jazykovou skupinou pro vývoj těchto produktů. Proto je kvalita obsahu specifického pro vietnamštinu vráceného uživatelům víceméně ovlivněna a existuje vysoká pravděpodobnost chyb, což je nebezpečnější, chyb v základních znalostech. Jako Vietnamci máme výhodu přístupu k vlastním zdrojům dat. Pouze my máme schopnost porozumět charakteristikám vietnamských dat, potřebám a charakteristikám Vietnamců. Zvládnutí vietnamských dat je proto skutečně klíčem k ovládnutí základních technologií, které jsou zároveň technologiemi, jež budou sloužit Vietnamcům.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Interní školení pro členy VinBigdata

NVCC

Jak přistupovat ke konkrétním zdrojům dat, zejména když většina Vietnamců dnes používá sociální sítě ze zahraničí? Ve skutečnosti je největším zdrojem lidských dat dnes (nejen Vietnamců) internet a sociální sítě. Stále však můžeme přistupovat k datům a shromažďovat je z různých zdrojů, na základě pochopení charakteristik vietnamských dat, v závislosti na charakteristikách nastavených každým projektem. Například GPT modely OpenAI mají stovky, dokonce biliony parametrů, jsou trénovány na obrovském množství dat a stojí miliardy dolarů. Ve srovnání s nimi jsme na základě našeho výzkumu, možností a zdrojů zvolili zcela jiný směr: tedy vytvoření vietnamského jazykového modelu s architekturou pouze několika miliard parametrů, trénovaného na 600 GB sadě vietnamských dat, která jsme sami shromáždili a zdokonalili, ale má stejnou schopnost zpracovávat vietnamštinu. Výsledky ukazují, že naše vlastní architektura se dokáže sama optimalizovat, zkrátit dobu trénování jazykového modelu, snížit náklady a zároveň zajistit kvalitu modelu. S jakými výzvami jste se vy a váš tým setkali v procesu výzkumu a vývoje produktů umělé inteligence? První výzvou je jistě čas. Vlna technologií umělé inteligence se blíží velmi rychle a nachází se v období exploze. Přední technologické společnosti ve světě rychle uvádějí na trh vysoce komplexní produkty, které jsou neustále aktualizovány a vylepšovány. Pokud budeme pomalí a neuvedeme produkty včas, jistě se zaostáváme. Na druhou stranu, pokud chceme vytvářet produkty, které lze aplikovat a řešit praktické společenské problémy, musíme také zvážit nalezení a rozvoj vynikajících, speciálních a jedinečných vlastností produktu.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Prezentace na Vietnamském dni umělé inteligence (AI4VN 2023)

NVCC

Ve skutečnosti mnoho jednotlivců a organizací ve Vietnamu i po celém světě utrpělo velké ztráty v důsledku úniků dat. Jak se díváte na problematiku zabezpečení dat? Dá se říci, že každá aplikace dnes vychází z dat. Při práci s daty musíme na jedné straně zajistit cíl využití dat k vytvoření nejlepší technologie pro život a na druhé straně musíme zajistit zabezpečení dat pro jednotlivce i organizace. Lidský faktor je velmi důležitým článkem v procesu zajišťování zabezpečení dat. Patří mezi ně vývojáři, uživatelé produktů a uživatelé. Pro vývojáře musí být povědomí o zabezpečení dat přítomno od samého začátku sběru a zpracování dat. Často, když se nevyskytne žádný problém, si nejsme vědomi důležitosti zabezpečení dat. Pokud však dojde k úniku dat, škody mohou být obrovské. K narušení dat může dojít v důsledku technických problémů nebo úmyslných útoků krádeží dat. Pokud dojde k narušení dat, jednotlivci nebo organizace mohou své informace zneužít k nezákonným účelům zločinci, zatímco podniky mohou utrpět finanční ztráty při řešení souvisejících problémů a dokonce i poškození své značky.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Dr. Dao Duc Minh a tým VinBigdata na akci

NVCC

Po snaze ovládnout technologie pro služby vietnamskému lidu musí následovat kroky k postupu do světa? Každá organizace nebo podnik, který chce uvést své produkty na mezinárodní trh, musí splňovat mezinárodní standardy. VinBigdata má silné stránky v oblasti řešení a technologií, takže je přirozené stanovit si vizi dobýt svět. Pro nasazení mnoha různých produktů a aplikací je samozřejmě nezbytná společnost mezinárodních jednotek s dlouholetými zkušenostmi a porozuměním uživatelům z celého světa. Děkujeme!

Thanhnien.vn

Zdroj: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Komentář (0)

No data
No data

Ve stejném tématu

Ve stejné kategorii

Stará čtvrť Hanoje se obléká do nových „šat“ a skvěle vítá Festival středu podzimu
Návštěvníci tahají sítě, šlapou v bahně, aby chytili mořské plody, a voňavě je grilují v brakické laguně středního Vietnamu.
Y Ty je brilantní se zlatou barvou zralého rýžového období
Stará ulice Hang Ma se „převléká“ na uvítanou Svátku středu podzimu

Od stejného autora

Dědictví

Postava

Obchod

No videos available

Zprávy

Politický systém

Místní

Produkt