Miután egy nagy mesterséges intelligenciával foglalkozó szervezetnél dolgozott az Egyesült Államokban, miért döntött úgy, hogy hazatér, és csatlakozik a VinBigdatához?
Az Egyesült Államokban dolgozva, bár számos nagyszabású kormányzati projektben vettem részt, az általam elért eredmények gyakran csupán néhány lépést jelentettek egy nagy folyamatban. Sokszor a projektek szigorú bizalmas kezelése miatt azt sem tudtam, hogyan használják fel az általam kidolgozott megoldásokat.
2017-ben tértem vissza Vietnámba, amikor az ország még fejlesztési szakaszban volt, és számos, a big data és a mesterséges intelligenciával kapcsolatos probléma merült fel, amelyeket meg kellett oldani. Elfogadtam Vu Ha Van professzor meghívását, hogy közösen megvalósítsuk a vietnami technológiai megoldások fejlesztésének célját, amelyek a vietnami emberek életét szolgálják. Sokkal jelentőségteljesebbnek találtam a vietnámi visszatérésemet, mert így nagyobb hatású problémákon dolgozhattam.
Dr. Dao Duc Minh egy workshopon
A mesterséges intelligencia fejlesztésének stratégiájában milyen szerepet és befolyást játszik a big data, uram?
Az adatok hatalmas és értékes szerepet játszanak a mesterséges intelligencia betanításában. Egy kiváló minőségű mesterséges intelligencia modell betanítása gyakran egy nagyméretű adatbázis betanításával kezdődik. Ezért ahhoz, hogy minőségi mesterséges intelligenciával rendelkezzünk, először jó adatokkal kell rendelkeznünk.
A jó minőségű adatokhoz mennyiség és méret, minőség, változatosság és egyetemesség szükséges. A nyers adattisztítási lépéstől kezdve több ezer órányi adat összegyűjtésének és feldolgozásának folyamata, amelynek célja a mesterséges intelligencia modellekbe betáplálható legmagasabb minőségű adatok létrehozása, nagyon költséges és összetett. Ezzel szemben a big data elemzéséhez mesterséges intelligenciát kell használnunk, hogy biztosítsuk az adatok pontos feldolgozásának képességét nagy léptékben, ezáltal jobb döntő vagy prediktív eredményeket hozva létre.
Például egy vietnami embereknek szánt virtuális asszisztens termék (ViVi) fejlesztése során több tízezer órányi kiváló minőségű hangadatot kellett összegyűjtenünk és feldolgoznunk, több százezer hangtól, különböző régiókból, korosztályokból és neműekből, több száz területet felölelő tartalommal...
Vagy a legutóbbi, a ViGPT – „A ChatGPT első vietnami verziója végfelhasználók számára” – bevezetése, amelyet a VinBigdata teljes tulajdonában lévő nagyméretű nyelvi modellből fejlesztettek ki. Ezt a modellt 600 GB finomított vietnami adat alapján képezték ki, amelyek különböző területekről származnak. A vietnami adatok és nyelv ismeretének köszönhetően új megközelítést találtunk a ViGPT bevezetésének lerövidítésére, mindössze 9 hónappal a ChatGPT megszületése után.
Ez a big data és a mesterséges intelligencia közötti rezonancia.
Mi a véleményed a kutatás gyakorlati értékkel való összekapcsolásáról a közösség szolgálata érdekében?
- Úgy hiszem, hogy a technológiai kutatás csak akkor igazán sikeres, ha ténylegesen belép az életbe, társadalmi problémákat old meg és javítja az emberek életét.
Ahhoz, hogy olyan praktikus kereskedelmi termékeket hozzunk létre, amelyek üzleti és társadalmi problémákat oldanak meg, mindig figyelnünk kell, és fel kell tennünk a kérdést: milyen értéket képviselnek az adatok?
Eddig számos terméket és megoldást kutattunk és fejlesztettünk ki különböző iparágak és területek számára, jellemzően a ViGPT-t, a VinDr-t – amely mesterséges intelligencia alapú megoldásokat kínál az orvosi képalkotó diagnosztikában –, a VinBase-t – egy biomesterséges intelligencia platformot, vagy a Vizone-t – egy intelligens képelemző megoldások halmazát.
A VinBigdata kulcsfontosságú munkatársaival a Vingroup Corporation rendezvényén
A 4. ipari forradalom erőteljesen zajlik globális szinten. Milyen előnyei vannak Ön szerint Vietnamnak?
A korábbi forradalmakhoz képest úgy vélem, hogy Vietnamnak jelenleg számos előnye van arra, hogy kitörjön ebben a 4.0 ipari forradalomban, és javítsa az ország helyzetét a világtérképen. E cél elérésének két kulcsa az adat és az emberek.
Vietnámban jelenleg közel 100 millió ember él, akik közül a fiatalok nagy arányban használnak telefont és személyi számítógépet. Emellett elismert szakértőkkel rendelkezünk a mesterséges intelligencia területén, és minőségi fiatal informatikai személyzettel, valamint nagyon jó matematikai alapokkal rendelkezünk.
Szóval, mik a korlátok?
Az első nyilvánvaló korlátozás, hogy a nagy népesség ellenére továbbra is nehézségeink vannak az adatok kezelésével, különösen az adatok szabványosításával és szinkronizálásával a létesítményekben, üzleti egységekben és adminisztrációkban.
Emellett más korlátokkal is szembesülünk, mint például a korlátozott beruházási források, különösen a nagy teljesítményű számítástechnikai infrastruktúrába történő beruházások terén.
Véleménye szerint mennyire fontos a vietnami adatkezelés szerepe a vietnami emberek életét szolgáló technológia létrehozásának és elsajátításának útján?
Jelenleg számos vezető mesterséges intelligencia termék létezik a világon, jellemzően nagy nyelvi modelleken alapuló MI-alkalmazások, mint például az OpenAI ChatGPT-je vagy a Google Bard-ja. A vietnami nyelv azonban nem a fő nyelvi csoport ezen termékek fejlesztéséhez.
Ezért a felhasználóknak visszaküldött vietnami-specifikus tartalom minősége többé-kevésbé változik, és nagy a hibalehetőség, veszélyesebb esetben az alapvető ismeretekben mutatkozó hibák.
Vietnamiként előnyünkre válik, hogy a saját adatforrásainkhoz férhetünk hozzá. Csak mi vagyunk képesek megérteni a vietnami adatok jellemzőit, a vietnami emberek igényeit és jellemzőit. Ezért a vietnami adatok elsajátítása valójában a kulcs az alapvető technológiák elsajátításához, amelyek a vietnami embereket szolgálják.
Belső képzés VinBigdata tagoknak
Hogyan lehet hozzáférni bizonyos adatforrásokhoz, különösen akkor, amikor a legtöbb vietnami külföldről használja a közösségi oldalakat?
A valóság az, hogy napjainkban a legnagyobb emberi adatforrás (nem csak a vietnami adatoké) az internet és a közösségi hálózatok. Azonban továbbra is hozzáférhetünk és gyűjthetünk adatokat különböző forrásokból, a vietnami adatok jellemzőinek megértése alapján, az egyes projektek által meghatározott jellemzőktől függően.
Például az OpenAI GPT-modelljei több száz, akár billió paraméterrel rendelkeznek, hatalmas mennyiségű adaton képződnek, és dollármilliárdokba kerülnek. Hozzájuk képest mi egy teljesen más utat választottunk kutatásaink, képességeink és erőforrásaink alapján: egy vietnami nyelvi modellt hoztunk létre, amelynek architektúrája mindössze néhány milliárd paraméterből áll, és amelyet egy 600 GB-os vietnami adathalmazon képeztünk ki, amelyet mi magunk gyűjtöttünk és finomítottunk, de a vietnami feldolgozás tekintetében ezzel egyenértékű képességekkel rendelkezik. Az eredmények azt mutatják, hogy saját fejlesztésű architektúránk képes önoptimalizálódni, lerövidíteni a nyelvi modell betanítási idejét, csökkenteni a költségeket, és továbbra is biztosítani a modell minőségét.
Milyen kihívásokkal szembesült Ön és csapata a mesterséges intelligencia termékek kutatása és fejlesztése során?
Az első kihívás minden bizonnyal az idő. A mesterséges intelligencia technológia hulláma nagyon gyorsan érkezik, és robbanásszerű időszakban van. A világ vezető technológiai vállalatai gyorsan piacra dobtak rendkívül komplett termékeket, amelyeket folyamatosan frissítenek és fejlesztenek. Ha lassúak vagyunk, és nem időben dobunk piacra termékeket, biztosan lemaradunk.
Másrészt, ha olyan termékeket akarunk létrehozni, amelyek alkalmazhatók és gyakorlati társadalmi problémákat oldanak meg, akkor a termék kiemelkedő, különleges és egyedi tulajdonságainak megtalálását és fejlesztését is figyelembe kell vennünk.
Előadás a Vietnámi Mesterséges Intelligencia Napján (AI4VN 2023)
Valójában számos magánszemély és szervezet szenvedett el nagy veszteségeket adatszivárgások miatt Vietnámban és világszerte. Hogyan látja az adatbiztonság kérdését?
Elmondható, hogy ma már minden alkalmazás adatokból származik. Az adatokkal való munka során egyrészt biztosítanunk kell azt a célt, hogy az adatokat az élet legjobb technológiájának megteremtésére alkalmazzuk, másrészt pedig garantálnunk kell az egyének és a szervezetek adatbiztonságát.
Az emberi tényező nagyon fontos láncszem az adatbiztonság-biztosítási folyamatban. Ide tartoznak a fejlesztők, a termékfelhasználók és a felhasználók. A fejlesztőknek az adatbiztonsággal kapcsolatos tudatosságnak már az adatgyűjtés és -feldolgozás kezdetétől jelen kell lennie.
Gyakran, amikor nincs probléma, nem vagyunk tisztában az adatbiztonság fontosságával. De ha adatszivárgás történik, a kár hatalmas lehet. Az adatszivárgás technikai problémák vagy szándékos adatlopási támadások miatt történhet. Adatszivárgás esetén magánszemélyek vagy szervezetek adatait rosszindulatú személyek használhatják fel illegális célokra, és a vállalkozások anyagi veszteségeket szenvedhetnek el a kapcsolódó problémák megoldása miatt, akár a márkájuk is károsodhat.
Dr. Dao Duc Minh és a VinBigdata csapata egy rendezvényen
Miután a vietnami emberek szolgálatára szolgáló technológia elsajátítására törekedtünk, lesznek-e lépések a világ felé?
Minden olyan szervezetnek vagy vállalkozásnak, amely termékeit a nemzetközi piacra kívánja vinni, meg kell felelnie a nemzetközi szabványoknak. A VinBigdata erősségei a megoldások és a technológia terén vannak, így természetes, hogy a világ meghódítására törekszik.
Természetesen a sokféle termék és alkalmazás telepítéséhez szükség van olyan nemzetközi egységek támogatására, amelyek sokéves tapasztalattal és a világ minden táján élő felhasználók megértésével rendelkeznek.
Köszönöm!
[hirdetés_2]
Forrás: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm
Hozzászólás (0)