Setelah bekerja untuk organisasi kecerdasan buatan besar di AS, mengapa Anda memutuskan untuk pulang dan bergabung dengan VinBigdata?
Selama bekerja di AS, meskipun saya berpartisipasi dalam banyak proyek pemerintah besar, hasil yang saya peroleh seringkali hanya beberapa langkah dalam sebuah proses besar. Sering kali, karena kerahasiaan proyek yang ketat, saya bahkan tidak tahu bagaimana solusi yang saya kembangkan digunakan.
Pada tahun 2017, saya kembali ke Vietnam ketika Vietnam masih dalam tahap pengembangan dan terdapat banyak permasalahan terkait big data dan kecerdasan buatan yang perlu dipecahkan. Saya menerima undangan Profesor Vu Ha Van untuk bersama-sama mewujudkan tujuan mengembangkan solusi teknologi Vietnam demi melayani kehidupan masyarakat Vietnam. Saya merasa kepulangan saya ke Vietnam jauh lebih bermakna karena saya dapat menangani permasalahan dengan dampak yang lebih besar.
Dr. Dao Duc Minh dalam sebuah lokakarya
Dalam strategi pengembangan kecerdasan buatan, apa peran dan pengaruh big data, Pak?
Data memainkan peran yang sangat besar dan berharga dalam pelatihan kecerdasan buatan. Pelatihan model kecerdasan buatan berkualitas tinggi seringkali dimulai dengan pelatihan basis data yang besar. Oleh karena itu, untuk memiliki kecerdasan buatan yang berkualitas, pertama-tama kita perlu memiliki data yang baik.
Data yang baik membutuhkan kuantitas dan skala, kualitas, variasi, dan universalitas. Proses pengumpulan dan pemrosesan ribuan jam data, mulai dari tahap pembersihan data mentah hingga menghasilkan data berkualitas tinggi untuk dimasukkan ke dalam model kecerdasan buatan, sangatlah mahal dan kompleks. Sebaliknya, untuk menganalisis big data, kita perlu menggunakan kecerdasan buatan untuk memastikan kemampuan memproses data secara akurat dalam skala besar, sehingga menghasilkan hasil yang lebih baik, baik dalam menentukan maupun memprediksi.
Misalnya, dalam proses pengembangan produk asisten virtual untuk orang Vietnam (ViVi), kami harus mengumpulkan dan memproses puluhan ribu jam data audio berkualitas tinggi, dari ratusan ribu suara dari berbagai daerah, beragam usia dan jenis kelamin, dengan konten yang mencakup ratusan bidang...
Atau yang terbaru, peluncuran ViGPT - "ChatGPT versi Vietnam pertama untuk pengguna akhir" yang dikembangkan dari Model Bahasa Besar yang sepenuhnya dimiliki oleh VinBigdata. Model ini dilatih berdasarkan 600 GB data Vietnam yang telah diolah dari berbagai bidang. Dengan pemahaman kami tentang data dan bahasa Vietnam, kami telah menemukan pendekatan baru untuk mempersingkat waktu peluncuran ViGPT hanya dalam 9 bulan setelah ChatGPT diluncurkan.
Inilah resonansi antara data besar dan kecerdasan buatan.
Apa pandangan Anda tentang menghubungkan penelitian dengan nilai praktis untuk melayani masyarakat?
- Saya percaya bahwa penelitian teknologi hanya benar-benar berhasil apabila benar-benar diterapkan, memecahkan masalah sosial, dan meningkatkan mutu kehidupan manusia.
Untuk menciptakan produk komersial praktis yang memecahkan masalah bisnis dan sosial, kita harus selalu memperhatikan dan mengajukan pertanyaan: nilai apa yang akan dihadirkan data bagi kehidupan?
Hingga kini, kami telah meneliti dan mengembangkan berbagai produk dan solusi untuk berbagai industri dan bidang, biasanya ViGPT, VinDr - menyediakan solusi AI dalam diagnosis pencitraan medis , VinBase - platform kecerdasan bio-buatan, atau Vizone - serangkaian solusi analisis gambar pintar.
Bersama personel kunci VinBigdata di sebuah acara Vingroup Corporation
Revolusi industri ke-4 telah berlangsung pesat dalam skala global. Apa saja keunggulan yang menurut Anda dimiliki Vietnam?
Dibandingkan dengan revolusi-revolusi sebelumnya, saya yakin Vietnam saat ini memiliki banyak keunggulan untuk ditembus dalam revolusi industri 4.0 ini, yang akan membantu meningkatkan posisi negara di peta dunia. Dua kunci untuk mencapai tujuan ini adalah data dan manusia.
Vietnam saat ini berpenduduk hampir 100 juta jiwa, dengan sebagian besar anak mudanya menggunakan ponsel dan komputer pribadi. Selain itu, kami memiliki pakar terkemuka di bidang kecerdasan buatan, tenaga muda berkualitas di bidang teknologi informasi, dan memiliki dasar matematika yang sangat baik.
Jadi apa saja batasannya?
Keterbatasan nyata pertama adalah bahwa meskipun memiliki populasi yang besar, kita masih mengalami kesulitan dalam menguasai data, khususnya dalam menstandardisasi dan menyinkronkan data di fasilitas, unit bisnis, dan administrasi.
Selain itu, kami juga menghadapi kendala lain seperti keterbatasan sumber daya investasi, terutama investasi dalam infrastruktur komputasi berkinerja tinggi.
Menurut Anda, seberapa penting peran penguasaan data Vietnam dalam perjalanan menciptakan dan menguasai teknologi untuk melayani kehidupan masyarakat Vietnam?
Saat ini terdapat banyak produk kecerdasan buatan terkemuka di dunia, biasanya berupa produk aplikasi AI generatif berbasis model bahasa besar seperti ChatGPT dari OpenAI atau Bard dari Google. Namun, bahasa Vietnam bukanlah kelompok bahasa utama untuk pengembangan produk-produk ini.
Oleh karena itu, kualitas konten khusus bahasa Vietnam yang dikembalikan kepada pengguna kurang lebih terpengaruh dan memiliki kemungkinan kesalahan yang tinggi, yang lebih berbahaya, kesalahan dalam pengetahuan dasar.
Sebagai orang Vietnam, kita memiliki keuntungan mengakses sumber data kita sendiri. Hanya kita yang mampu memahami karakteristik data Vietnam, kebutuhan, dan karakteristik masyarakat Vietnam. Oleh karena itu, menguasai data Vietnam merupakan kunci utama untuk menguasai teknologi inti, yaitu teknologi yang akan melayani masyarakat Vietnam.
Pelatihan internal untuk anggota VinBigdata
Bagaimana cara mengakses sumber data tertentu, terutama ketika sebagian besar orang Vietnam saat ini menggunakan situs jejaring sosial dari luar negeri?
Kenyataannya, sumber data manusia terbesar saat ini (bukan hanya data Vietnam) ada di internet dan jejaring sosial. Namun, kita masih dapat mengakses dan mengumpulkan data dari berbagai sumber, berdasarkan pemahaman karakteristik data Vietnam, tergantung pada karakteristik yang ditetapkan oleh masing-masing proyek.
Misalnya, model GPT OpenAI memiliki ratusan, bahkan triliunan parameter, dilatih dengan data dalam jumlah besar, dan menghabiskan biaya miliaran dolar. Dibandingkan dengan model-model tersebut, kami telah memilih jalur yang sama sekali berbeda berdasarkan riset, kapabilitas, dan sumber daya kami: menciptakan model bahasa Vietnam dengan arsitektur yang hanya terdiri dari beberapa miliar parameter, dilatih pada set data Vietnam berukuran 600 GB yang kami kumpulkan dan sempurnakan sendiri, tetapi dengan kapabilitas yang setara dalam hal pemrosesan bahasa Vietnam. Hasilnya menunjukkan bahwa arsitektur yang kami kembangkan sendiri dapat melakukan optimasi mandiri, mempersingkat waktu pelatihan model bahasa, mengurangi biaya, dan tetap memastikan kualitas model.
Apa saja tantangan yang Anda dan tim hadapi dalam proses penelitian dan pengembangan produk kecerdasan buatan?
Tantangan pertama tentu saja waktu. Gelombang teknologi kecerdasan buatan datang sangat cepat dan sedang dalam masa ledakan. Di dunia, perusahaan-perusahaan teknologi terkemuka telah dengan cepat meluncurkan produk-produk yang sangat lengkap, terus diperbarui dan ditingkatkan. Jika kita lambat dan tidak meluncurkan produk tepat waktu, kita pasti akan tertinggal.
Sebaliknya, jika kita ingin menciptakan produk yang dapat diaplikasikan dan memecahkan masalah sosial praktis, kita juga harus mempertimbangkan untuk menemukan dan mengembangkan fitur-fitur yang menonjol, khusus, dan unik dari produk tersebut.
Presentasi di Hari Kecerdasan Buatan Vietnam (AI4VN 2023)
Faktanya, banyak individu dan organisasi di Vietnam dan di seluruh dunia telah menderita kerugian besar akibat kebocoran data. Bagaimana Anda memandang isu keamanan data?
Dapat dikatakan bahwa setiap aplikasi saat ini berasal dari data. Saat bekerja dengan data, di satu sisi, kita harus memastikan tujuan penerapan data untuk menciptakan teknologi terbaik bagi kehidupan, dan di sisi lain, kita harus memastikan keamanan data bagi individu dan organisasi.
Faktor manusia merupakan mata rantai yang sangat penting dalam proses jaminan keamanan data. Faktor manusia meliputi pengembang, pengguna produk, dan pengguna. Bagi pengembang, kesadaran akan keamanan data harus ada sejak awal pengumpulan dan pemrosesan data.
Seringkali, ketika tidak ada masalah, kita tidak menyadari pentingnya keamanan data. Namun, jika terjadi kebocoran data, kerugiannya bisa sangat besar. Kebocoran data dapat terjadi karena masalah teknis atau serangan yang disengaja untuk mencuri data. Ketika kebocoran data terjadi, informasi individu atau organisasi dapat digunakan oleh orang jahat untuk tujuan ilegal, dan bisnis dapat mengalami kerugian finansial yang harus diperbaiki, bahkan dapat merusak merek mereka.
Dr. Dao Duc Minh dan tim VinBigdata di sebuah acara
Setelah aspirasi untuk menguasai teknologi guna melayani rakyat Vietnam, akankah ada langkah untuk maju ke dunia?
Setiap organisasi atau bisnis yang ingin membawa produknya ke pasar internasional harus mematuhi standar internasional. VinBigdata memiliki keunggulan dalam solusi dan teknologi, sehingga menetapkan visi untuk menaklukkan dunia adalah hal yang wajar.
Tentu saja, untuk penerapan pada banyak produk dan aplikasi yang berbeda, diperlukan dukungan unit internasional yang memiliki pengalaman bertahun-tahun dan pemahaman terhadap pengguna di seluruh dunia.
Terima kasih!
[iklan_2]
Sumber: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm
Komentar (0)