Vietnam.vn - Nền tảng quảng bá Việt Nam

다오 득 민 박사: '베트남 데이터를 마스터하는 것은 베트남 기술을 개발하고 마스터하는 첫 단계입니다.'

Báo Thanh niênBáo Thanh niên27/05/2024

이미지 미국의 대형 인공지능 기업에서 근무하셨는데, 왜 베트남으로 돌아와 VinBigdata에 합류하게 되셨나요? 미국에서 근무하는 동안 여러 대규모 정부 프로젝트에 참여했지만, 제가 얻은 결과는 대규모 처리 과정의 몇 단계에 불과했습니다. 프로젝트의 매우 엄격한 기밀 유지 절차 때문에 제가 개발한 솔루션이 어떻게 사용되는지조차 모르는 경우가 많았습니다. 2017년, 베트남이 개발 단계에 있었고 빅데이터와 인공지능 관련 해결해야 할 많은 문제들이 있을 때 베트남으로 돌아왔습니다. 부 하 반(Vu Ha Van) 교수님의 초청을 받아 베트남 국민의 삶에 도움이 되는 베트남 기술 솔루션을 개발한다는 목표를 함께 실현하고자 했습니다. 더 큰 영향을 미칠 문제들을 다룰 수 있게 되어 베트남으로의 귀환이 훨씬 더 의미 있다고 생각합니다.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

워크숍에 참석한 Dao Duc Minh 박사

엔비씨씨

인공지능 개발 전략에서 빅데이터의 역할과 영향력은 무엇입니까? 데이터는 인공지능 학습에 매우 중요하고 귀중한 역할을 합니다. 고품질 인공지능 모델을 학습하기 위해서는 흔히 대규모 데이터베이스 학습부터 시작합니다. 따라서 고품질 인공지능을 구현하기 위해서는 먼저 양질의 데이터가 필요합니다. 양질의 데이터는 양과 규모, 품질, 다양성, 그리고 보편성 측면에서 기준을 충족해야 합니다. 원시 데이터 정제 단계에서 수천 시간 분량의 데이터를 수집하고 처리하여 인공지능 모델에 입력할 최고 품질의 데이터를 생성하는 과정은 매우 비용이 많이 들고 복잡합니다. 반대로, 빅데이터를 분석하기 위해서는 인공지능을 활용하여 대규모 데이터를 정확하게 처리하고, 이를 통해 더욱 결정적이고 예측 가능한 결과를 도출할 수 있어야 합니다. 예를 들어, 베트남인을 위한 가상 비서 제품(ViVi)을 개발하는 과정에서 다양한 지역, 연령, 성별의 수십만 개 음성과 수백 개 분야에 걸친 콘텐츠에서 수만 시간 분량의 고품질 오디오 데이터를 수집하고 처리해야 했습니다. 최근에는 VinBigdata가 전적으로 소유한 빅 언어 모델(Big Language Model)을 기반으로 개발된 "최종 사용자를 위한 ChatGPT의 첫 번째 베트남어 버전"인 ViGPT를 출시했습니다. 이 모델은 다양한 분야에서 수집된 600GB의 정제된 베트남어 데이터를 기반으로 학습되었습니다. 베트남어 데이터와 언어에 대한 이해를 바탕으로, ChatGPT 출시 후 ViGPT 출시 기간을 단 9개월로 단축하는 새로운 접근법을 발견했습니다. 이것이 바로 빅데이터와 인공지능의 공명입니다.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
연구를 실질적인 가치와 연결하여 지역 사회에 기여하는 것에 대한 당신의 견해는 무엇입니까? - 기술 연구는 실제로 삶에 적용되어 사회 문제를 해결하고 사람들의 삶을 개선할 때에만 진정한 성공을 거둘 수 있다고 생각합니다. 실용적인 상용 제품을 만들고 비즈니스 및 사회 문제를 해결하려면 항상 주의를 기울이고 "데이터는 어떤 가치를 가져올 것인가?"라는 질문을 던져야 합니다. 지금까지 저희는 다양한 산업과 분야에서 다양한 제품과 솔루션을 연구해 왔습니다. 대표적인 예로 ViGPT, 의료 영상 진단 AI 솔루션을 제공하는 VinDr, 인공지능 플랫폼 VinBase, 그리고 스마트 영상 분석 솔루션 세트인 Vizone을 들 수 있습니다.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Vingroup Corporation 행사에 VinBigdata의 주요 인사들과 함께

엔비씨씨

4차 산업혁명이 전 세계적으로 활발하게 진행되고 있습니다. 베트남은 어떤 이점을 가지고 있다고 생각하십니까? 이전 혁명과 비교했을 때, 베트남은 현재 4차 산업혁명에서 돌파구를 찾을 수 있는 많은 이점을 가지고 있으며, 이는 세계 지도에서 국가의 위상을 향상시키는 데 도움이 된다고 생각합니다. 이 목표를 달성하기 위한 두 가지 핵심 요소는 데이터와 사람입니다. 베트남은 현재 약 1억 명의 인구를 보유하고 있으며, 그중 상당수의 젊은 세대가 휴대폰과 개인용 컴퓨터를 사용합니다. 또한, 우리는 인공지능 분야의 권위 있는 전문가들과 정보 기술 분야의 젊고 우수한 인력을 보유하고 있으며, 수학에 대한 매우 탄탄한 기반을 갖추고 있습니다. 그렇다면 한계는 무엇일까요? 가장 먼저 눈에 띄는 한계는 인구가 많음에도 불구하고 여전히 데이터, 특히 시설, 사업 단위 및 행정 부서의 데이터 표준화 및 동기화에 어려움을 겪고 있다는 것입니다. 또한, 고성능 컴퓨팅 인프라에 대한 투자를 포함한 제한된 투자 자원과 같은 다른 제약에도 직면해 있습니다.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
베트남 국민의 삶에 도움이 되는 기술을 개발하고 습득하는 과정에서 베트남 데이터를 마스터하는 것이 얼마나 중요하다고 생각하십니까? 현재 세계적으로 선도적인 인공지능 제품이 많이 있으며, OpenAI의 ChatGPT나 Google의 Bard와 같이 대규모 언어 모델을 기반으로 개발된 AI 애플리케이션 제품이 대표적입니다. 그러나 베트남어는 이러한 제품 개발의 핵심 언어가 아닙니다. 따라서 사용자에게 제공되는 베트남어 콘텐츠의 품질이 다소 영향을 받고 오류 발생 가능성이 높으며, 더 위험한 것은 기본 지식의 오류입니다. 베트남 국민으로서 우리는 자체 데이터 소스에 접근할 수 있다는 이점을 가지고 있습니다. 베트남 데이터의 특성, 베트남 국민의 요구와 특징을 이해할 수 있는 능력은 우리만이 가지고 있습니다. 따라서 베트남 데이터를 마스터하는 것은 핵심 기술을 마스터하는 핵심 열쇠이며, 이 기술은 베트남 국민에게 도움이 될 것입니다.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

VinBigdata 회원을 위한 내부 교육

엔비씨씨

특히 오늘날 대부분의 베트남 사람들이 해외 소셜 네트워킹 사이트를 사용하는 상황에서 특정 데이터 소스에 어떻게 접근할 수 있을까요? 사실, 오늘날 가장 큰 인적 데이터 소스(베트남 사람들뿐만 아니라)는 인터넷과 소셜 네트워크입니다. 하지만 각 프로젝트에서 설정한 베트남 데이터의 특성에 대한 이해를 바탕으로 다양한 소스에서 데이터에 접근하고 수집할 수 있습니다. 예를 들어, OpenAI의 GPT 모델은 수백, 심지어 수조 개의 매개변수를 가지고 있으며, 방대한 양의 데이터를 학습하고 수십억 달러의 비용이 듭니다. OpenAI는 이와는 달리 연구, 역량, 그리고 자원을 바탕으로 완전히 다른 방향을 선택했습니다. 즉, 수십억 개의 매개변수만으로 구성된 아키텍처를 기반으로 600GB의 베트남어 데이터를 직접 수집하고 개선하여 학습하면서도 동일한 수준의 베트남어 처리 능력을 갖춘 베트남어 모델을 개발했습니다. 그 결과, 자체 개발한 아키텍처는 자체 최적화, 언어 모델 학습 시간 단축, 비용 절감을 동시에 달성하면서도 모델 품질을 유지할 수 있음을 보여줍니다. 인공지능 제품을 연구하고 개발하는 과정에서 귀하와 귀하의 팀이 직면한 어려움은 무엇이었습니까? 첫 번째 과제는 바로 시간입니다. 인공지능 기술의 물결은 매우 빠르게 다가오고 있으며, 폭발적인 성장기를 맞고 있습니다. 세계 유수의 기술 기업들은 끊임없이 업데이트되고 개선되는 고도로 완성도 높은 제품을 빠르게 출시하고 있습니다. 만약 우리가 더디게 제품을 제때 출시하지 못한다면, 분명 뒤처질 것입니다. 한편, 실질적인 사회 문제를 해결하고 실제 적용할 수 있는 제품을 만들고 싶다면, 제품의 탁월하고 특별하며 고유한 특징을 발견하고 개발하는 것도 고려해야 합니다.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

베트남 인공지능의 날(AI4VN 2023) 발표

엔비씨씨

실제로 베트남을 비롯한 전 세계의 많은 개인과 조직이 데이터 유출로 큰 손실을 입었습니다. 데이터 보안 문제는 어떻게 생각하십니까? 오늘날 모든 애플리케이션은 데이터에서 비롯된다고 할 수 있습니다. 데이터를 다룰 때, 한편으로는 데이터를 활용하여 최고의 기술을 개발한다는 목표를 달성해야 하며, 다른 한편으로는 개인과 조직의 데이터 보안을 확보해야 합니다. 데이터 보안을 확보하는 과정에서 인적 요소는 매우 중요한 연결 고리입니다. 개발자, 제품 사용자, 그리고 일반 사용자 등이 여기에 포함됩니다. 개발자는 데이터 수집 및 처리 초기 단계부터 데이터 보안에 대한 인식을 갖춰야 합니다. 문제가 발생하지 않을 때는 데이터 보안의 중요성을 인지하지 못하는 경우가 많습니다. 하지만 데이터 유출이 발생하면 그 피해는 막대할 수 있습니다. 데이터 유출은 기술적 문제나 고의적인 데이터 도용 공격으로 인해 발생할 수 있습니다. 데이터가 유출되면 개인이나 조직의 정보가 악의적인 목적으로 악용될 수 있으며, 기업은 관련 문제를 해결하는 데 재정적 손실을 입거나 심지어 브랜드 이미지가 손상될 수도 있습니다.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

행사에 참석한 Dao Duc Minh 박사와 VinBigdata 팀

엔비씨씨

베트남 국민에게 서비스를 제공하기 위해 기술을 습득하고자 하는 열망을 품었다면, 이제 세계로 진출하기 위한 단계가 필요합니다. 해외 시장에 제품을 출시하려는 모든 조직이나 기업은 국제 표준을 준수해야 합니다. VinBigdata는 솔루션과 기술 분야에서 강점을 가지고 있기에 세계 정복이라는 비전을 세우는 것은 당연한 일입니다. 물론, 다양한 제품과 애플리케이션에 적용하기 위해서는 오랜 경험과 전 세계 사용자에 대한 이해를 갖춘 국제적인 파트너와의 협력이 필수적입니다. 감사합니다!

Thanhnien.vn

출처: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

댓글 (0)

No data
No data

같은 태그

같은 카테고리

S자 모양의 땅에서 평화로운 아침을 맞이하다
불꽃놀이 폭발, 관광 활성화, 다낭, 2025년 여름 최고 성적
푸꾸옥 진주섬에서 야간 오징어 낚시와 불가사리 관찰을 경험하세요
하노이에서 가장 비싼 연꽃차를 만드는 과정을 알아보세요

같은 저자

유산

수치

사업

No videos available

소식

정치 체제

현지의

제품