Vietnam.vn - Nền tảng quảng bá Việt Nam

Доктор Дао Дук Минь: «Освоение вьетнамских данных — первый шаг в развитии и освоении вьетнамских технологий»

Báo Thanh niênBáo Thanh niên27/05/2024

имг Работая в крупной организации искусственного интеллекта в США, почему вы решили вернуться во Вьетнам, чтобы присоединиться к VinBigdata? Работая в США, хотя я и участвовал во многих крупных государственных проектах, результаты, которых я достигал, часто были всего лишь несколькими шагами в большом процессе обработки. Много раз из-за очень строгих процедур конфиденциальности проектов я даже не знал, как используются разработанные мной решения. В 2017 году я вернулся во Вьетнам, когда Вьетнам находился на стадии разработки и существовало много проблем, связанных с большими данными и искусственным интеллектом, которые необходимо было решить. Я принял приглашение профессора Ву Ха Вана, чтобы совместно реализовать цель разработки вьетнамских технологических решений для служения жизни вьетнамцев. Я считаю свое возвращение во Вьетнам гораздо более значимым, потому что я смогу работать над проблемами с большим влиянием.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Доктор Дао Дук Минь в мастерской

НВКК

В стратегии развития искусственного интеллекта, какова роль и влияние больших данных, сэр? Данные играют очень важную и ценную роль в обучении искусственного интеллекта. Чтобы обучить высококачественную модель искусственного интеллекта, мы часто начинаем с обучения большой базы данных. Поэтому, чтобы иметь качественный искусственный интеллект, нам сначала нужны хорошие данные. Хорошие данные должны соответствовать стандартам с точки зрения количества и масштаба, качества, разнообразия и универсальности. Процесс сбора и обработки тысяч часов данных с этапа очистки необработанных данных для создания данных высочайшего качества для подачи в модель искусственного интеллекта очень дорогой и сложный. Напротив, для анализа больших данных нам нужно использовать искусственный интеллект, чтобы гарантировать возможность точной обработки данных в больших масштабах, тем самым создавая более решающие или прогнозируемые результаты. Например, в процессе разработки продукта виртуального помощника для вьетнамцев (ViVi) нам пришлось собрать и обработать десятки тысяч часов высококачественных аудиоданных от сотен тысяч голосов из разных регионов, разных возрастов и полов, с контентом, охватывающим сотни областей... Или совсем недавно запуск ViGPT - "первой вьетнамской версии ChatGPT для конечных пользователей", разработанной на основе Big Language Model, полностью принадлежащей VinBigdata. Эта модель была обучена на основе 600 ГБ уточненных вьетнамских данных из многих различных областей. Благодаря нашему пониманию вьетнамских данных и языка мы нашли новый подход к сокращению времени запуска ViGPT до всего 9 месяцев после рождения ChatGPT. Это резонанс между большими данными и искусственным интеллектом.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
Каково ваше мнение о связи исследований с практической ценностью для служения обществу? - Я считаю, что технологические исследования по-настоящему успешны только тогда, когда они действительно входят в жизнь, решают социальные проблемы и улучшают жизнь людей. Чтобы создавать практические коммерческие продукты и решать деловые и социальные проблемы, мы всегда должны обращать внимание и задаваться вопросом: какую ценность данные принесут в жизнь? До сих пор мы исследовали множество продуктов и решений в различных отраслях и областях, как правило, ViGPT, VinDr - предоставление решений ИИ в медицинской диагностике визуализации, VinBase - платформа для искусственного интеллекта или Vizone - набор решений для интеллектуального анализа изображений.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

С ключевыми сотрудниками VinBigdata на мероприятии корпорации Vingroup

НВКК

Четвертая промышленная революция активно происходит в мировом масштабе. Какие преимущества, по вашему мнению, есть у Вьетнама? По сравнению с предыдущими революциями, я думаю, что Вьетнам в настоящее время имеет много преимуществ для прорыва в этой промышленной революции 4.0, помогая улучшить положение страны на карте мира . Два ключа к достижению этой цели — данные и люди. В настоящее время во Вьетнаме проживает около 100 миллионов человек, из которых большая часть молодых людей пользуется телефонами и персональными компьютерами. Кроме того, у нас есть престижные специалисты в области искусственного интеллекта и молодые, высококвалифицированные кадры в области информационных технологий, а также очень хорошая база в математике. Так что насчет ограничений? Первое ограничение, которое можно увидеть, заключается в том, что, несмотря на большую численность населения, мы все еще испытываем трудности с освоением данных, в частности, со стандартизацией и синхронизацией данных на объектах, в бизнес-подразделениях и администрациях. Кроме того, мы также сталкиваемся с другими ограничениями, такими как ограниченные инвестиционные ресурсы, особенно инвестиции в высокопроизводительную вычислительную инфраструктуру.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
По вашему мнению, насколько важно овладение вьетнамскими данными на пути создания и освоения технологий для служения жизни вьетнамцев? В настоящее время в мире существует множество ведущих продуктов искусственного интеллекта, как правило, это продукты приложений ИИ, созданные на основе больших языковых моделей, таких как ChatGPT от OpenAI или Bard от Google. Однако вьетнамский язык не является основной языковой группой для разработки этих продуктов. Поэтому качество контента, специфичного для вьетнамского языка, возвращаемого пользователям, в большей или меньшей степени страдает и имеет высокую вероятность ошибок, что более опасно, ошибок в базовых знаниях. Как вьетнамцы, мы имеем преимущество доступа к собственным источникам данных. Только мы имеем возможность понимать характеристики вьетнамских данных, потребности и характеристики вьетнамцев. Поэтому овладение вьетнамскими данными действительно является ключом к овладению основными технологиями, которые также являются технологиями, которые будут служить вьетнамцам.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Внутреннее обучение для членов VinBigdata

НВКК

Как получить доступ к определенным источникам данных, особенно когда большинство вьетнамцев сегодня пользуются сайтами социальных сетей из-за рубежа? Фактически, крупнейшим источником человеческих данных сегодня (не только вьетнамцев) являются Интернет и социальные сети. Однако мы все еще можем получать доступ и собирать данные из разных источников, основываясь на понимании характеристик вьетнамских данных, в зависимости от характеристик, установленных каждым проектом. Например, модели GPT OpenAI имеют сотни, даже триллионы параметров, обучаются на огромных объемах данных и стоят миллиарды долларов. По сравнению с ними, мы выбрали совершенно другое направление, основанное на наших исследованиях, возможностях и ресурсах: то есть создание вьетнамской языковой модели с архитектурой всего из нескольких миллиардов параметров, обученной на наборе вьетнамских данных объемом 600 ГБ, которые мы собрали и уточнили сами, но имеющей такую ​​же способность обрабатывать вьетнамский язык. Результаты показывают, что наша самостоятельная архитектура может самооптимизироваться, сокращать время обучения языковой модели, снижать затраты, при этом обеспечивая качество модели. С какими трудностями вы и ваша команда столкнулись в процессе исследования и разработки продуктов искусственного интеллекта? Первая проблема, безусловно, время. Волна технологий искусственного интеллекта надвигается очень быстро и переживает период взрыва. В мире ведущие технологические компании быстро выпустили высокополные продукты, которые постоянно обновляются и совершенствуются. Если мы будем медлить и не выпустим продукты вовремя, мы, безусловно, отстанем. С другой стороны, если мы хотим создавать продукты, которые можно применять и решать практические социальные проблемы, мы должны также рассмотреть возможность поиска и разработки выдающихся, особых и уникальных характеристик продукта.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Презентация на Дне искусственного интеллекта во Вьетнаме (AI4VN 2023)

НВКК

На самом деле, многие люди и организации во Вьетнаме и по всему миру понесли большие потери из-за утечек данных. Как вы оцениваете проблему безопасности данных? Можно сказать, что любое приложение сегодня исходит из данных. Работая с данными, с одной стороны, мы должны обеспечить цель применения данных для создания лучшей технологии для жизни, а с другой стороны, мы должны обеспечить безопасность данных для людей и организаций. Человеческий фактор является очень важным звеном в процессе обеспечения безопасности данных. К ним относятся разработчики, пользователи продукта и пользователи. Для разработчиков осведомленность о безопасности данных должна присутствовать с самого начала сбора и обработки данных. Часто, когда не возникает никаких проблем, мы не осознаем важности безопасности данных. Но если происходит утечка данных, ущерб может быть огромным. Утечки данных могут происходить из-за технических проблем или преднамеренных атак по краже данных. Когда данные украдены, люди или организации могут использовать свою информацию в незаконных целях злоумышленниками, в то время как предприятия могут понести финансовые потери для устранения связанных с этим проблем и даже нанести ущерб своему бренду.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Доктор Дао Дук Минь и команда VinBigdata на мероприятии

НВКК

После стремления освоить технологию для обслуживания вьетнамского народа, должны быть шаги для продвижения в мир? Любая организация или предприятие, которые хотят вывести свою продукцию на международный рынок, должны соответствовать международным стандартам. VinBigdata имеет сильные стороны в решениях и технологиях, поэтому постановка видения для завоевания мира естественна. Конечно, для развертывания для множества различных продуктов и приложений необходимо иметь товарищество международных подразделений с многолетним опытом и пониманием пользователей по всему миру. Спасибо!

Thanhnien.vn

Источник: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Комментарий (0)

No data
No data

Та же тема

Та же категория

Лотосовый чай — ароматный подарок от жителей Ханоя
Сегодня утром более 18 000 пагод по всей стране звонили в колокола и барабаны, молясь за мир и процветание нации.
Небо над рекой Хан «абсолютно кинематографично»
Мисс Вьетнам 2024 по имени Ха Трук Линь, девушка из Фуйена

Тот же автор

Наследство

Фигура

Бизнес

No videos available

Новости

Политическая система

Местный

Продукт