Страны должны разрабатывать ИИ, который будет генерировать информацию на их родных языках

Вышеуказанное сообщение было озвучено г-ном Ха Чжон У, руководителем отдела облачных инноваций компании Naver (Корея), на Дне искусственного интеллекта во Вьетнаме (AI4VN) 2023, который состоялся в Хошимине 22 сентября.

Г-н Ха Чжон У, руководитель отдела облачных инноваций компании Naver (Корея).

Генеративный ИИ — это форма искусственного интеллекта, способная генерировать новый контент и идеи в различных формах, таких как текст, изображения, видео, музыка . На основе этого ИИ может создавать новые песни, лекарства, фильмы, игры... используя большие языковые модели (LLM).

Согласно недавней оценке McKinsey, вклад генеративного ИИ в мировую экономику может составить 4,4 триллиона долларов. Исследование основано на 60 000 приложений генеративного ИИ в различных отраслях.

По словам г-на Ха Чжон У, в настоящее время основные языковые модели для разработки генеративного ИИ используют английский язык, поэтому при запуске модели на других языках она будет неполной и будет содержать ошибки. Кроме того, поскольку она на английском языке, ее использование создает ненужную предвзятость, особенно культурную.

Поэтому он считает, что освоение данных и технологий — важный фактор, который многие страны будут учитывать в будущем, чтобы преодолеть риск зависимости от других стран. Например, в Корее Naver также создала крупную модель на корейском языке для обслуживания правительства и местного бизнеса при развертывании приложений ИИ.

Разделяя эту точку зрения, доктор Дао Дык Минь, генеральный директор VinBigdata, также считает, что вьетнамцы также могут создавать отечественные продукты на основе искусственного интеллекта, которые помогут обеспечить безопасность, точность информации и наилучшим образом служить правительству и обществу...

По словам г-на Дао Дык Миня, запуск chatGPT в конце 2022 года породил волну подпольной конкуренции между странами и крупными корпорациями в области исследования и запуска моделей генеративного ИИ и крупных языковых моделей.

В частности, в США, помимо инструмента chatGPT от OpenAI, существуют и другие модели генеративного ИИ, такие как Bard от Google и Titan от Amazon. В Китае — Earnie Bot от Baidu, SenseChat от Sense Time и Hunyan от Tencent. В Корее — HyperClova X от Naver...

Г-н Дао Дык Минь отметил, что разработка крупной языковой модели для применения в генеративном ИИ — непростая задача, требующая больших затрат. Если генеративный ИИ будет применяться на основе крупных платформ языковых моделей, доступных в мире, Вьетнам рискует столкнуться со множеством рисков. Например, в крупных иностранных языковых моделях вьетнамские данные составляют лишь очень небольшую долю, в основном английский, поэтому сложно гарантировать точность, безопасность данных и их пригодность для бизнеса...

Например, большие модели иностранных языков содержат сотни миллиардов параметров. Реализация реальной модели требует огромной вычислительной инфраструктуры, но качество несоизмеримо, поскольку модель ИИ может давать неверные ответы, особенно в отношении исторических знаний, культуры и вопросов, специфичных для каждой страны.

По этой причине VinBigdata решила создать крупную языковую модель на вьетнамском языке с целью обеспечения безопасности данных, повышения точности, снижения затрат и адаптации к внутренней ситуации. Команда экспертов создала модель с в сотни раз меньшим количеством параметров, чем у chatGPT, но она была построена на объёме данных вьетнамцев.

Модель способна отвечать на вопросы, связанные с местными особенностями, с высокой точностью. В частности, на вопрос о двух разных нарушениях закона модель ChatGPT дала одинаковый ответ общего содержания. В то же время, модель ИИ, использующая данные Вьетнама, может давать точные ответы, основываясь на законах, указах, штрафах и источниках информации... очень точные.

Чтобы доказать эту точность, доктор Дао Дык Минь привел пример. Задавая вопрос о произведении «Жена нищего» во вьетнамской литературе на chatGPT и модели вьетнамского языка, разработанной VinBigdata, он получил результат модели VinBigdata, который оказался абсолютно точным, в то время как ответ ChatGPT оказался неясным.

Представитель VinBigdata также заявил, что освоение искусственного интеллекта, созданного внутри страны, важно, поскольку это может помочь правительству управлять контентом, избегать дезинформации, обеспечивать национальную безопасность данных и знакомить мир с вьетнамскими технологиями.

Страны готовы сотрудничать с Вьетнамом в разработке технологий искусственного интеллекта (ИИ) . Представители консульств заявили о готовности стран сотрудничать с Вьетнамом в разработке технологий искусственного интеллекта (ИИ), подчеркнув необходимость ответственного подхода к разработке ИИ.

Источник