Вышеизложенная информация была предоставлена профессором Ву Ха Ваном, научным директором VinBigdata, в ходе обсуждения с журналистами в кулуарах недавнего запуска ViGPT.
ViGPT нуждается в поддержке технических специалистов и сообщества.
Профессор Ву Ха Ван отметил, что крупные компании, такие как Google, при разработке программирования на больших языках будут выбирать английский или французский в качестве основного языка. Хотя существует также вьетнамский, результаты поиска будут относительно медленными по сравнению с другими языками. В определённой степени ответы этих крупных языковых моделей на вопросы, заданные на вьетнамском, будут неполными и неточными.
Поэтому VinBigdata надеется, что со временем ViGPT превзойдёт их по точности в вопросах, непосредственно связанных с культурой, историей, географией и т.д., то есть с информацией, специфичной для вьетнамского народа. Именно этого хотят и стремятся добиться создатели модели вьетнамского языка в будущем, задавая вопросы о вьетнамцах: это будет более подходящим источником для сравнения, чем иностранные языки.
Углубляясь в детали, директор по науке VinBigdata проанализировал, например, вопрос, заданный в «деликатный» политический период, касающийся истории Чыонгса и Хоангса. Нам очень сложно гарантировать, что ответ Google или OpenAI не будет отражать политическую предвзятость основателей или стоящих за этими компаниями. У нас есть другие варианты во Вьетнаме, и было бы неплохо подумать над этим вопросом.
«Наша цель при создании большой языковой модели для вьетнамцев — предоставить вьетнамцам наилучшие ответы, мы не можем знать их цели», — поделился профессор Ву Ха Ван.
Признавая, что ViGPT пока не может сравниться с ChatGPT или Google Bard по многим параметрам, поскольку объём инвестиций этих компаний и время, затрачиваемое ими на внедрение, в тысячи раз выше. Однако профессор Ву Ха Ван отметил, что на некоторые вопросы, предвзятые по отношению к Вьетнаму, например, «На чьём флаге вышиты шесть золотых иероглифов?», ViGPT будет отвечать, что это флаг Тран Куок Тоана, в то время как другие варианты могут быть неверными. В будущем, отвечая на подобные подробные вопросы, ViGPT будет работать эффективнее, если получит обратную связь от пользователей из Вьетнама.
«Если пользователи только критикуют или считают эту большую языковую модель глупой, в то время как мой десятилетний ребёнок знает вопросы, которые он не знает, или задаёт вопросы с подвохом, чтобы доказать, что мы умнее ИИ. Мы умнее ИИ, но это не для какой-то цели, мы не делаем продукт лучше, а делаем людей, которые его создают, ещё хуже. Поэтому VinBigdata нуждается в общем вкладе технических специалистов и сообщества, нам нужна поддержка вьетнамцев для совершенствования продукта, чтобы он стал не просто инструментом обслуживания, а гордостью вьетнамского народа», — подчеркнул профессор Ву Ха Ван.
Готовы поддержать и сопровождать модель вьетнамского языка
В интервью VietNamNet представители стартапов, работающих в сфере искусственного интеллекта во Вьетнаме, заявили, что они готовы поддерживать и сопровождать вьетнамскую языковую модель VinBigdata.
Г-н Динь Тран Туан Линь, технический директор Unikon Joint Stock Company, владельца платформы Aicontent.vn, отметил, что в настоящее время лишь немногие страны Азии предприняли успешные усилия по обучению собственных крупных языковых моделей. Лидерами являются Китай, Корея и Япония... Поэтому ViGPT — важный сигнал для вьетнамского народа к инвестированию в основные технологии. По словам г-на Динь Тран Туан Линь, любое путешествие в тысячу миль должно начинаться с первых шагов. Будучи пионером в области применения искусственного интеллекта, Unikon готов участвовать в разработке, тестировании, предоставлять обратную связь и даже использовать ViGPT в некоторых масштабных проектах.
Тем временем, г-н Данг Хыу Сон, соучредитель Lovinbot, отметил, что VinBigdata прислушивается к сообществу и комментариям экспертов, что очень важно для разработки обширной языковой модели специально для вьетнамцев. Будучи техническим специалистом, г-н Данг Хыу Сон также дал технической команде VinBigdata отзыв об использовании продукта.
По словам г-на Данг Хыу Сона, новый продукт невозможно сразу же завершить, но он также не может получить полной поддержки сообщества, поскольку вьетнамцы долгое время считали, что Вьетнам не способен реализовать эту технологию, поэтому для её разработки требуется время. В то же время VinBigdata нуждается в конкретных инструкциях о том, как сообщество может лучше поддерживать и сопровождать продукт.
Г-н Данг Хыу Лок, основатель платформы Mindmaid, также отметил, что в настоящее время в мире очень мало стран, которые создали модель родного языка. Даже богатые страны с развитыми информационными технологиями, такие как Индия, или страны с более высоким ВВП, чем Вьетнам, такие как Индонезия, страны Ближнего Востока... не могут сделать это просто потому, что им этого хочется, поскольку это также зависит от особенностей языка. Таким образом, в более широкой перспективе, у Вьетнама есть стратегическое преимущество в создании модели родного языка, и это станет стратегическим преимуществом для вьетнамцев в глобальной конкуренции.
По словам г-на Данг Хыу Лока, любая попытка создания крупной модели вьетнамского языка ценна и требует конкретных комментариев для ежедневного совершенствования модели, а не для того, чтобы использовать существующие недостатки для отрицания всех усилий отечественных технологических подразделений. Вьетнамцам также следует широко распространять информацию о важности крупной языковой технологии в эпоху искусственного интеллекта и больше обсуждать, как её применять для создания ценности для себя и вьетнамского бизнеса, вместо того, чтобы сравнивать крупную языковую модель вьетнамского языка с лучшими современными крупными языковыми моделями. Поскольку крупная языковая модель является общей технологией искусственного интеллекта, она может не справляться с этой задачей, но подходит для решения других специфических задач. В частности, крупная языковая модель вьетнамского языка будет иметь большее преимущество в задачах, связанных с пониманием и генерацией вьетнамского языка.
Источник
Комментарий (0)