На мероприятии «День искусственного интеллекта 2023» на тему «ИИ — переосмысление реальности», которое пройдет 5 и 6 декабря, компания VinAI Artificial Intelligence Research and Application Company (корпорация Vingroup ) анонсировала исследовательский проект с открытым исходным кодом по большой языковой модели для вьетнамского языка — PhoGPT.
PhoGPT — это проект с открытым исходным кодом, а не проприетарное программное обеспечение, как ChatGPT от OpenAI. Благодаря открытому исходному коду, нет никаких коммерческих ограничений, и все стороны могут использовать PhoGPT для разработки собственных приложений, включая коммерческие модули. Это означает, что PhoGPT представляет собой платформу, предоставляющую сообществу возможность разрабатывать приложения, связанные с технологиями искусственного интеллекта, в стране.
По словам доктора Буй Хай Хуна, генерального директора компании VinAI Artificial Intelligence Research and Application Company, ограничения вьетнамских моделей показали, что они не достигли оптимальной производительности и не имеют открытого исходного кода. Поэтому одной из актуальных задач для сообщества ИИ в целом и сообщества обработки естественного языка (NLP) в частности является создание новой, более мощной модели, способной обрабатывать вьетнамский язык с высокой точностью и производительностью.
Эксперты по искусственному интеллекту утверждают, что с помощью модели языка больших данных с 7,5 миллиардами параметров, созданной на платформе декодирования Transformer, эта модель обучается с нуля, используя самые передовые доступные технологии, такие как механизм Flash Attention, экстраполяция длины контекста AliBi...
Эти методы не только помогают модели глубже понимать контекст, но и расширяют возможности естественного диалога и взаимодействия PhoGPT. Это делает модель универсальным и многозадачным инструментом, способным удовлетворить широкий спектр лингвистических потребностей пользователей.
Доктор Буй Хай Хунг добавил, что PhoGPT изначально разрабатывался компанией независимо от всех других моделей в мире . Благодаря модели с открытым исходным кодом вьетнамское сообщество может использовать и совершенствовать её более эффективно. Публичный исходный код PhoGPT, доступный пользователям, помогает создать среду, в которой сообщество пользователей может разрабатывать индивидуальные и уникальные приложения.
Одна из целей открытого исходного кода — заложить основу, чтобы людям не приходилось тратить время на переделку, а подразделения могли разрабатывать более крупные языковые модели, такие как PhoGPT. Это поможет обществу сформировать качественное сообщество разработчиков открытого исходного кода для крупных языковых моделей вьетнамского языка, что положительно скажется на вовлечении многих компаний и их применении в определённой области. Компания VinAI Artificial Intelligence Research and Application Company заявила, что с помощью PhoGPT она реализует план исследований и разработки приложений для индивидуальных пользователей, а также пакет специализированных решений для поддержки предприятий, работающих на вьетнамском языке, в таких областях, как здравоохранение, образование и т. д.
PhoGPT заложила первые основы для разработки высокопроизводительных моделей вьетнамского языка как основы для разработки практичных и эффективных приложений в соответствии с правительственной стратегией развития ИИ до 2030 года.
БА ТАН
Источник
Комментарий (0)