VinBigdata anunció la construcción exitosa de un gran modelo en idioma vietnamita el 21 de agosto, creando una base para dominar la tecnología de inteligencia artificial generativa.
Los Modelos de Lenguaje Grande (LLM) son modelos entrenados mediante técnicas de aprendizaje profundo en grandes conjuntos de datos de texto o imágenes. Estos modelos son capaces de comprender el conocimiento, generar texto y realizar diversas tareas de procesamiento del lenguaje natural. Se consideran clave para el desarrollo de la tecnología de IA Generativa, capaz de generar nuevos contenidos e ideas en diversos formatos (texto, imágenes, audio, etc.).
Con la construcción exitosa de un gran modelo de idioma vietnamita, VinBigdata integrará tecnología para hacer de VinBase (una plataforma integral de inteligencia artificial multicognitiva) una plataforma de IA generativa en Vietnam, al tiempo que proporcionará soluciones de desarrollo basadas en esta tecnología, como el chatbot de IA generativa, el callbot o el asistente virtual ViVi de nueva generación... Esta tecnología ayuda a aumentar la naturalidad de la comunicación de las máquinas, al tiempo que ayuda a los usuarios a buscar y sintetizar información de forma más rápida y sencilla que antes.
Profesor Vu Ha Van, director científico de VinBigdata. Foto: VinBigdata
El profesor Vu Ha Van, director científico de VinBigdata, afirmó que varias grandes corporaciones a nivel mundial han investigado y lanzado con éxito productos basados en grandes modelos lingüísticos, como OpenAI con ChatGPT o Google con Bard. En Vietnam, VinBigdata cuenta con la inversión de Vingroup para desarrollar un gran modelo lingüístico vietnamita. Según el Sr. Van, este modelo se centra en resolver tres problemas fundamentales: mejorar la precisión, reducir los costos de infraestructura y garantizar la seguridad.
"En lugar de necesitar alrededor de 175 mil millones de parámetros como ChatGPT, VinBigdata puede crear un gran modelo de lenguaje con varios miles de millones de parámetros, pero aún tiene la capacidad de generar documentos altamente auténticos, centrándose en los datos y el conocimiento vietnamita", dijo el líder de la unidad.
El dominio de la tecnología, el desarrollo personal desde los primeros pasos y la creación de un amplio modelo de idioma vietnamita se consideran un avance para ayudar a VinBigdata a incorporar la tecnología de IA generativa al ecosistema de productos y servicios del mercado. Actualmente, la empresa ha aplicado inicialmente la nueva tecnología en la línea de productos VinBase KB (Portal de Base de Conocimiento de VinBase). El producto tiene la capacidad de recuperar información y generar respuestas automáticamente a partir de la información recopilada de grandes conjuntos de datos en el sistema de conocimiento.
Un representante de VinBigdata compartió su experiencia en el evento de presentación de la IA Generativa. Foto: VinBigdata
Se espera que en diciembre de este año, los miembros de Vingroup lancen dos líneas de productos principales: VinBase 2.0 y la aplicación ViGPT. VinBase 2.0 es una plataforma de IA que crea múltiples percepciones con soluciones para empresas y organismos gubernamentales . Por otro lado, la empresa presenta la aplicación ViGPT como la "versión vietnamita de ChatGPT", disponible para que la comunidad la acceda y pruebe. Con ViGPT, los usuarios pueden hacer y responder preguntas sobre información específica de Vietnam (regulaciones, documentos legales) o información local (historia, literatura, lugares turísticos, especialidades locales).
VinBigdata Joint Stock Company cuenta con un sistema de base de datos de hasta 3500 terabytes. El sistema contiene cientos de miles de horas de datos de voz, imágenes e información que se limpian, procesan, clasifican y utilizan para el entrenamiento de IA, junto con infraestructura de I+D. Esta infraestructura incluye docenas de clústeres de servidores NvidiaDGX A100. La empresa también cuenta con un equipo de profesores, científicos y expertos en tecnología vietnamitas de todo el mundo.
Hoai Phuong
[anuncio_2]
Enlace de origen
Kommentar (0)