Vietnam.vn - Nền tảng quảng bá Việt Nam

Dos estudiantes varones publican investigaciones en la principal conferencia mundial sobre IA

VnExpressVnExpress12/02/2024

[anuncio_1]

Utilizando métodos de entrenamiento adversarial para permitir que la IA genere nuevos datos, la investigación de dos estudiantes de la Universidad Tecnológica de la ciudad de Ho Chi Minh se publicó en AAAI, la conferencia de IA líder a nivel mundial .

La investigación sobre modelos multilingües para entrenar a la IA en la creación de sinónimos, realizada por Pham Khanh Trinh y Le Minh Khoi, de 23 años, fue publicada en los documentos de la Conferencia AAAI-24 sobre Inteligencia Artificial, celebrada a finales de febrero en Vancouver, Canadá.

El profesor asociado Dr. Quan Thanh Tho, vicedecano de la Facultad de Ciencias de la Computación e Ingeniería de la Universidad Tecnológica de Ciudad Ho Chi Minh, calificó este resultado como loable. El Sr. Tho afirmó que investigadores y expertos consideran que AAAI es un evento de primer nivel en congresos científicos en los campos de la informática y la inteligencia artificial, con una tasa de aceptación de artículos muy baja, del 23,75 % este año.

Minh Khoi y Khanh Trinh (en el centro) durante la defensa de su tesis de graduación, 2023. Foto: Proporcionada por el personaje.

Minh Khoi y Khanh Trinh (en el centro) durante la defensa de su tesis de graduación, 2023. Foto: Proporcionada por el personaje.

Compartiendo su pasión por el aprendizaje profundo y el procesamiento del lenguaje natural, Trinh y Khoi decidieron investigar los modelos de lenguaje de gran tamaño (LLM). Ambos querían descubrir sus limitaciones y mejorarlos.

Khanh Trinh explicó que los GPT o LLM de Chat necesitan ser entrenados con una gran cantidad de datos de texto para generar respuestas precisas y diversas para los usuarios. Los dos chicos se dieron cuenta de que, con idiomas menos populares como el hindi, el kazajo o el indonesio, los GPT y LLM de Chat suelen dar resultados inesperados porque no han estudiado mucho estos idiomas o no cuentan con suficientes datos para aprenderlos.

"¿Por qué no creamos más datos textuales a partir de los 'pocos recursos' de esos idiomas para entrenar mejor la IA?", preguntaron los dos estudiantes. De ahí surgió el modelo LAMPAT (Adaptación de Bajo Rango para Parafrasear Multilingüe mediante Entrenamiento Adversarial), una interpretación multilingüe que utiliza el método de entrenamiento adversarial investigado por Trinh y Khoi.

LAMPAT puede generar un sinónimo a partir de una oración de entrada para generar más datos de texto. El explicador de "entrenamiento adversarial" es un método relativamente nuevo para entrenar modelos lingüísticos extensos. Dada una oración de entrada, con los métodos de entrenamiento tradicionales, la aplicación generará una oración de salida. Sin embargo, con el entrenamiento adversarial, la aplicación puede comentar y editar la oración de salida, "adversarial", para generar más oraciones.

La naturaleza multilingüe de LAMPAT reside en que este modelo integra 60 idiomas simultáneamente. Con base en los conjuntos de datos recopilados, el equipo continúa entrenando LAMPAT para generar sinónimos. La cantidad de datos de texto generados por LAMPAT se seguirá utilizando para entrenar los LLM, de modo que estos modelos puedan aprender diversas maneras de expresar información para el mismo contenido, ofreciendo así respuestas diversas con mayor probabilidad de ser correctas. Con esta característica, el representante del equipo cree que LAMPAT puede integrarse en aplicaciones como ChatGPT para perfeccionar aún más este modelo.

Además, la falta de datos para Chat GPT o LLMs obliga a algunas empresas a buscar numerosas fuentes externas, como libros, periódicos, blogs, etc., sin tener en cuenta los derechos de autor. Según Khanh Trinh, la creación de sinónimos también es una forma de limitar el plagio y la infracción de derechos de autor.

Nam Sinh dio un ejemplo de aplicaciones como Chat GPT, cuando un usuario solicita un resumen de un texto existente A, la aplicación generará un texto resumen B. Si se integra el método de investigación del grupo, al recibir el texto A, la aplicación generará múltiples textos con el mismo contenido A1, A2, A3 basado en el mecanismo de generación de sinónimos, a partir de los cuales resumirá el texto y producirá muchos resultados para que el usuario elija.

En las primeras etapas de la investigación, el equipo tuvo dificultades para preparar datos de evaluación en 60 idiomas. Debido a la falta de acceso a una cantidad suficiente de datos, el equipo compiló un conjunto de datos diverso y completo en 13 idiomas para evaluar objetivamente el modelo, incluyendo: vietnamita, inglés, francés, alemán, ruso, japonés, chino, español, húngaro, portugués, sueco, finlandés y checo. Este conjunto de datos también es fiable para la etapa final de la evaluación humana.

Minh Khoi (izquierda) y Khanh Trinh (derecha) se tomaron una foto conmemorativa con el maestro Quan Thanh Tho el día de la graduación, en noviembre de 2023. Foto: Proporcionada por el personaje.

Minh Khoi (izquierda) y Khanh Trinh (derecha) se tomaron una foto conmemorativa con el maestro Quan Thanh Tho el día de la graduación, en noviembre de 2023. Foto: Proporcionada por el personaje.

Para cada uno de los idiomas inglés, vietnamita, alemán, francés y japonés, el equipo extrajo aleatoriamente 200 pares de oraciones (un par compuesto por la oración de salida y la etiqueta correcta) para su evaluación. Para cada uno de los idiomas mencionados, el equipo solicitó a cinco expertos en idiomas que las calificaran de forma independiente, basándose en tres criterios: conservación semántica; selección de palabras y similitud léxica, y fluidez y coherencia de la oración de salida. La escala se calculó del 1 al 5. Como resultado, la puntuación media de la evaluación de los expertos en idiomas en estos cinco idiomas osciló entre 4,2 y 4,6/5 puntos.

El ejemplo da un par de oraciones vietnamitas que tienen una puntuación de 4,4/5, en las que la oración de entrada es: "Explicó el problema en detalle" y la oración de salida es: "Explicó el problema en detalle".

Pero también hay pares de oraciones con mala calidad y errores semánticos, como el par de oraciones "Comemos mientras la sopa está caliente - Comemos la sopa mientras estamos calientes", que solo obtiene 2/5 puntos.

Khanh Trinh comentó que la investigación y finalización de este proyecto les llevó ocho meses. Este también es el tema de la tesis de graduación de Trinh y Khoi. La tesis obtuvo el primer puesto en el Consejo de Ciencias de la Computación 2 con 9,72/10 puntos.

Según el Sr. Quan Thanh Tho, si bien LAMPAT ha demostrado su capacidad para generar frases sinónimas con apariencia humana en varios idiomas, aún necesita mejorar para manejar modismos, canciones populares y proverbios en diferentes idiomas.

Además, el conjunto de datos de evaluación del equipo solo incluye 13 idiomas, lo que deja fuera a muchos, especialmente a las lenguas minoritarias. Por lo tanto, el equipo necesita investigar para mejorar y ampliar las capacidades de los modelos actuales de interpretación multilingüe. A partir de aquí, podemos eliminar la barrera lingüística entre países y etnias.

A finales de 2023, Trinh y Khoi se graduaron con honores y distinción en Ciencias de la Computación, con un promedio de calificaciones (GPA) de 3.7 y 3.9/4, respectivamente. Ambos planean estudiar una maestría en el extranjero y dedicarse a la investigación en inteligencia artificial y aprendizaje automático.

"Seguimos investigando este tema con el objetivo de aplicar más LAMPAT a futuros proyectos científicos y crear un producto multilingüe confiable para los usuarios", afirmó Trinh.

Le Nguyen


[anuncio_2]
Enlace de origen

Kommentar (0)

No data
No data
Escena mágica en la colina del té "cuenco al revés" en Phu Tho
Tres islas de la región central se asemejan a las Maldivas y atraen turistas en verano.
Contemple la brillante ciudad costera de Quy Nhon, Gia Lai, por la noche.
Imagen de campos en terrazas en Phu Tho, con suave pendiente, brillantes y hermosos como espejos antes de la temporada de siembra.
La fábrica Z121 está lista para la Noche Final Internacional de Fuegos Artificiales
La famosa revista de viajes elogia la cueva Son Doong como "la más magnífica del planeta"
Una cueva misteriosa atrae a turistas occidentales, comparada con la "cueva Phong Nha" en Thanh Hoa
Descubra la belleza poética de la bahía de Vinh Hy
¿Cómo se procesa el té más caro de Hanoi, cuyo precio supera los 10 millones de VND/kg?
Sabor de la región del río

Herencia

Cifra

Negocio

No videos available

Noticias

Sistema político

Local

Producto