Vietnam.vn - Nền tảng quảng bá Việt Nam

“Dominar los datos vietnamitas es el primer paso para desarrollar y dominar la tecnología vietnamita”

Báo Thanh niênBáo Thanh niên27/05/2024

[anuncio_1]
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

Después de trabajar para una gran organización de inteligencia artificial en EE. UU., ¿por qué decidió regresar a casa para unirse a VinBigdata?

Mientras trabajaba en Estados Unidos, aunque participé en muchos proyectos gubernamentales de gran envergadura, los resultados que obtuve a menudo fueron solo unos pocos pasos de un gran proceso. Muchas veces, debido a la estricta confidencialidad de los proyectos, ni siquiera sabía cómo se utilizaban las soluciones que desarrollé.

En 2017, regresé a Vietnam cuando este se encontraba en plena fase de desarrollo y existían numerosos problemas relacionados con el big data y la inteligencia artificial que debían resolverse. Acepté la invitación del profesor Vu Ha Van para colaborar en el desarrollo de soluciones tecnológicas vietnamitas que sirvieran a la vida de los vietnamitas. Mi regreso a Vietnam fue mucho más significativo porque pude trabajar en problemas de mayor impacto.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

El Dr. Dao Duc Minh en un taller

En la estrategia de desarrollo de la inteligencia artificial, ¿qué papel e influencia juega el big data, señor?

Los datos desempeñan un papel fundamental y valioso en el entrenamiento de la inteligencia artificial. El entrenamiento de un modelo de inteligencia artificial de alta calidad suele comenzar con el entrenamiento de una gran base de datos. Por lo tanto, para lograr una inteligencia artificial de calidad, primero necesitamos datos de calidad.

Los datos de calidad requieren cantidad, escala, calidad, variedad y universalidad. El proceso de recopilar y procesar miles de horas de datos, desde la fase de limpieza de datos brutos hasta la creación de datos de la más alta calidad para alimentar modelos de inteligencia artificial, es muy costoso y complejo. En cambio, para analizar big data, necesitamos usar inteligencia artificial para garantizar la capacidad de procesar datos con precisión a gran escala, generando así mejores resultados decisivos o predictivos.

Por ejemplo, en el proceso de desarrollo de un producto de asistente virtual para vietnamitas (ViVi), tuvimos que recopilar y procesar decenas de miles de horas de datos de audio de alta calidad, de cientos de miles de voces de diferentes regiones, edades y géneros diversos, con contenido que abarca cientos de campos...

O, más recientemente, el lanzamiento de ViGPT: "La primera versión vietnamita de ChatGPT para usuarios finales", desarrollada a partir de un modelo de lenguaje extenso, propiedad exclusiva de VinBigdata. Este modelo se entrena con 600 GB de datos vietnamitas refinados de diversos campos. Gracias a nuestro conocimiento de los datos y el idioma vietnamita, hemos encontrado un nuevo enfoque para acortar el tiempo de lanzamiento de ViGPT en tan solo 9 meses desde el lanzamiento de ChatGPT.

Ésta es la resonancia entre el big data y la inteligencia artificial.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

¿Cuál es su opinión sobre vincular la investigación con valor práctico para servir a la comunidad?

- Creo que la investigación tecnológica sólo es verdaderamente exitosa cuando realmente entra en la vida, resuelve problemas sociales y mejora la vida de las personas.

Para crear productos comerciales prácticos que resuelvan problemas empresariales y sociales, debemos prestar siempre atención y plantearnos la pregunta: ¿qué valor aportarán los datos a la vida?

Hasta ahora, hemos investigado y desarrollado una variedad de productos y soluciones para diversas industrias y campos, típicamente ViGPT, VinDr, que proporciona soluciones de IA en el diagnóstico de imágenes médicas , VinBase, una plataforma de inteligencia bioartificial, o Vizone, un conjunto de soluciones de análisis de imágenes inteligentes.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Con personal clave de VinBigdata en un evento de Vingroup Corporation

La cuarta revolución industrial se está desarrollando con fuerza a escala global. ¿Qué ventajas crees que tiene Vietnam?

En comparación con revoluciones anteriores, creo que Vietnam cuenta actualmente con muchas ventajas para destacar en esta revolución industrial 4.0, lo que contribuirá a mejorar su posición en el panorama mundial. Las dos claves para lograr este objetivo son los datos y las personas.

Vietnam tiene actualmente casi 100 millones de habitantes, de los cuales una alta proporción son jóvenes que usan teléfonos y computadoras personales. Además, contamos con reconocidos expertos en inteligencia artificial y jóvenes talentosos en tecnologías de la información, además de una sólida base en matemáticas.

Entonces, ¿cuáles son las limitaciones?

La primera limitación evidente es que, a pesar de disponer de una gran población, aún tenemos dificultades para dominar los datos, en concreto para estandarizarlos y sincronizarlos en las instalaciones, unidades de negocio y administraciones.

Además, también enfrentamos otras limitaciones, como los recursos de inversión limitados, especialmente la inversión en infraestructura informática de alto rendimiento.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

En su opinión, ¿qué importancia tiene el papel del dominio de los datos vietnamitas en el proceso de creación y dominio de la tecnología para servir a la vida del pueblo vietnamita?

Actualmente existen numerosos productos líderes de inteligencia artificial a nivel mundial, generalmente aplicaciones de IA generativas basadas en grandes modelos lingüísticos, como ChatGPT de OpenAI o Bard de Google. Sin embargo, el vietnamita no es el idioma principal para el desarrollo de estos productos.

Por lo tanto, la calidad del contenido específico en vietnamita que se devuelve a los usuarios se ve más o menos afectada y tiene una alta posibilidad de errores, más peligrosamente, errores en los conocimientos básicos.

Como vietnamitas, tenemos la ventaja de acceder a nuestras propias fuentes de datos. Solo nosotros tenemos la capacidad de comprender las características de los datos vietnamitas, así como las necesidades y características de los vietnamitas. Por lo tanto, dominar los datos vietnamitas es fundamental para dominar las tecnologías esenciales, que son las que servirán a los vietnamitas.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Capacitación interna para miembros de VinBigdata

¿Cómo acceder a fuentes de datos específicas, especialmente cuando la mayoría de los vietnamitas utilizan hoy sitios de redes sociales desde el extranjero?

La realidad es que la mayor fuente de datos humanos hoy en día (no solo vietnamitas) se encuentra en internet y las redes sociales. Sin embargo, aún podemos acceder y recopilar datos de diferentes fuentes, basándonos en la comprensión de las características de los datos vietnamitas, según las características definidas por cada proyecto.

Por ejemplo, los modelos GPT de OpenAI tienen cientos, incluso billones, de parámetros, se entrenan con enormes cantidades de datos y cuestan miles de millones de dólares. En comparación con ellos, hemos optado por un camino completamente diferente, basado en nuestra investigación, capacidades y recursos: crear un modelo de idioma vietnamita con una arquitectura de tan solo unos pocos miles de millones de parámetros, entrenado con un conjunto de datos vietnamitas de 600 GB que recopilamos y refinamos nosotros mismos, pero con capacidades equivalentes en cuanto al procesamiento del idioma vietnamita. Los resultados demuestran que nuestra arquitectura, desarrollada por nosotros mismos, puede autooptimizarse, acortar el tiempo de entrenamiento del modelo lingüístico, reducir los costos y, al mismo tiempo, garantizar la calidad del modelo.

¿Cuáles son los desafíos que usted y su equipo han enfrentado en el proceso de investigación y desarrollo de productos de inteligencia artificial?

El primer desafío es, sin duda, el tiempo. La ola de tecnología de inteligencia artificial avanza con gran rapidez y se encuentra en pleno auge. A nivel mundial, las empresas tecnológicas líderes han lanzado rápidamente productos altamente completos, actualizados y mejorados constantemente. Si somos lentos y no lanzamos productos a tiempo, sin duda nos quedaremos atrás.

Por otro lado, si queremos crear productos que puedan aplicarse y resolver problemas sociales prácticos, también debemos considerar encontrar y desarrollar las características sobresalientes, especiales y únicas del producto.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Presentación en el Día de la Inteligencia Artificial de Vietnam (AI4VN 2023)

De hecho, muchas personas y organizaciones en Vietnam y en todo el mundo han sufrido grandes pérdidas por filtraciones de datos. ¿Cómo ve el problema de la seguridad de los datos?

Se puede decir que hoy en día cualquier aplicación proviene de los datos. Al trabajar con datos, por un lado, debemos asegurar el objetivo de aplicarlos para crear la mejor tecnología para la vida y, por otro, debemos garantizar la seguridad de los datos para las personas y las organizaciones.

El factor humano es un eslabón fundamental en el proceso de garantía de la seguridad de los datos. Este factor incluye a los desarrolladores, usuarios de productos y usuarios finales. Para los desarrolladores, la concienciación sobre la seguridad de los datos debe estar presente desde el inicio de la recopilación y el procesamiento de datos.

A menudo, cuando no hay ningún problema, desconocemos la importancia de la seguridad de los datos. Pero si se produce una fuga de datos, el daño puede ser enorme. Las fugas de datos pueden ocurrir debido a problemas técnicos o ataques intencionales para robar datos. Cuando se producen fugas de datos, la información de personas u organizaciones puede ser utilizada por delincuentes con fines ilegales, y las empresas pueden sufrir pérdidas financieras para solucionar los problemas relacionados, incluso perjudicando su imagen.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

El Dr. Dao Duc Minh y el equipo de VinBigdata en un evento

Después de la aspiración de dominar la tecnología para servir al pueblo vietnamita, ¿habrá pasos para avanzar hacia el mundo?

Cualquier organización o empresa que desee llevar sus productos al mercado internacional debe cumplir con los estándares internacionales. VinBigdata cuenta con fortalezas en soluciones y tecnología, por lo que definir una visión para conquistar el mundo es natural.

Por supuesto, para implementar muchos productos y aplicaciones diferentes, es necesario contar con el apoyo de unidades internacionales con muchos años de experiencia y comprensión de los usuarios de todo el mundo.

¡Gracias!


[anuncio_2]
Fuente: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Kommentar (0)

No data
No data

Mismo tema

Misma categoría

El majestuoso arco de la cueva en Tu Lan
La meseta a 300 kilómetros de Hanoi tiene un mar de nubes, cascadas y visitantes bulliciosos.
Patas de cerdo estofadas con carne de perro falsa: un plato especial de los pueblos del norte
Mañanas tranquilas en la franja de tierra en forma de S

Mismo autor

Herencia

Cifra

Negocio

No videos available

Noticias

Sistema político

Local

Producto