Vietnam.vn - Nền tảng quảng bá Việt Nam

Dr. Dao Duc Minh: „Die Beherrschung vietnamesischer Daten ist der erste Schritt zur Entwicklung und Beherrschung vietnamesischer Technologie“

Báo Thanh niênBáo Thanh niên27/05/2024

img Nachdem Sie in den USA für eine große Organisation für künstliche Intelligenz gearbeitet hatten, warum haben Sie sich entschieden, nach Vietnam zurückzukehren, um bei VinBigdata anzufangen? Obwohl ich während meiner Arbeit in den USA an vielen großen Regierungsprojekten mitwirkte, bestanden die Ergebnisse, die ich erzielte, oft nur aus wenigen Schritten in einem großen Verarbeitungsprozess. Aufgrund der sehr strengen Vertraulichkeitsverfahren der Projekte wusste ich oft nicht einmal, wie die von mir entwickelten Lösungen eingesetzt wurden. 2017 kehrte ich nach Vietnam zurück, als sich das Land in der Entwicklungsphase befand und es viele Probleme im Zusammenhang mit Big Data und künstlicher Intelligenz zu lösen gab. Ich nahm die Einladung von Professor Vu Ha Van an, um gemeinsam das Ziel zu verwirklichen, vietnamesische Technologielösungen zu entwickeln, die dem Leben der Vietnamesen dienen. Meine Rückkehr nach Vietnam empfinde ich als viel bedeutsamer, weil ich an Problemen mit größerer Wirkung arbeiten kann.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr. Dao Duc Minh in einem Workshop

NVCC

Welche Rolle und welchen Einfluss haben Big Data in der Strategie zur Entwicklung künstlicher Intelligenz? Daten spielen beim Training künstlicher Intelligenz eine sehr wichtige und wertvolle Rolle. Um ein hochwertiges KI-Modell zu trainieren, beginnen wir oft mit dem Training einer großen Datenbank. Um qualitativ hochwertige künstliche Intelligenz zu entwickeln, benötigen wir daher zunächst gute Daten. Gute Daten müssen Standards hinsichtlich Quantität, Umfang, Qualität, Vielfalt und Universalität erfüllen. Das Sammeln und Verarbeiten von Tausenden von Datenstunden aus der Rohdatenbereinigung, um qualitativ hochwertige Daten für das KI-Modell zu erstellen, ist sehr teuer und kompliziert. Um Big Data zu analysieren, benötigen wir hingegen künstliche Intelligenz, um die Fähigkeit zu gewährleisten, Daten in großem Umfang präzise zu verarbeiten und so aussagekräftigere und prädiktivere Ergebnisse zu erzielen. Beispielsweise mussten wir bei der Entwicklung eines virtuellen Assistenten für Vietnamesen (ViVi) Zehntausende Stunden hochwertiger Audiodaten von Hunderttausenden Stimmen aus verschiedenen Regionen, unterschiedlichen Alters und Geschlechts und mit Inhalten aus Hunderten von Bereichen sammeln und verarbeiten. Oder erst kürzlich die Einführung von ViGPT – „der ersten vietnamesischen Version von ChatGPT für Endnutzer“, die auf einem Big Language Model basiert, das vollständig VinBigdata gehört. Dieses Modell wurde anhand von 600 GB verfeinerter vietnamesischer Daten aus vielen verschiedenen Bereichen trainiert. Dank unseres Verständnisses vietnamesischer Daten und Sprache haben wir einen neuen Ansatz gefunden, um die Einführungszeit von ViGPT auf nur neun Monate nach der Geburt von ChatGPT zu verkürzen. Hier liegt die Verbindung zwischen Big Data und künstlicher Intelligenz.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
Wie stehen Sie zur Verknüpfung von Forschung und praktischem Nutzen für die Gemeinschaft? – Ich glaube, dass Technologieforschung nur dann wirklich erfolgreich ist, wenn sie tatsächlich ins Leben eintritt, soziale Probleme löst und das Leben der Menschen verbessert. Um praktische kommerzielle Produkte zu entwickeln und geschäftliche und soziale Probleme zu lösen, müssen wir stets aufmerksam sein und uns die Frage stellen: Welchen Wert bringen Daten ins Leben? Bisher haben wir eine Vielzahl von Produkten und Lösungen in unterschiedlichen Branchen und Bereichen erforscht, darunter ViGPT, VinDr – KI-Lösungen für die medizinische Bilddiagnostik, VinBase – eine Plattform für künstliche Intelligenz – oder Vizone – eine Reihe intelligenter Bildanalyselösungen.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Mit Schlüsselpersonal von VinBigdata bei einer Veranstaltung der Vingroup Corporation

NVCC

Die vierte industrielle Revolution ist weltweit in vollem Gange. Welche Vorteile sieht Vietnam Ihrer Meinung nach? Im Vergleich zu früheren Revolutionen hat Vietnam meiner Meinung nach derzeit viele Vorteile, um in dieser industriellen Revolution 4.0 durchzubrechen und die Position des Landes auf der Weltkarte zu verbessern. Die beiden Schlüssel zum Erreichen dieses Ziels sind Daten und Menschen. Vietnam hat derzeit fast 100 Millionen Einwohner, von denen ein hoher Anteil junger Menschen Telefone und PCs nutzt. Darüber hinaus verfügen wir über renommierte Experten für künstliche Intelligenz und junge, hochqualifizierte Fachkräfte in der Informationstechnologie sowie über sehr gute mathematische Grundlagen. Wo liegen also die Einschränkungen? Die erste erkennbare Einschränkung besteht darin, dass wir trotz unserer großen Bevölkerung immer noch Schwierigkeiten haben, Daten zu beherrschen, insbesondere mit der Standardisierung und Synchronisierung von Daten in Einrichtungen, Geschäftsbereichen und Verwaltungen. Darüber hinaus stehen wir vor weiteren Einschränkungen, wie begrenzten Investitionsmitteln, insbesondere Investitionen in Hochleistungsrechnerinfrastruktur.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
Wie wichtig ist Ihrer Meinung nach die Beherrschung vietnamesischer Daten auf dem Weg zur Entwicklung und Beherrschung von Technologien, die dem Leben der Vietnamesen dienen? Derzeit gibt es weltweit viele führende Produkte im Bereich künstliche Intelligenz, in der Regel KI-Anwendungen, die auf großen Sprachmodellen basieren, wie ChatGPT von OpenAI oder Bard von Google. Vietnamesisch ist jedoch nicht die Kernsprache für die Entwicklung dieser Produkte. Daher ist die Qualität der den Nutzern zurückgegebenen vietnamesischspezifischen Inhalte mehr oder weniger beeinträchtigt und es besteht eine hohe Fehlerwahrscheinlichkeit, noch gefährlicher, Fehler in den Grundkenntnissen. Als Vietnamesen haben wir den Vorteil, auf unsere eigenen Datenquellen zugreifen zu können. Nur wir sind in der Lage, die Besonderheiten vietnamesischer Daten sowie die Bedürfnisse und Merkmale der Vietnamesen zu verstehen. Daher ist die Beherrschung vietnamesischer Daten der Schlüssel zur Beherrschung von Kerntechnologien, die auch den Vietnamesen dienen werden.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Interne Schulung für VinBigdata-Mitglieder

NVCC

Wie kann man auf spezifische Datenquellen zugreifen, insbesondere wenn die meisten Vietnamesen heute soziale Netzwerke im Ausland nutzen? Tatsächlich sind das Internet und soziale Netzwerke heute die größte Quelle menschlicher Daten (nicht nur von Vietnamesen). Wir können jedoch basierend auf unserem Verständnis der Eigenschaften vietnamesischer Daten und den jeweiligen Projektanforderungen weiterhin auf Daten aus verschiedenen Quellen zugreifen und diese sammeln. Beispielsweise verfügen die GPT-Modelle von OpenAI über Hunderte, ja sogar Billionen von Parametern, werden mit riesigen Datenmengen trainiert und kosten Milliarden von Dollar. Im Vergleich dazu haben wir basierend auf unserer Forschung, unseren Fähigkeiten und Ressourcen einen völlig anderen Weg eingeschlagen: Wir haben ein vietnamesisches Sprachmodell mit einer Architektur von nur wenigen Milliarden Parametern entwickelt, das mit einem 600 GB großen Satz vietnamesischer Daten trainiert wurde, die wir selbst gesammelt und verfeinert haben, aber die gleiche Fähigkeit zur Verarbeitung von Vietnamesisch besitzt. Die Ergebnisse zeigen, dass unsere selbst entwickelte Architektur sich selbst optimieren, die Trainingszeit des Sprachmodells verkürzen und die Kosten senken kann, während gleichzeitig die Modellqualität gewährleistet bleibt. Welche Herausforderungen sind Ihnen und Ihrem Team bei der Erforschung und Entwicklung von KI-Produkten begegnet? Die erste Herausforderung ist sicherlich die Zeit. Die Welle der künstlichen Intelligenz ist rasant und befindet sich in einer explosionsartigen Entwicklung. Weltweit führende Technologieunternehmen bringen schnell hochentwickelte Produkte auf den Markt, die ständig aktualisiert und verbessert werden. Wenn wir langsam sind und Produkte nicht rechtzeitig auf den Markt bringen, geraten wir mit Sicherheit ins Hintertreffen. Um andererseits anwendungsorientierte Produkte zu entwickeln, die praktische soziale Probleme lösen, müssen wir auch die herausragenden, besonderen und einzigartigen Produktmerkmale entdecken und weiterentwickeln.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Präsentation beim Vietnam Artificial Intelligence Day (AI4VN 2023)

NVCC

Tatsächlich haben viele Einzelpersonen und Organisationen in Vietnam und weltweit durch Datenlecks große Verluste erlitten. Wie sehen Sie das Thema Datensicherheit? Heutzutage basiert jede Anwendung auf Daten. Bei der Arbeit mit Daten müssen wir einerseits sicherstellen, dass wir mit Daten die beste Technologie für das Leben entwickeln, andererseits aber auch die Datensicherheit für Einzelpersonen und Organisationen gewährleisten. Der menschliche Faktor ist ein wichtiges Bindeglied im Prozess der Datensicherheit. Dazu gehören Entwickler, Produktnutzer und Anwender. Entwickler müssen sich von Beginn der Datenerfassung und -verarbeitung an für Datensicherheit sensibilisieren. Oftmals ist uns die Bedeutung von Datensicherheit nicht bewusst, wenn keine Probleme auftreten. Doch ein Datenleck kann enorme Schäden verursachen. Datenlecks können durch technische Probleme oder vorsätzlichen Datendiebstahl entstehen. Bei einem Datenleck können die Informationen von Einzelpersonen oder Organisationen von Kriminellen für illegale Zwecke missbraucht werden, während Unternehmen bei der Behebung der Probleme finanzielle Verluste erleiden und sogar ihrem Markennamen schaden können.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Dr. Dao Duc Minh und das VinBigdata-Team bei einer Veranstaltung

NVCC

Nach dem Ziel, die Technologie für die vietnamesische Bevölkerung zu beherrschen, müssen nun auch Schritte in die Welt unternommen werden? Jede Organisation oder jedes Unternehmen, das seine Produkte auf den internationalen Markt bringen möchte, muss internationale Standards einhalten. VinBigdata verfügt über Stärken in den Bereichen Lösungen und Technologie, daher ist es naheliegend, die Vision zu entwickeln, die Welt zu erobern. Für die Bereitstellung vielfältiger Produkte und Anwendungen ist natürlich die Zusammenarbeit mit internationalen Einheiten mit langjähriger Erfahrung und einem Verständnis für die Bedürfnisse der Nutzer weltweit erforderlich. Vielen Dank!

Thanhnien.vn

Quelle: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Kommentar (0)

No data
No data

Gleiches Thema

Gleiche Kategorie

Der majestätische Höhlenbogen in Tu Lan
Das 300 km von Hanoi entfernte Plateau bietet ein Meer aus Wolken, Wasserfällen und geschäftigen Besuchern.
Geschmorte Schweinefüße mit falschem Hundefleisch – ein besonderes Gericht der Nordvölker
Ruhige Morgen auf dem S-förmigen Landstreifen

Gleicher Autor

Erbe

Figur

Geschäft

No videos available

Nachricht

Politisches System

Lokal

Produkt