Vietnam.vn - Nền tảng quảng bá Việt Nam

„Die Beherrschung vietnamesischer Daten ist der erste Schritt zur Entwicklung und Beherrschung vietnamesischer Technologie.“

Báo Thanh niênBáo Thanh niên27/05/2024

[Anzeige_1]
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

Nachdem Sie für eine große Organisation für künstliche Intelligenz in den USA gearbeitet hatten, warum haben Sie sich entschieden, in Ihre Heimat zurückzukehren und bei VinBigdata anzufangen?

Während meiner Tätigkeit in den USA war ich zwar an vielen großen Regierungsprojekten beteiligt, doch die Ergebnisse, die ich erzielte, waren oft nur wenige Schritte in einem großen Prozess. Aufgrund der strengen Vertraulichkeit der Projekte wusste ich oft nicht einmal, wie die von mir entwickelten Lösungen eingesetzt wurden.

2017 kehrte ich nach Vietnam zurück, als sich das Land in der Entwicklungsphase befand und viele Probleme im Zusammenhang mit Big Data und künstlicher Intelligenz gelöst werden mussten. Ich nahm die Einladung von Professor Vu Ha Van an, um gemeinsam das Ziel zu verwirklichen, vietnamesische Technologielösungen zu entwickeln, die das Leben der Vietnamesen verbessern. Meine Rückkehr nach Vietnam empfand ich als viel bedeutsamer, da ich an Problemen mit größerer Wirkung arbeiten konnte.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr. Dao Duc Minh in einem Workshop

Welche Rolle und welchen Einfluss spielen Big Data in der Strategie zur Entwicklung künstlicher Intelligenz, Sir?

Daten spielen eine große und wertvolle Rolle beim Training künstlicher Intelligenz. Das Training eines hochwertigen KI-Modells beginnt oft mit dem Training einer großen Datenbank. Um qualitativ hochwertige künstliche Intelligenz zu entwickeln, benötigen wir daher zunächst gute Daten.

Gute Daten erfordern Quantität und Umfang, Qualität, Vielfalt und Universalität. Das Sammeln und Verarbeiten von Tausenden von Datenstunden aus der Rohdatenbereinigung, um qualitativ hochwertige Daten für künstliche Intelligenzmodelle zu erstellen, ist sehr teuer und komplex. Um Big Data zu analysieren, benötigen wir hingegen künstliche Intelligenz, um die Fähigkeit zu gewährleisten, Daten in großem Umfang präzise zu verarbeiten und so bessere, aussagekräftigere oder prädiktive Ergebnisse zu erzielen.

Beispielsweise mussten wir im Zuge der Entwicklung eines virtuellen Assistenten für Vietnamesen (ViVi) Zehntausende Stunden hochwertiger Audiodaten von Hunderttausenden Stimmen aus verschiedenen Regionen, unterschiedlichen Alters und Geschlechts und mit Inhalten aus Hunderten von Bereichen sammeln und verarbeiten ...

Oder erst kürzlich die Einführung von ViGPT – „der ersten vietnamesischen Version von ChatGPT für Endnutzer“, entwickelt auf Basis eines großen Sprachmodells, das vollständig im Besitz von VinBigdata ist. Dieses Modell basiert auf 600 GB verfeinerter vietnamesischer Daten aus verschiedenen Bereichen. Dank unseres Verständnisses vietnamesischer Daten und Sprache haben wir einen neuen Ansatz gefunden, um die Einführungszeit von ViGPT innerhalb von nur neun Monaten nach der Einführung von ChatGPT zu verkürzen.

Dies ist die Resonanz zwischen Big Data und künstlicher Intelligenz.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

Wie stehen Sie dazu, Forschung mit praktischem Nutzen zu verknüpfen, um der Gemeinschaft zu dienen?

- Ich glaube, dass Technologieforschung nur dann wirklich erfolgreich ist, wenn sie tatsächlich ins Leben eintritt, soziale Probleme löst und das Leben der Menschen verbessert.

Um praktische kommerzielle Produkte zu schaffen, die geschäftliche und soziale Probleme lösen, müssen wir stets aufmerksam sein und die Frage stellen: Welchen Wert bringen Daten ins Leben?

Bisher haben wir eine Vielzahl von Produkten und Lösungen für verschiedene Branchen und Bereiche erforscht und entwickelt, insbesondere ViGPT, VinDr – Anbieter von KI-Lösungen für die medizinische Bilddiagnose, VinBase – eine Plattform für bio-künstliche Intelligenz – oder Vizone – eine Reihe intelligenter Bildanalyselösungen.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Mit Schlüsselpersonal von VinBigdata bei einer Veranstaltung der Vingroup Corporation

Die vierte industrielle Revolution findet weltweit statt. Welche Vorteile bietet Vietnam Ihrer Meinung nach?

Im Vergleich zu früheren Revolutionen bin ich überzeugt, dass Vietnam derzeit viele Vorteile hat, um in dieser industriellen Revolution 4.0 durchzubrechen und die Position des Landes auf der Weltkarte zu verbessern. Die beiden Schlüssel zum Erreichen dieses Ziels sind Daten und Menschen.

Vietnam hat derzeit fast 100 Millionen Einwohner, von denen ein hoher Anteil junger Menschen Telefone und PCs nutzt. Darüber hinaus verfügen wir über renommierte Experten für künstliche Intelligenz und qualifizierte Nachwuchskräfte in der Informationstechnologie sowie über sehr gute mathematische Grundlagen.

Was sind also die Einschränkungen?

Die erste offensichtliche Einschränkung besteht darin, dass wir trotz unserer großen Bevölkerung immer noch Schwierigkeiten haben, Daten zu beherrschen, insbesondere mit der Standardisierung und Synchronisierung von Daten in Einrichtungen, Geschäftseinheiten und Verwaltungen.

Darüber hinaus sind wir mit weiteren Einschränkungen konfrontiert, beispielsweise begrenzten Investitionsmitteln, insbesondere bei Investitionen in die Infrastruktur für Hochleistungsrechner.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

Wie wichtig ist Ihrer Meinung nach die Rolle der vietnamesischen Datenbeherrschung bei der Entwicklung und Beherrschung von Technologien, die dem Leben der Vietnamesen dienen?

Derzeit gibt es weltweit viele führende Produkte im Bereich der künstlichen Intelligenz, typischerweise generative KI-Anwendungen, die auf großen Sprachmodellen basieren, wie ChatGPT von OpenAI oder Bard von Google. Vietnamesisch ist jedoch nicht die Hauptsprache für die Entwicklung dieser Produkte.

Daher ist die Qualität der an die Benutzer zurückgegebenen vietnamesischspezifischen Inhalte mehr oder weniger beeinträchtigt und es besteht eine hohe Fehlerwahrscheinlichkeit, gefährlicher noch, Fehler in den Grundkenntnissen.

Als Vietnamesen haben wir den Vorteil, auf unsere eigenen Datenquellen zugreifen zu können. Nur wir sind in der Lage, die Besonderheiten vietnamesischer Daten sowie die Bedürfnisse und Besonderheiten der Vietnamesen zu verstehen. Daher ist die Beherrschung vietnamesischer Daten der Schlüssel zur Beherrschung von Kerntechnologien, die den Vietnamesen zugutekommen.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Interne Schulung für VinBigdata-Mitglieder

Wie kann man auf bestimmte Datenquellen zugreifen, insbesondere wenn die meisten Vietnamesen heutzutage soziale Netzwerke aus dem Ausland nutzen?

Tatsächlich sind das Internet und soziale Netzwerke heute die größte Quelle menschlicher Daten (nicht nur vietnamesischer Herkunft). Wir können jedoch weiterhin auf Daten aus verschiedenen Quellen zugreifen und diese sammeln, basierend auf dem Verständnis der Merkmale vietnamesischer Daten, abhängig von den vom jeweiligen Projekt festgelegten Merkmalen.

Beispielsweise verfügen die GPT-Modelle von OpenAI über Hunderte, ja Billionen von Parametern, werden mit riesigen Datenmengen trainiert und kosten Milliarden von Dollar. Im Vergleich dazu haben wir basierend auf unserer Forschung, unseren Fähigkeiten und Ressourcen einen völlig anderen Weg gewählt: Wir haben ein vietnamesisches Sprachmodell mit einer Architektur von nur wenigen Milliarden Parametern entwickelt, das mit einem 600 GB großen vietnamesischen Datensatz trainiert wurde, den wir selbst gesammelt und verfeinert haben, aber über gleichwertige Fähigkeiten in Bezug auf die vietnamesische Verarbeitung verfügt. Die Ergebnisse zeigen, dass sich unsere selbst entwickelte Architektur selbst optimieren, die Trainingszeit des Sprachmodells verkürzen, Kosten senken und dennoch die Modellqualität sicherstellen kann.

Vor welchen Herausforderungen sind Sie und Ihr Team bei der Erforschung und Entwicklung von Produkten im Bereich der künstlichen Intelligenz gestoßen?

Die erste Herausforderung ist sicherlich die Zeit. Die Welle der künstlichen Intelligenz schreitet rasant voran und befindet sich in einer explosionsartigen Entwicklung. Weltweit führende Technologieunternehmen bringen schnell hochentwickelte Produkte auf den Markt, die ständig aktualisiert und verbessert werden. Wenn wir langsam sind und unsere Produkte nicht rechtzeitig auf den Markt bringen, geraten wir mit Sicherheit ins Hintertreffen.

Wenn wir andererseits Produkte schaffen wollen, die anwendbar sind und praktische soziale Probleme lösen, müssen wir auch darüber nachdenken, die herausragenden, besonderen und einzigartigen Eigenschaften des Produkts zu finden und zu entwickeln.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Präsentation beim Vietnam Artificial Intelligence Day (AI4VN 2023)

Tatsächlich haben viele Einzelpersonen und Organisationen in Vietnam und weltweit durch Datenlecks große Verluste erlitten. Wie sehen Sie das Thema Datensicherheit?

Man kann sagen, dass jede Anwendung heute auf Daten basiert. Bei der Arbeit mit Daten müssen wir einerseits das Ziel verfolgen, Daten anzuwenden, um die beste Technologie für das Leben zu schaffen, und andererseits die Datensicherheit für Einzelpersonen und Organisationen gewährleisten.

Der menschliche Faktor ist ein sehr wichtiges Bindeglied im Prozess der Datensicherheitssicherung. Dazu gehören Entwickler, Produktnutzer und Anwender. Entwickler müssen sich von Beginn der Datenerfassung und -verarbeitung an für die Datensicherheit sensibilisiert sein.

Wenn es kein Problem gibt, ist uns die Bedeutung der Datensicherheit oft nicht bewusst. Doch ein Datenleck kann enorme Schäden verursachen. Datenlecks können durch technische Probleme oder gezielte Angriffe zum Datendiebstahl entstehen. Bei Datenlecks können die Informationen von Einzelpersonen oder Organisationen von Kriminellen für illegale Zwecke missbraucht werden. Unternehmen können finanzielle Verluste erleiden, um die damit verbundenen Probleme zu beheben, oder sogar ihrem Ruf schaden.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Dr. Dao Duc Minh und das VinBigdata-Team bei einer Veranstaltung

Wird es nach dem Bestreben, die Technologie zu beherrschen, um dem vietnamesischen Volk zu dienen, Schritte geben, um in die Welt vorzudringen?

Jede Organisation oder jedes Unternehmen, das seine Produkte auf den internationalen Markt bringen möchte, muss internationale Standards einhalten. VinBigdata verfügt über Stärken in den Bereichen Lösungen und Technologie, daher ist es naheliegend, eine Vision zu entwickeln, die Welt zu erobern.

Für den Einsatz in vielen verschiedenen Produkten und Anwendungen ist natürlich die Unterstützung internationaler Einheiten mit langjähriger Erfahrung und Verständnis für die Benutzer auf der ganzen Welt erforderlich.

Danke schön!


[Anzeige_2]
Quelle: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Kommentar (0)

No data
No data

Gleiches Thema

Gleiche Kategorie

Der majestätische Höhlenbogen in Tu Lan
Das 300 km von Hanoi entfernte Plateau bietet ein Meer aus Wolken, Wasserfällen und geschäftigen Besuchern.
Geschmorte Schweinefüße mit falschem Hundefleisch – ein besonderes Gericht der Nordvölker
Ruhige Morgen auf dem S-förmigen Landstreifen

Gleicher Autor

Erbe

Figur

Geschäft

No videos available

Nachricht

Politisches System

Lokal

Produkt