Vietnam.vn - Nền tảng quảng bá Việt Nam

الدكتور داو دوك مينه: "إتقان البيانات الفيتنامية هو الخطوة الأولى في تطوير وإتقان التكنولوجيا الفيتنامية"

Báo Thanh niênBáo Thanh niên27/05/2024

صورة بعد أن عملت في منظمة ذكاء اصطناعي كبيرة في الولايات المتحدة، لماذا قررت العودة إلى فيتنام للانضمام إلى VinBigdata؟ أثناء عملي في الولايات المتحدة، وعلى الرغم من مشاركتي في العديد من المشاريع الحكومية الكبيرة، إلا أن النتائج التي حققتها كانت في كثير من الأحيان مجرد خطوات قليلة في عملية معالجة واسعة النطاق. في كثير من الأحيان، بسبب إجراءات السرية الصارمة للغاية للمشاريع، لم أكن أعرف حتى كيف تُستخدم الحلول التي طورتها. في عام 2017، عدت إلى فيتنام عندما كانت فيتنام في مرحلة التطوير وكانت هناك العديد من المشكلات المتعلقة بالبيانات الضخمة والذكاء الاصطناعي التي تحتاج إلى حل. قبلت دعوة البروفيسور فو ها فان لتحقيق هدف مشترك يتمثل في تطوير حلول تكنولوجية فيتنامية لخدمة حياة الشعب الفيتنامي. أجد عودتي إلى فيتنام أكثر أهمية بكثير لأنني سأتمكن من العمل على مشاكل ذات تأثير أكبر.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

الدكتور داو دوك مينه في ورشة عمل

مركز نيفادا للمؤتمرات والمعارض

في استراتيجية تطوير الذكاء الاصطناعي، ما هو دور البيانات الضخمة وتأثيرها؟ تلعب البيانات دورًا بالغ الأهمية والقيمة في تدريب الذكاء الاصطناعي. لتدريب نموذج ذكاء اصطناعي عالي الجودة، غالبًا ما نبدأ بتدريب قاعدة بيانات ضخمة. لذلك، للحصول على ذكاء اصطناعي عالي الجودة، نحتاج أولًا إلى بيانات جيدة. يجب أن تلبي البيانات الجيدة المعايير من حيث الكمية والنطاق والجودة والتنوع والعالمية. إن عملية جمع ومعالجة آلاف الساعات من البيانات، بدءًا من مرحلة تنظيف البيانات الخام، لإنشاء بيانات عالية الجودة لتغذية نموذج الذكاء الاصطناعي، عملية مكلفة ومعقدة للغاية. على العكس من ذلك، لتحليل البيانات الضخمة، نحتاج إلى استخدام الذكاء الاصطناعي لضمان القدرة على معالجة البيانات بدقة على نطاق واسع، وبالتالي تحقيق نتائج أكثر حسمًا أو تنبؤًا. على سبيل المثال، أثناء تطوير منتج مساعد افتراضي للفيتناميين (ViVi)، اضطررنا إلى جمع ومعالجة عشرات الآلاف من ساعات البيانات الصوتية عالية الجودة، من مئات الآلاف من الأصوات من مناطق مختلفة، وأعمار وأجناس متنوعة، بمحتوى يغطي مئات المجالات... أو مؤخرًا، إطلاق ViGPT - "أول نسخة فيتنامية من ChatGPT للمستخدمين النهائيين" المُطوّرة من نموذج لغة ضخم مملوك بالكامل لشركة VinBigdata. تم تدريب هذا النموذج بناءً على 600 جيجابايت من البيانات الفيتنامية المُحسّنة من مجالات مختلفة. بفضل فهمنا للبيانات واللغة الفيتنامية، وجدنا نهجًا جديدًا لتقصير مدة إطلاق ViGPT إلى 9 أشهر فقط بعد إطلاق ChatGPT. هذا هو التناغم بين البيانات الضخمة والذكاء الاصطناعي.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
ما رأيك في ربط البحث بالقيمة العملية لخدمة المجتمع؟ - أعتقد أن البحث التكنولوجي لا ينجح حقًا إلا عندما يطبق عمليًا، ويحل المشكلات الاجتماعية، ويحسّن حياة الناس. ولإنتاج منتجات تجارية عملية وحل المشكلات التجارية والاجتماعية، يجب علينا دائمًا الانتباه وطرح السؤال التالي: ما القيمة التي ستُضفيها البيانات على الحياة؟ حتى الآن، بحثنا في مجموعة متنوعة من المنتجات والحلول في مختلف الصناعات والمجالات، أبرزها ViGPT، وVinDr - التي تُقدم حلول الذكاء الاصطناعي في تشخيص التصوير الطبي ، وVinBase - منصة للذكاء الاصطناعي، وVizone - مجموعة من حلول تحليل الصور الذكية.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

مع الموظفين الرئيسيين في شركة VinBigdata في حدث لشركة Vingroup Corporation

مركز نيفادا للمؤتمرات والمعارض

تشهد الثورة الصناعية الرابعة تطورًا عالميًا قويًا. ما هي المزايا التي تعتقد أن فيتنام تتمتع بها؟ بالمقارنة مع الثورات السابقة، أعتقد أن فيتنام تتمتع حاليًا بالعديد من المزايا التي يمكنها تحقيقها في هذه الثورة الصناعية الرابعة، مما يساعد على تحسين مكانة البلاد على خريطة العالم . مفتاحا تحقيق هذا الهدف هما البيانات والأفراد. يبلغ عدد سكان فيتنام حاليًا ما يقرب من 100 مليون نسمة، منهم نسبة كبيرة من الشباب يستخدمون الهواتف وأجهزة الكمبيوتر الشخصية. بالإضافة إلى ذلك، لدينا خبراء مرموقون في مجال الذكاء الاصطناعي وموظفون شباب ذوو كفاءة عالية في تكنولوجيا المعلومات ولديهم أساس متين في الرياضيات. إذن ماذا عن القيود؟ أول هذه القيود هو أنه على الرغم من وجود عدد كبير من السكان، لا نزال نواجه صعوبة في إتقان البيانات، وتحديدًا توحيد البيانات ومزامنتها في المرافق ووحدات الأعمال والإدارات. بالإضافة إلى ذلك، نواجه أيضًا قيودًا أخرى مثل موارد الاستثمار المحدودة، وخاصة الاستثمار في البنية التحتية للحوسبة عالية الأداء.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
برأيك، ما مدى أهمية إتقان البيانات الفيتنامية في رحلة إنشاء وإتقان التكنولوجيا لخدمة حياة الشعب الفيتنامي؟ يوجد حاليًا العديد من منتجات الذكاء الاصطناعي الرائدة في العالم، وعادةً ما تكون منتجات تطبيقات الذكاء الاصطناعي التي تم إنشاؤها بناءً على نماذج لغوية كبيرة مثل ChatGPT من OpenAI أو Bard من Google. ومع ذلك، فإن اللغة الفيتنامية ليست المجموعة اللغوية الأساسية لتطوير هذه المنتجات. لذلك، تتأثر جودة المحتوى الفيتنامي المحدد الذي يتم إرجاعه للمستخدمين بشكل أو بآخر ولديه احتمال كبير للأخطاء، والأخطر من ذلك، أخطاء في المعرفة الأساسية. بصفتنا شعبًا فيتناميًا، لدينا ميزة الوصول إلى مصادر بياناتنا الخاصة. نحن فقط لدينا القدرة على فهم خصائص البيانات الفيتنامية واحتياجات وخصائص الشعب الفيتنامي. لذلك، فإن إتقان البيانات الفيتنامية هو حقًا مفتاح إتقان التقنيات الأساسية، وهي أيضًا التقنيات التي ستخدم الشعب الفيتنامي.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

التدريب الداخلي لأعضاء VinBigdata

مركز نيفادا للمؤتمرات والمعارض

كيف يمكن الوصول إلى مصادر بيانات محددة، خاصةً وأن معظم الفيتناميين اليوم يستخدمون مواقع التواصل الاجتماعي من الخارج؟ في الواقع، يُعد الإنترنت وشبكات التواصل الاجتماعي المصدر الأكبر للبيانات البشرية اليوم (وليس الفيتناميين فقط). ومع ذلك، لا يزال بإمكاننا الوصول إلى البيانات وجمعها من مصادر مختلفة، بناءً على فهمنا لخصائص البيانات الفيتنامية، وذلك بناءً على الخصائص التي يحددها كل مشروع. على سبيل المثال، تحتوي نماذج GPT من OpenAI على مئات، بل تريليونات، من المعلمات، ويتم تدريبها على كميات هائلة من البيانات وتكلف مليارات الدولارات. مقارنةً بها، اخترنا مسارًا مختلفًا تمامًا بناءً على أبحاثنا وقدراتنا ومواردنا: أي إنشاء نموذج للغة الفيتنامية ببنية لا تتجاوز مليارات المعلمات، ويتم تدريبه على مجموعة بيانات فيتنامية بحجم 600 جيجابايت جمعناها وحسّناها بأنفسنا، ولكنه يتمتع بنفس القدرة على معالجة اللغة الفيتنامية. تُظهر النتائج أن بنيتنا التي طورناها ذاتيًا قادرة على التحسين الذاتي، وتقصير وقت تدريب نموذج اللغة، وخفض التكاليف مع ضمان جودته في الوقت نفسه. ما هي التحديات التي واجهتها أنت وفريقك في عملية البحث والتطوير لمنتجات الذكاء الاصطناعي؟ التحدي الأول هو بالتأكيد الوقت. تتسارع وتيرة تكنولوجيا الذكاء الاصطناعي، وهي تشهد طفرةً هائلة. ففي العالم، تُطلق شركات التكنولوجيا الرائدة منتجاتٍ عالية الجودة، تُحدَّث وتُحسَّن باستمرار. إذا تباطأنا ولم نُطلق المنتجات في الوقت المناسب، فسنتخلف حتمًا. من ناحية أخرى، إذا أردنا ابتكار منتجات قابلة للتطبيق وحل المشكلات الاجتماعية العملية، فعلينا أيضًا مراعاة تطوير الميزات المتميزة والخاصة والفريدة للمنتج.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

عرض تقديمي في يوم الذكاء الاصطناعي في فيتنام (AI4VN 2023)

مركز نيفادا للمؤتمرات والمعارض

في الواقع، تكبد العديد من الأفراد والمؤسسات في فيتنام وحول العالم خسائر فادحة جراء تسرب البيانات. كيف تنظرون إلى مسألة أمن البيانات؟ يُمكن القول إن أي تطبيق اليوم ينبع من البيانات. عند التعامل مع البيانات، يجب علينا من جهة ضمان تطبيقها لخلق أفضل تقنية للحياة، ومن جهة أخرى، يجب علينا ضمان أمن بيانات الأفراد والمؤسسات. يُعد العامل البشري حلقة وصل بالغة الأهمية في عملية ضمان أمن البيانات، ويشمل ذلك المطورين ومستخدمي المنتجات والمستخدمين. بالنسبة للمطورين، يجب أن يكون الوعي بأمن البيانات حاضرًا منذ بداية جمع البيانات ومعالجتها. في كثير من الأحيان، حتى عندما لا تحدث مشكلة، لا ندرك أهمية أمن البيانات. ولكن في حالة حدوث تسرب للبيانات، يمكن أن يكون الضرر هائلاً. يمكن أن تحدث خروقات البيانات بسبب مشاكل فنية أو هجمات سرقة بيانات متعمدة. عند اختراق البيانات، يمكن أن يستخدم المجرمون معلومات الأفراد أو المؤسسات لأغراض غير قانونية، بينما قد تتكبد الشركات خسائر مالية لإصلاح المشاكل ذات الصلة، وحتى الإضرار بعلامتها التجارية.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

الدكتور داو دوك مينه وفريق فين بيج داتا في حدث

مركز نيفادا للمؤتمرات والمعارض

بعد التطلع إلى إتقان التكنولوجيا لخدمة الشعب الفيتنامي، لا بد من اتخاذ خطوات نحو العالمية. يجب على أي منظمة أو مؤسسة ترغب في طرح منتجاتها في السوق العالمية الالتزام بالمعايير الدولية. تتميز VinBigdata بنقاط قوة في الحلول والتكنولوجيا، لذا فإن وضع رؤية لغزو العالم أمر طبيعي. وبالطبع، لنشر منتجات وتطبيقات متنوعة، من الضروري التعاون مع وحدات دولية تتمتع بسنوات طويلة من الخبرة والفهم للمستخدمين حول العالم. شكرًا لكم!

ثانهين.فن

المصدر: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

تعليق (0)

No data
No data

نفس الموضوع

نفس الفئة

الألعاب النارية تنفجر، والسياحة تتسارع، ودا نانغ تسجل نجاحًا في صيف 2025
استمتع بصيد الحبار الليلي ومشاهدة نجم البحر في جزيرة اللؤلؤ فو كوك
اكتشف عملية صنع أغلى أنواع شاي اللوتس في هانوي
استمتع بمشاهدة الباغودا الفريدة المصنوعة من أكثر من 30 طنًا من القطع الخزفية في مدينة هوشي منه

نفس المؤلف

إرث

شكل

عمل

No videos available

أخبار

النظام السياسي

محلي

منتج