بعد عملك في منظمة ذكاء اصطناعي كبيرة في الولايات المتحدة، لماذا قررت العودة إلى وطنك للانضمام إلى VinBigdata؟
أثناء عملي في الولايات المتحدة، ورغم مشاركتي في العديد من المشاريع الحكومية الكبرى، إلا أن النتائج التي حققتها كانت في كثير من الأحيان مجرد خطوات قليلة في عملية ضخمة. وفي كثير من الأحيان، وبسبب السرية التامة للمشاريع، لم أكن أعرف حتى كيفية استخدام الحلول التي طورتها.
في عام ٢٠١٧، عدتُ إلى فيتنام عندما كانت في مرحلة التطوير، وكانت هناك العديد من المشكلات المتعلقة بالبيانات الضخمة والذكاء الاصطناعي التي تحتاج إلى حل. قبلتُ دعوة البروفيسور فو ها فان للعمل معًا على تحقيق هدف تطوير حلول تكنولوجية فيتنامية تخدم حياة الشعب الفيتنامي. وجدتُ عودتي إلى فيتنام أكثر فائدةً بكثير، إذ سأتمكن من العمل على مشكلات ذات تأثير أكبر.
الدكتور داو دوك مينه في ورشة عمل
في استراتيجية تطوير الذكاء الاصطناعي، ما هو الدور والتأثير الذي تلعبه البيانات الضخمة، سيدي؟
تلعب البيانات دورًا بالغ الأهمية في تدريب الذكاء الاصطناعي. يبدأ تدريب نموذج ذكاء اصطناعي عالي الجودة عادةً بتدريب قاعدة بيانات ضخمة. لذلك، للحصول على ذكاء اصطناعي عالي الجودة، نحتاج أولًا إلى بيانات جيدة.
تتطلب البيانات الجيدة الكم والحجم، والجودة، والتنوع، والشمولية. إن عملية جمع ومعالجة آلاف الساعات من البيانات، بدءًا من مرحلة تنظيف البيانات الخام، وصولًا إلى إنتاج بيانات عالية الجودة تُغذّى بها نماذج الذكاء الاصطناعي، عملية مكلفة ومعقدة للغاية. في المقابل، لتحليل البيانات الضخمة، نحتاج إلى استخدام الذكاء الاصطناعي لضمان القدرة على معالجة البيانات بدقة على نطاق واسع، مما يُؤدي إلى نتائج حاسمة أو تنبؤية أفضل.
على سبيل المثال، في عملية تطوير منتج المساعد الافتراضي للشعب الفيتنامي (ViVi)، كان علينا جمع ومعالجة عشرات الآلاف من الساعات من البيانات الصوتية عالية الجودة، من مئات الآلاف من الأصوات من مناطق مختلفة، وأعمار وجنسين مختلفين، مع محتوى يمتد لمئات المجالات...
أو مؤخرًا، إطلاق ViGPT - "أول نسخة فيتنامية من ChatGPT للمستخدمين النهائيين" - مُطوّرة من نموذج لغوي كبير مملوك بالكامل لشركة VinBigdata. يُدرّب هذا النموذج استنادًا إلى 600 جيجابايت من البيانات الفيتنامية المُحسّنة من مجالات مختلفة. بفضل فهمنا للبيانات واللغة الفيتنامية، وجدنا نهجًا جديدًا لتقصير مدة إطلاق ViGPT في غضون 9 أشهر فقط بعد إطلاق ChatGPT.
هذا هو الصدى بين البيانات الضخمة والذكاء الاصطناعي.
ما هو رأيك في ربط البحث بالقيمة العملية لخدمة المجتمع؟
- أعتقد أن البحث التكنولوجي لا يكون ناجحًا حقًا إلا عندما يدخل الحياة فعليًا، ويحل المشاكل الاجتماعية ويحسن حياة الناس.
لإنشاء منتجات تجارية عملية تحل المشاكل التجارية والاجتماعية، يجب علينا دائمًا الانتباه وطرح السؤال: ما هي القيمة التي ستضيفها البيانات إلى الحياة؟
حتى الآن، قمنا بالبحث والتطوير لمجموعة متنوعة من المنتجات والحلول لمختلف الصناعات والمجالات، عادةً ViGPT، وVinDr - توفير حلول الذكاء الاصطناعي في تشخيص التصوير الطبي ، وVinBase - منصة الذكاء الاصطناعي الحيوي، أو Vizone - مجموعة من حلول تحليل الصور الذكية.
مع الموظفين الرئيسيين في شركة VinBigdata في حدث لشركة Vingroup Corporation
تشهد الثورة الصناعية الرابعة انتشارًا عالميًا قويًا. ما هي المزايا التي تتمتع بها فيتنام برأيك؟
بالمقارنة مع الثورات السابقة، أعتقد أن فيتنام تتمتع حاليًا بالعديد من المزايا التي ستُسهم في إثراء الثورة الصناعية الرابعة، مما يُسهم في تعزيز مكانتها على الخريطة العالمية. ومفتاحا تحقيق هذا الهدف هما البيانات والبشر.
يبلغ عدد سكان فيتنام حاليًا ما يقارب 100 مليون نسمة، منهم نسبة كبيرة من الشباب يستخدمون الهواتف وأجهزة الكمبيوتر الشخصية. إضافةً إلى ذلك، لدينا خبراء مرموقون في مجال الذكاء الاصطناعي، وكوادر شابة مؤهلة في تكنولوجيا المعلومات، ولدينا أساس متين في الرياضيات.
فما هي القيود؟
إن القيود الواضحة الأولى هي أنه على الرغم من وجود عدد كبير من السكان، فإننا لا نزال نواجه صعوبات في إتقان البيانات، وتحديدًا توحيد البيانات ومزامنتها في المرافق ووحدات الأعمال والإدارات.
علاوة على ذلك، فإننا نواجه أيضًا قيودًا أخرى مثل موارد الاستثمار المحدودة، وخاصة الاستثمار في البنية التحتية للحوسبة عالية الأداء.
برأيك، ما مدى أهمية دور إتقان البيانات الفيتنامية في رحلة إنشاء وإتقان التكنولوجيا لخدمة حياة الشعب الفيتنامي؟
يوجد حاليًا العديد من منتجات الذكاء الاصطناعي الرائدة عالميًا، وعادةً ما تكون تطبيقات ذكاء اصطناعي توليدية تعتمد على نماذج لغوية واسعة النطاق، مثل ChatGPT من OpenAI أو Bard من Google. مع ذلك، ليست اللغة الفيتنامية هي اللغة الرئيسية المستخدمة في تطوير هذه المنتجات.
وبالتالي، فإن جودة المحتوى الفيتنامي المحدد الذي يتم إرجاعه إلى المستخدمين تتأثر بدرجة أكبر أو أقل وتكون احتمالية حدوث أخطاء فيه عالية، والأخطر من ذلك، أخطاء في المعرفة الأساسية.
بصفتنا فيتناميين، نتمتع بميزة الوصول إلى مصادر بياناتنا الخاصة. نحن فقط من نملك القدرة على فهم خصائص البيانات الفيتنامية واحتياجات الشعب الفيتنامي وخصائصه. لذا، فإن إتقان البيانات الفيتنامية هو مفتاح إتقان التقنيات الأساسية، وهي التقنيات التي ستخدم الشعب الفيتنامي.
التدريب الداخلي لأعضاء VinBigdata
كيف يمكن الوصول إلى مصادر بيانات محددة، خاصة وأن معظم الفيتناميين اليوم يستخدمون مواقع التواصل الاجتماعي من الخارج؟
الحقيقة هي أن أكبر مصدر للبيانات البشرية اليوم (وليس الفيتنامية فقط) هو الإنترنت وشبكات التواصل الاجتماعي. ومع ذلك، لا يزال بإمكاننا الوصول إلى البيانات وجمعها من مصادر مختلفة، بناءً على فهم خصائص البيانات الفيتنامية، وذلك بناءً على الخصائص التي يحددها كل مشروع.
على سبيل المثال، تحتوي نماذج GPT من OpenAI على مئات، بل تريليونات، من المعلمات، وتُدرّب على كميات هائلة من البيانات، وتُكلّف مليارات الدولارات. مقارنةً بها، اخترنا مسارًا مختلفًا تمامًا بناءً على أبحاثنا وقدراتنا ومواردنا: إنشاء نموذج باللغة الفيتنامية ببنية لا تتجاوز بضعة مليارات من المعلمات، مُدرّب على مجموعة بيانات فيتنامية بحجم 600 جيجابايت جمعناها وحسّنّاها بأنفسنا، ولكن بقدرات مُكافئة من حيث المعالجة الفيتنامية. تُظهر النتائج أن بنيتنا التي طوّرناها ذاتيًا قادرة على التحسين الذاتي، وتقصير وقت تدريب نموذج اللغة، وخفض التكاليف، مع ضمان جودة النموذج في الوقت نفسه.
ما هي التحديات التي واجهتها أنت وفريقك في عملية البحث والتطوير لمنتجات الذكاء الاصطناعي؟
التحدي الأول هو بالتأكيد الوقت. تتسارع موجة تقنيات الذكاء الاصطناعي وتشهد طفرةً هائلة. في العالم، أطلقت شركات التكنولوجيا الرائدة منتجاتٍ عالية الجودة بسرعة، تُحدّث وتُحسّن باستمرار. إذا تباطأنا ولم نُطلق المنتجات في الوقت المناسب، فسنتخلف حتمًا.
ومن ناحية أخرى، إذا أردنا أن نصنع منتجات يمكن تطبيقها وحل المشاكل الاجتماعية العملية، فيجب علينا أيضًا أن نفكر في العثور على الميزات المتميزة والخاصة والفريدة للمنتج وتطويرها.
عرض تقديمي في يوم الذكاء الاصطناعي في فيتنام (AI4VN 2023)
في الواقع، تكبد العديد من الأفراد والمنظمات في فيتنام وحول العالم خسائر فادحة جراء تسريبات البيانات. كيف تنظرون إلى مسألة أمن البيانات؟
يمكن القول إن أي تطبيق اليوم ينبع من البيانات. عند التعامل مع البيانات، يجب علينا من جهة ضمان هدف تطبيقها لخلق أفضل التقنيات للحياة، ومن جهة أخرى، ضمان أمن بيانات الأفراد والمؤسسات.
يُعدّ العامل البشري حلقة وصل بالغة الأهمية في عملية ضمان أمن البيانات، ويشمل ذلك المطورين ومستخدمي المنتجات والمستخدمين. يجب أن يكون لدى المطورين وعيٌ بأمن البيانات منذ بداية جمعها ومعالجتها.
في كثير من الأحيان، حتى في غياب أي مشكلة، لا ندرك أهمية أمن البيانات. ولكن في حال حدوث تسرب للبيانات، قد يكون الضرر هائلاً. قد يحدث تسرب البيانات نتيجةً لمشاكل تقنية أو هجمات متعمدة لسرقة البيانات. عند حدوث تسرب للبيانات، قد يستخدم المجرمون معلومات الأفراد أو المؤسسات لأغراض غير مشروعة، وقد تتكبد الشركات خسائر مالية لإصلاح المشاكل ذات الصلة، بل وقد تتضرر علامتها التجارية.
الدكتور داو دوك مينه وفريق فين بيج داتا في حدث
بعد الطموح لإتقان التكنولوجيا لخدمة الشعب الفيتنامي، هل ستكون هناك خطوات للتقدم نحو العالم؟
يجب على أي منظمة أو شركة ترغب في طرح منتجاتها في السوق العالمية الالتزام بالمعايير الدولية. تتميز شركة VinBigdata بنقاط قوة في الحلول والتكنولوجيا، لذا من الطبيعي أن يكون لديها رؤية لغزو العالم.
وبطبيعة الحال، لنشر العديد من المنتجات والتطبيقات المختلفة، فمن الضروري الحصول على دعم وحدات دولية ذات سنوات عديدة من الخبرة والفهم للمستخدمين في جميع أنحاء العالم.
شكرًا لك!
[إعلان 2]
المصدر: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm
تعليق (0)