أعلنت شركة VinBigdata عن نجاحها في بناء نموذج كبير للغة الفيتنامية في 21 أغسطس، مما أدى إلى إنشاء الأساس لإتقان تقنية الذكاء الاصطناعي التوليدي.
نماذج اللغات الكبيرة (LLMs) هي نماذج مُدرَّبة باستخدام تقنيات التعلم العميق على مجموعات بيانات ضخمة من النصوص والصور. هذه النماذج قادرة على فهم المعرفة، وتوليد النصوص، وتنفيذ مهام معالجة اللغة الطبيعية المختلفة. تُعتبر هذه النماذج أساس تطوير تقنية الذكاء الاصطناعي التوليدي، فهي قادرة على توليد محتوى وأفكار جديدة بأشكال متنوعة (نصوص، صور، ملفات صوتية، إلخ).
مع البناء الناجح لنموذج اللغة الفيتنامية الكبير، ستقوم VinBigdata بدمج التكنولوجيا لجعل VinBase (منصة الذكاء الاصطناعي المعرفية المتعددة الشاملة) منصة ذكاء اصطناعي توليدية في فيتنام، مع توفير حلول تطوير تعتمد على هذه التكنولوجيا مثل روبوت الدردشة بالذكاء الاصطناعي التوليدي أو روبوت الاتصال أو الجيل الجديد من المساعد الافتراضي ViVi... تساعد هذه التكنولوجيا على زيادة طبيعية الاتصال الآلي، مع دعم المستخدمين للبحث عن المعلومات وتوليفها بشكل أسرع وأبسط من ذي قبل.
البروفيسور فو ها فان - المدير العلمي لشركة فين بيج داتا. الصورة: فين بيج داتا
قال البروفيسور فو ها فان، مدير العلوم في شركة فين بيغ داتا، إن العديد من الشركات الكبرى حول العالم نجحت في إجراء أبحاث وإطلاق منتجات تعتمد على نماذج لغوية واسعة النطاق، مثل OpenAI مع ChatGPT، أو جوجل مع Bard. في فيتنام، استثمرت Vingroup في فين بيغ داتا لبناء نموذج لغوي فيتنامي واسع النطاق. ووفقًا للسيد فان، يركز هذا النموذج على حل ثلاث مشكلات أساسية، وهي تحسين الدقة، وخفض تكاليف البنية التحتية، وضمان الأمن.
"بدلاً من الحاجة إلى حوالي 175 مليار معلمة مثل ChatGPT، يمكن لـ VinBigdata إنشاء نموذج لغوي كبير مع عدة مليارات من المعلمات ولكن لا يزال لديه القدرة على إنشاء مستندات أصلية للغاية، مع التركيز على البيانات والمعرفة الفيتنامية"، كما قال قائد الوحدة.
يُعدّ إتقان التكنولوجيا، والتطوير الذاتي من الخطوات الأولى، وبناء نموذج شامل للغة الفيتنامية، خطوةً متقدمةً لمساعدة VinBigdata على دمج تقنية الذكاء الاصطناعي التوليدي في منظومة المنتجات والخدمات المتاحة في السوق. حاليًا، طبّقت الشركة تقنيةً جديدةً في البداية على خط إنتاج VinBase KB (بوابة قاعدة معارف VinBase). يتميز هذا المنتج بالقدرة على استرجاع المعلومات وتوليد إجابات تلقائيًا بناءً على المعلومات المُجمّعة من مجموعات بيانات ضخمة للغاية في نظام المعرفة.
شارك ممثل شركة VinBigdata في فعالية الإعلان عن الذكاء الاصطناعي التوليدي. الصورة: VinBigdata
من المتوقع أن يُطلق أعضاء Vingroup في ديسمبر من هذا العام خطي إنتاج رئيسيين: VinBase2.0 وتطبيق ViGPT. VinBase 2.0 عبارة عن منصة ذكاء اصطناعي تُنشئ تصورات متعددة من خلال حلول تُفيد الشركات والهيئات الحكومية . في الوقت نفسه، تُقدم الشركة تطبيق ViGPT كـ"نسخة فيتنامية من ChatGPT"، وهو متاح للجميع للوصول إليه وتجربته. مع ViGPT، يُمكن للمستخدمين طرح أسئلة والإجابة عليها حول معلومات مُحددة عن فيتنام (مثل اللوائح والوثائق القانونية) أو معلومات محلية (مثل التاريخ والأدب والمعالم السياحية والتخصصات المحلية).
تمتلك شركة فينبيغداتا المساهمة نظام قاعدة بيانات يصل حجمه إلى 3500 تيرابايت. يحتوي النظام على مئات الآلاف من ساعات البيانات الصوتية والصور والمعلومات التي تُنظّف وتُعالج وتُصنّف وتُستخدم في تدريب الذكاء الاصطناعي، بالإضافة إلى بنيتها التحتية للبحث والتطوير. تشمل هذه البنية التحتية العشرات من مجموعات خوادم NvidiaDGX A100. كما تمتلك الشركة فريقًا من الأساتذة والعلماء وخبراء التكنولوجيا الفيتناميين من جميع أنحاء العالم.
هوآي فونغ
[إعلان 2]
رابط المصدر
تعليق (0)