الصورة001.jpg

وحدة معالجة الرسومات (GPU) هي عقل الكمبيوتر الذي يعمل بالذكاء الاصطناعي

ببساطة، تعمل وحدة معالجة الرسوميات (GPU) بمثابة عقل الكمبيوتر الذكاء الاصطناعي.

كما تعلمون، تُعدّ وحدة المعالجة المركزية (CPU) بمثابة عقل الحاسوب. وتكمن ميزة وحدة معالجة الرسومات (GPU) في أنها وحدة معالجة مركزية متخصصة قادرة على إجراء عمليات حسابية معقدة. وأسرع طريقة لتحقيق ذلك هي استخدام مجموعات من وحدات معالجة الرسومات لحل مشكلة ما. ومع ذلك، قد يستغرق تدريب نموذج الذكاء الاصطناعي أسابيع أو حتى أشهرًا. بمجرد بناء النموذج، يُوضع في نظام حوسبة أمامي، ويمكن للمستخدمين طرح أسئلة على نموذج الذكاء الاصطناعي، وهي عملية تُسمى الاستدلال.

كمبيوتر الذكاء الاصطناعي يحتوي على وحدات معالجة رسومية متعددة

أفضل بنية لحل مشكلات الذكاء الاصطناعي هي استخدام مجموعة من وحدات معالجة الرسومات (GPU) في رف، متصلة بمفتاح أعلى الرف. يمكن توصيل عدة رفوف لوحدات معالجة الرسومات (GPU) ضمن تسلسل هرمي للشبكات. مع ازدياد تعقيد المشكلة، تزداد متطلبات وحدات معالجة الرسومات، وقد تحتاج بعض المشاريع إلى نشر مجموعات من آلاف وحدات معالجة الرسومات.

كل مجموعة الذكاء الاصطناعي عبارة عن شبكة صغيرة

عند بناء مجموعة الذكاء الاصطناعي، من الضروري إنشاء شبكة كمبيوتر صغيرة للاتصال والسماح لوحدات معالجة الرسومات بالعمل معًا ومشاركة البيانات بكفاءة.

الصورة002.jpg
مجموعة الذكاء الاصطناعي

يوضح الشكل أعلاه مجموعة ذكاء اصطناعي، حيث تمثل الدوائر في الأسفل سير العمل الجاري على وحدات معالجة الرسومات. تتصل وحدات معالجة الرسومات بمفاتيح أعلى الرف (ToR). كما تتصل مفاتيح ToR بمفاتيح الشبكة الأساسية الموضحة أعلى الرسم التخطيطي، مما يوضح التسلسل الهرمي الواضح للشبكة المطلوب عند استخدام وحدات معالجة رسومات متعددة.

الشبكات تشكل عنق زجاجة في نشر الذكاء الاصطناعي
في الخريف الماضي، خلال القمة العالمية لمشروع الحاسوب المفتوح (OCP)، حيث عمل المندوبون معًا لبناء الجيل القادم من البنية التحتية للذكاء الاصطناعي، أثار المندوب لوي نجوين من شركة مارفيل تكنولوجي نقطة رئيسية: "الشبكات هي عنق الزجاجة الجديد".

من الناحية الفنية، قد يؤدي ارتفاع زمن وصول الحزم أو فقدانها بسبب ازدحام الشبكة إلى إعادة إرسالها، مما يزيد بشكل كبير من وقت إكمال المهمة (JCT). ونتيجةً لذلك، تُهدر وحدات معالجة رسومية (GPU) بقيمة ملايين أو عشرات الملايين من الدولارات من الشركات بسبب أنظمة الذكاء الاصطناعي غير الفعّالة، مما يُكلفها إيراداتٍ ووقتًا للوصول إلى السوق.

القياس هو شرط أساسي للتشغيل الناجح لشبكات الذكاء الاصطناعي

لتشغيل مجموعة الذكاء الاصطناعي بفعالية، يجب أن تكون وحدات معالجة الرسومات قادرة على استغلال كامل طاقتها لتقصير وقت التدريب وتطبيق نموذج التعلم لتحقيق أقصى عائد على الاستثمار. لذلك، من الضروري اختبار أداء مجموعة الذكاء الاصطناعي وتقييمه (الشكل 2). مع ذلك، هذه المهمة ليست سهلة، فمن حيث بنية النظام، هناك العديد من الإعدادات والعلاقات بين وحدات معالجة الرسومات وهياكل الشبكة التي يجب أن تتكامل لحل المشكلة.

الصورة005.jpg
منصة اختبار مركز بيانات الذكاء الاصطناعي وكيفية اختبار مجموعات مراكز بيانات الذكاء الاصطناعي

وهذا يخلق العديد من التحديات في قياس شبكات الذكاء الاصطناعي:

- صعوبة إعادة إنتاج شبكات الإنتاج بأكملها في المختبر بسبب القيود في التكلفة والمعدات ونقص مهندسي الذكاء الاصطناعي المتخصصين في الشبكات والمساحة والطاقة ودرجة الحرارة.

- يؤدي القياس على نظام الإنتاج إلى تقليل القدرة المعالجة المتاحة لنظام الإنتاج نفسه.

- صعوبة إعادة إنتاج المشاكل بدقة بسبب الاختلافات في حجم ونطاق المشاكل.

- تعقيد كيفية ربط وحدات معالجة الرسوميات معًا.

لمواجهة هذه التحديات، يمكن للمؤسسات اختبار مجموعة فرعية من الإعدادات الموصى بها في بيئة معملية لقياس أداء مقاييس رئيسية، مثل وقت إنجاز المهمة (JCT)، وعرض النطاق الترددي الذي يمكن لفريق الذكاء الاصطناعي تحقيقه، ومقارنته باستخدام منصة التبديل واستخدام ذاكرة التخزين المؤقت. يساعد هذا القياس على إيجاد التوازن الأمثل بين عبء عمل وحدة معالجة الرسومات/المعالجة وتصميم/إعداد الشبكة. بمجرد الرضا عن النتائج، يمكن لمهندسي الحاسوب ومهندسي الشبكات تطبيق هذه الإعدادات في الإنتاج وقياس النتائج الجديدة.

تعمل مختبرات الأبحاث المؤسسية والمؤسسات الأكاديمية والجامعات على تحليل جميع جوانب بناء وتشغيل شبكات الذكاء الاصطناعي الفعّالة لمواجهة تحديات العمل على الشبكات الكبيرة، لا سيما مع استمرار تطور أفضل الممارسات. هذا النهج التعاوني القابل للتكرار هو السبيل الوحيد للشركات لإجراء قياسات قابلة للتكرار واختبار سيناريوهات "ماذا لو" بسرعة، والتي تُشكّل أساسًا لتحسين الشبكات للذكاء الاصطناعي.

(المصدر: Keysight Technologies)