حساب IBM الخاص بي تسجيل الدخول

الصفحة الرئيسية

Case Studies

نماذج الذكاء الاصطناعي الضخمة من IBM - Turbonomic

تحسين وحدات معالجة الرسوميات للذكاء الاصطناعي التوليدي

تحسين وحدات معالجة الرسوميات للذكاء الاصطناعي التوليدي

توفير الموارد المهمة باستخدام IBM Turbonomic
شخصان يجلسان على مقعد أمام لافتة مكتوب عليها "I love AI"
زيادة كفاءة وحدات معالجة الرسوميات عالية الطلب وتحسين أداءها

زيادة كفاءة وحدات معالجة الرسوميات عالية الطلب وتحسين أداءها

لقد وصل الذكاء الاصطناعي إلى مرحلة مفصلية، حيث يعد تدريب النماذج اللغوية الكبيرة (LLMs) من بين أكثر المهام تطلبًا لقوة الحوسبة. تُعد الحوسبة عالية الأداء ضرورية لتحسين أحمال تشغيل الذكاء الاصطناعي التوليدي والنماذج اللغوية الكبيرة (LLM)، في حين قد تكون وحدات معالجة الرسوميات (GPUs) باهظة الثمن وشحيحة. وحدات معالجة الرسوميات هي رقائق حاسوبية متخصصة مصممة للتعامل مع العمليات الحسابية المعقدة والمعالجة المتوازية، مما يجعلها مثالية للعمليات الحسابية المعقدة المطلوبة في التدريب والاستدلال لنماذج التعلم العميق. ونتيجةً لذلك، يزداد الطلب على وحدات معالجة الرسوميات (GPUs)، ويُعد تحسين استخدامها أمراً بالغ الأهمية لنجاح تطبيقات الذكاء الاصطناعي.

رصَدَ فريق نماذج الذكاء الاصطناعي الكبيرة (BAM) من IBM، الذي يدعم بيئة البحث والتطوير الأساسية للفرق الهندسية لاختبار مشاريع الذكاء الاصطناعي الوليدي وتحسينها، فرصة للتحسين. ومع ازدياد عدد المشاريع التي تمر بمرحلة الاختبار، أدرك الفريق أهمية الاستخدام الأمثل لكل مثيل لتجنب إهدار الموارد.

5.3 أضعاف زيادة في الموارد غي المستغلة لوحدة معالجة الرسوميات ضِعف تحقيق معدل إنتاجية أعلى دون التأثير على أداء وقت الاستجابة
تمكين Turbonomic من زيادة أو تقليل خوادم استدلال النماذج اللغوية الكبيرة (LLM) ساعدني على تقليل الوقت الذي أقضيه في مراقبة الأداء. Tom Morris قائد البنية التحتية والعمليات لأبحاث تمكين منصة IBM للذكاء الاصطناعي IBM
تحويل إدارة وحدة معالجة الرسوميات: من الفوضى إلى التحكم

تحويل إدارة وحدة معالجة الرسوميات: من الفوضى إلى التحكم

لتحقيق أقصى استفادة من موارد وحدة معالجة الرسوميات وإدارة مثيلات Kubernetes الخاصة بالنماذج اللغوية الكبيرة، نشر فريق IBM BAM أداة ®IBM Turbonomic، وهي أداة برمجية متقدمة لإدارة موارد التطبيقات. باستخدام البيانات في الوقت الحقيقي، قدمت Turbonomic توصيات ذكية مستندة إلى الذكاء الاصطناعي لاتخاذ إجراءات آلية تهدف إلى تحسين استغلال الموارد وزيادة كفاءتها. من خلال تحديد استراتيجيات مثلى لتخصيص الموارد، قدم الحل توصيات مخصصة يمكن للفريق إعدادها للتنفيذ تلقائيًا، مما يتيح تحسين الموارد باستخدام الذكاء الاصطناعي.

كأداة برمجية داخلية من IBM صُممت خصيصًا لتحسين إدارة السحابة الهجينة، التي تشمل التطبيقات المدمجة في حاويات، والأجهزة الافتراضية والسُّحب العامة، وفرت IBM Turbonomic تكاملًا سلسًا مع البنية التحتية الحالية.

يلخص توم موريس، الباحث في منصة الذكاء الاصطناعي: "تمكين Turbonomic من زيادة أو تقليل خوادم استدلال النماذج اللغوية الكبيرة (LLM) ساعدني على تقليل الوقت الذي أقضيه في مراقبة الأداء."

قبل

بعد

تحسين الأداء وخفض التكاليف: نتائج تخصيص موارد وحدة معالجة الرسوميات (GPU) بكفاءة

تحسين الأداء وخفض التكاليف: نتائج تخصيص موارد وحدة معالجة الرسوميات (GPU) بكفاءة

بفضل Turbonomic، تمكن فريق IBM BAM من بناء بنية تحتية مرنة وقابلة للتوسع لتلبية المتطلبات المتزايدة لأعمالهم، مما دعم خدمات LLM وشغل أكثر من 100 وحدة معالجة رسومات من نوع NVIDIA A100. A100.

من خلال تقليص المثيلات المبالغ في تخصيصها، تمكن الفريق من زيادة الموارد غير المستغلة لوحدات معالجة الرسوميات من 3 إلى 16 وحدة (5.3 أضعاف)، مما أتاح استخدام هذه الموارد لأحمال تشغيل إضافية.

تضمنت النتائج ما يلي:

  1. تخصيص الموارد أصبح التوسع الديناميكي باستخدام الحل التلقائي أمرًا بديهيًا، مما أدى إلى تحسين استغلال وحدات معالجة الرسوميات وفقًا للاحتياجات المتغيرة.

  2. فعالية من حيث التكلفة أتاح توسيع نطاق خدمات النماذج اللغوية الكبيرة عند الطلب مشاركة الوقت لوحدات معالجة الرسوميات، مما قلل العدد الإجمالي المطلوب من وحدات معالجة الرسومات. والآن، مع التوسع والمشاركة، أظهر فريق IBM أنه في بيئة أتمتة كاملة، يمكن تقليل الحاجة إلى 13 وحدة معالجة رسومات.

  3. كفاءة العمال أتاح التوسع التلقائي لخوادم الاستدلال LLM لفريق IBM BAM قضاء وقت أقل في مراقبة الأداء.

  4. قابلية التوسع والأداء
    بعد أتمتة التوسع بالكامل لخدمات النماذج اللغوية الكبيرة، تم تحرير موارد وحدة معالجة الرسوميات التي كانت مبالغ في تخصيصها لتتم مشاركتها مع أحمال التشغيل الأخرى حسب الطلب. تحسين معدل الإنتاجية أتاح فرصًا لتعزيز الأداء من خلال معالجة مشكلات وقت الاستجابة.

باستخدام إمكانيات الأتمتة التي توفرها Turbonomic، نجح فريق IBM BAM في تحسين وتوسيع خدمات النماذج اللغوية الكبيرة، مما أتاح لهم إعادة تخصيص وقتهم للعمل على مشاريع استراتيجية.

شعار IBM
عن فريق IBM Big AI Models

عن فريق IBM Big AI Models

فريق IBM Big AI Models (BAM) هو مجموعة من الباحثين والمهندسين في ®IBM Research متخصصون في تطوير وتطبيق نماذج الذكاء الاصطناعي واسعة النطاق. تم تصميم هذه النماذج لمعالجة وتحليل كميات ضخمة من البيانات، مما يدعم تطبيقات مثل معالجة اللغة الطبيعية، ورؤية الحاسوب، والتحليلات التنبؤية.

مكونات الحل IBM Turbonomic
قم بتحويل عملك من خلال القرارات قائم على البيانات

تحسين الأداء والكفاءة باستخدام إدارة الموارد المؤتمتة المستندة إلى الذكاء الاصطناعي من IBM Turbonomic

ابدأ الآن بالأتمتة مع Turbonomic عرض المزيد من دراسات الحالة
قانوني

حقوق النشر © محفوظة لصالح شركة IBM Corporation لعام 2024. IBM وشعار IBM وTurbonomic وIBM Research هي علامات تجارية أو علامات تجارية مسجلة لشركة IBM Corp.، في الولايات المتحدة و/أو دول أخرى. يصبح هذا المستند ساريًا بدءًا من تاريخ النشر الأول، ويجوز لشركة IBM تغييره في أي وقت. لا تتوفر بعض العروض في بعض الدول التي تعمل فيها IBM.

الأمثلة المقدمة عن العملاء تهدف إلى توضيح كيفية استخدامهم لمنتجات IBM والنتائج التي قد حققوها. قد تختلف النتائج الفعلية من حيث الأداء أو التكلفة أو التوفير أو غيرها في بيئات تشغيل مختلفة.