في التعلم الآلي، يحدث الإفراط في التخصيص عندما تتخصص الخوارزمية بشكل وثيق جدًا أو حتى بشكل كامل مع بيانات التدريب الخاصة بها، ما يؤدي إلى نموذج لا يمكنه وضع تنبؤات أو استنتاجات دقيقة من أي بيانات أخرى غير بيانات التدريب.
يتعارض الإفراط في التخصيص مع الغرض من نموذج التعلم الآلي. فتعميم النموذج على البيانات الجديدة هو ما يسمح لنا في نهاية المطاف باستخدام خوارزميات التعلم الآلي كل يوم لوضع تنبؤات وتصنيف البيانات.
عند إنشاء خوارزميات التعلم الآلي، فإنها تستفيد من مجموعة بيانات عينة لتدريب النموذج. ومع ذلك، عندما يتدرب النموذج لفترة طويلة جدًا على بيانات العينة أو عندما يكون النموذج معقدًا جدًا، يمكن أن يبدأ في تعلم "الضوضاء" أو المعلومات غير ذات الصلة ضمن مجموعة البيانات. عندما يحفظ النموذج الضوضاء ويتخصص بشكل كبير مع مجموعة التدريب، يصبح النموذج "مفرط التخصيص"، ولا يمكنه التعميم بشكل جيد على البيانات الجديدة. وإذا لم يتمكن النموذج من التعميم بشكل جيد على البيانات الجديدة، فلن يكون قادرًا على أداء مهام التصنيف أو التنبؤ التي صُمم من أجلها.
تُعد معدلات الخطأ المنخفضة والتباين العالي مؤشرات واضحة على الإفراط في التخصيص. ومن أجل منع هذا النوع من السلوك، عادةً ما يُنحّى جزء من مجموعة بيانات التدريب جانبًا باعتباره "مجموعة اختبار" للتحقق من عدم وجود إفراط في التخصيص. إذا كانت بيانات التدريب ذات معدل خطأ منخفض وبيانات الاختبار ذات معدل خطأ مرتفع، فهذا يشير إلى الإفراط في التخصيص.
إذا أدى الإفراط في التدريب أو تعقيد النموذج إلى الإفراط في التخصيص، فإن الاستجابة الوقائية المنطقية ستكون إما إيقاف عملية التدريب مؤقتًا في وقت مبكر، والمعروف أيضًا باسم "التوقف المبكر"، أو تقليل التعقيد في النموذج عن طريق استبعاد المدخلات الأقل أهمية. ومع ذلك، إذا توقفت مؤقتًا في وقت مبكر جدًا أو استبعدت الكثير من الميزات المهمة، فقد تواجه المشكلة المعاكسة، وبدلاً من ذلك، قد تواجه مشكلة قصور تخصيص النموذج الخاص بك. يحدث القصور في التخصيص عندما لا يكون النموذج قد تدرب لفترة كافية أو عندما لا تكون متغيرات المدخلات مهمة بما يكفي لتحديد علاقة ذات مغزى بين متغيرات المدخلات والمخرجات.
في كلتا الحالتين، لا يستطيع النموذج تحديد الاتجاه السائد في مجموعة بيانات التدريب. ونتيجة لذلك، فإن القصور في التخصيص يعمم أيضًا بشكل سيء على البيانات غير المرئية. ولكن على عكس الإفراط في التخصيص، تشهد النماذج قاصرة التخصيص من تحيز مرتفع وتباين أقل في تنبؤاتها. يوضح هذا المفاضلة بين التحيز والتباين التي تحدث عندما يتحول النموذج قاصر التخصيص إلى حالة فرط التخصيص. كلما تعلم النموذج، قلت تحيزاته، لكن يمكن أن يزداد التباين عندما يصبح النموذج مفرط التخصيص. عند تخصيص النموذج، يكون الهدف هو العثور على "التوازن المثالي" بين القصور في التخصيص والإفراط في التخصيص، بحيث يمكن أن يضع النموذج اتجاهًا سائدًا ويطبقه على نطاق واسع على مجموعات البيانات الجديدة.
لفهم دقة نماذج التعلم الآلي، من المهم اختبار مدى تخصيص النموذج. يُعد التحقق التبادلي K-fold أحد أكثر الأساليب شيوعًا لتقييم دقة النموذج.
في التحقق التبادلي K-fold، تُقسم البيانات إلى مجموعات فرعية k متساوية الحجم تسمى أيضًا "الطيات". ستكون إحدى الطيات k بمثابة مجموعة اختبار، والمعروفة أيضًا باسم مجموعة الاحتفاظ أو مجموعة التحقق من الصحة، وستدرب الطيات المتبقية النموذج. تتكرر هذه العملية حتى تُستخدم كل طية من الطيات كطية احتفاظ. وبعد كل تقييم، يُحتفظ بالدرجات، وعندما تكتمل كل التكرارات، يُحسب متوسط الدرجات لتقييم أداء النموذج الكلي.
بينما يساعدنا استخدام نموذج خطي على تجنب الإفراط في التخصيص، فإن العديد من المشكلات الواقعية هي مشكلات غير خطية. وبالإضافة إلى فهم كيفية اكتشاف الإفراط في التخصيص، من المهم فهم كيفية تجنب الإفراط في التخصيص من الأساس. فيما يلي عدد من الأساليب التي يمكنك استخدامها لمنع الإفراط في التخصيص:
في حين أن ما ورد أعلاه هو التعريف المتعارف عليه للإفراط في التخصيص، فإن الأبحاث الحديثة (يؤدي الرابط إلى موقع خارج IBM) تشير إلى أن النماذج المعقدة، مثل نماذج التعلم العميق والشبكات العصبية، تحقق دقة عالية على الرغم من تدريبها على "التخصيص أو الاستيفاء التام". تتعارض هذه النتيجة بشكل مباشر مع المؤلفات التاريخية حول هذا الموضوع، وهي تتضح من خلال منحنى مخاطر "الانحدار المزدوج" أدناه. يمكنك ملاحظة أنه عندما يتعلم النموذج ما بعد حد الاستيفاء، يتحسن أداء النموذج. ويمكن للطرق التي ذكرناها سابقًا لتجنب الإفراط في التخصيص، مثل التوقف المبكر والتنظيم، أن تمنع الاستيفاء.
لقد استطلعنا آراء 2000 مجموعة حول مبادرات الذكاء الاصطناعي لديها لمعرفة ما ينجح وما لا ينجح وكيف يمكنك المضي قدمًا.
IBM Granite هي مجموعة من نماذج الذكاء الاصطناعي المفتوحة والموثوق بها وذات الأداء العالي والتي صُمِمَت خصيصًا للأعمال وجرى الارتقاء بها على النحو الأمثل لتوسيع نطاق تطبيقات الذكاء الاصطناعي لديك. استكشف خيارات اللغة والتعليمات البرمجية والسلاسل الزمنية والدرابزين.
اطّلع على كتالوجنا الشامل الذي يضم أكثر من 100 دورة تدريبية عبر الإنترنت من خلال شراء اشتراك فردي أو متعدد المستخدمين اليوم، سيتيح لك هذا توسيع نطاق مهاراتك عبر مجموعة من منتجاتنا، وكل ذلك بسعر واحد مُغرٍ.
وقد صُمم المنهج، الذي يقوده كبار قادة الفكر لدى IBM، لمساعدة قادة الأعمال على اكتساب المعرفة اللازمة لتحديد أولويات استثمارات الذكاء الاصطناعي التي يمكن أن تدفع عجلة النمو.
IBM web domains
ibm.com, ibm.org, ibm-zcouncil.com, insights-on-business.com, jazz.net, mobilebusinessinsights.com, promontory.com, proveit.com, ptech.org, s81c.com, securityintelligence.com, skillsbuild.org, softlayer.com, storagecommunity.org, think-exchange.com, thoughtsoncloud.com, alphaevents.webcasts.com, ibm-cloud.github.io, ibmbigdatahub.com, bluemix.net, mybluemix.net, ibm.net, ibmcloud.com, galasa.dev, blueworkslive.com, swiss-quantum.ch, blueworkslive.com, cloudant.com, ibm.ie, ibm.fr, ibm.com.br, ibm.co, ibm.ca, community.watsonanalytics.com, datapower.com, skills.yourlearning.ibm.com, bluewolf.com, carbondesignsystem.com