تستخدم برامج التشفير التلقائي المتغيرة (VAEs) بنية التشفير التلقائي لتشفير الفضاء الكامن بطريقة يمكن استخدامها للمهام التوليدية مثل إنشاء الصور.
على عكس معظم برامج التشفير التلقائي، وهي نماذج "حتمية" تشفر متجه واحد من القيم المنفصلة لكل متغير كامن لبيانات التدريب، فإن برامج التشفير التلقائي المتغيرة هي نماذج "احتمالية" تشفر الفضاء الكامن كمجموعة من الاحتمالات. من خلال الاستنباط ضمن نطاق الإمكانيات المشفرة هذا، يمكن برامج التشفير التلقائي المتغيرة توليد عينات بيانات جديدة، على الرغم من كونها فريدة وأصلية بذاتها، إلا أنها تشبه بيانات التدريب الأصلية.
لتمكين إنشاء عينات بيانات جديدة تمامًا (بدلًا من مجرد إعادة إنشاء أو دمج عينات من بيانات التدريب)، يجب أن يُظهر الفضاء الكامن نوعين من الانتظام:
- الاستمرارية: يجب أن تسفر النقاط المتقاربة في الفضاء الكامن عن محتوى مماثل عند فك التشفير.
- الاكتمال: يجب أن تسفر أي نقطة تم أخذ عينة منها من الفضاء الكامن عن محتوى مفيد عند فك تشفيرها.
هناك طريقة بسيطة لفرض الاستمرارية والاكتمال في الفضاء الكامن وهي إجباره على اتباع التوزيع الطبيعي (غاوسي). لذلك ، تقوم برامج التشفير التلقائي المتغيرة بتشفير متجهين مختلفين لكل سمة كامنة لبيانات التدريب: متجه الوسائل، "μ"، ومتجه الانحرافات المعيارية، "σ". وفي الأساس، يمثل هذان المتجهان نطاق الاحتمالات لكل متغير كامن والتباين المتوقع ضمن كل نطاق من الاحتمالات، على التوالي.
تحقق برامج التشفير التلقائي المتغيرة ذلك عن طريق إضافة دالة خسارة إضافية إلى جانب مع خسارة إعادة البناء: تباعد Kullback-Leibler (أو تباعد KL). وبشكل أكثر تحديدًا، يتم تدريب برنامج التشفير التلقائي المتغير على تقليل الاختلاف بين التوزيع الغاوسي القياسي والفضاء الكامن الذي تم تعلمه عن طريق تقليل خسارة إعادة البناء.