Tren AI terbaru, dipersembahkan oleh para pakar
Dapatkan kurasi insight tentang berita AI yang paling penting dan menarik. Berlangganan buletin Think mingguan. Lihat Pernyataan Privasi IBM.
Pembelajaran transfer adalah teknik machine learning di mana pengetahuan yang diperoleh melalui satu tugas atau kumpulan data digunakan untuk meningkatkan kinerja model pada tugas terkait lain atau kumpulan data yang berbeda.1 Dengan kata lain, pembelajaran transfer menggunakan apa yang telah dipelajari di satu kondisi untuk meningkatkan generalisasi di kondisi lain.2
Ada banyak aplikasi pembelajaran transfer, mulai dari memecahkan masalah regresi dalam ilmu data hingga melatih model pembelajaran mendalam. Sejatinya, ini sangat menarik bagi model pembelajaran mendalam mengingat sejumlah besar data yang dibutuhkan untuk membuat neural networks mendalam.
Proses pembelajaran tradisional membangun model baru untuk setiap tugas baru, berdasarkan data berlabel yang tersedia. Hal ini dikarenakan algoritme machine learning tradisional mengasumsikan data pelatihan dan pengujian berasal dari ruang fitur yang sama, sehingga jika distribusi data berubah, atau model yang dilatih diterapkan pada kumpulan data baru, pengguna harus melatih ulang model yang lebih baru dari awal, meskipun mencoba tugas yang sama dengan model pertama (misalnya, pengklasifikasi analisis sentimen ulasan film versus ulasan lagu). Namun demikian, algoritme pembelajaran transfer mengambil model atau jaringan yang sudah terlatih sebagai titik awal. Algoritme tersebut selanjutnya menerapkan pengetahuan model yang diperoleh dalam tugas atau data sumber awal (misalnya, mengklasifikasikan ulasan film) ke tugas atau data target baru, yang tetap terkait, (misalnya, mengklasifikasikan ulasan lagu).3
Dapatkan kurasi insight tentang berita AI yang paling penting dan menarik. Berlangganan buletin Think mingguan. Lihat Pernyataan Privasi IBM.
Tentunya, transfer pengetahuan dari satu domain ke domain lainnya tidak dapat mengimbangi dampak negatif dari data yang berkualitas buruk. Teknik prapemrosesan dan rekayasa fitur, seperti penambahan data dan ekstraksi fitur, masih diperlukan ketika menggunakan pembelajaran transfer.
Ini bukan berarti bahwa ada kerugian yang melekat pada pembelajaran transfer, melainkan bahwa ada potensi konsekuensi negatif yang diakibatkan oleh kesalahan penerapan. Pembelajaran transfer bekerja paling efektif ketika tiga kondisi terpenuhi:
Ketika kondisi ini tidak terpenuhi, pembelajaran transfer dapat berdampak negatif pada kinerja model. Literatur menyebut hal ini sebagai transfer negatif. Penelitian yang sedang berlangsung mengusulkan berbagai tes untuk menentukan apakah kumpulan data dan tugas memenuhi kondisi di atas, sehingga tidak akan menghasilkan transfer negatif.5 Transfer jarak jauh adalah salah satu metode yang dikembangkan untuk mengoreksi transfer negatif yang dihasilkan dari perbedaan yang terlalu besar dalam distribusi kumpulan data sumber dan target.6
Perhatikan bahwa tidak ada metrik standar yang tersebar luas untuk menentukan kesamaan antara tugas untuk pembelajaran transfer. Beberapa penelitian, akan tetapi, mengusulkan metode evaluasi yang berbeda untuk memprediksi kesamaan antara kumpulan data dan tugas machine learning, sehingga memungkinkan pembelajaran transfer.7
Ada tiga praktik atau subpengaturan pembelajaran transfer yang berdekatan. Perbedaan antara keduanya—serta pembelajaran transfer secara lebih luas—sebagian besar merupakan hasil dari perubahan dalam hubungan antara domain sumber, domain target, dan tugas yang harus diselesaikan.8
Pembelajaran transfer berbeda dengan penyempurnaan. Harus diakui, keduanya menggunakan kembali model machine learning yang sudah ada sebelumnya alih-alih melatih model baru. Namun demikian, kesamaannya sebagian besar berada di sana. Penyempurnaan merujuk pada proses pelatihan lebih lanjut suatu model pada kumpulan data tugas spesifik untuk meningkatkan kinerja pada tugas awal spesifik yang menjadi tujuan pembuatan model tersebut. Misalnya, seseorang dapat membuat model deteksi objek tujuan umum menggunakan kumpulan gambar besar seperti COCO atau ImageNet, lalu melatih model yang dihasilkan lebih lanjut pada kumpulan data berlabel yang lebih kecil, khusus untuk deteksi mobil. Dengan cara ini, pengguna menyempurnakan model deteksi objek untuk deteksi mobil. Sebaliknya, pembelajaran transfer terjadi saat pengguna mengadaptasi suatu model ke masalah baru yang terkait, bukan ke masalah yang sama.
Ada banyak aplikasi pembelajaran transfer dalam machine learning di dunia nyata dan situasi kecerdasan buatan. Pengembang dan ilmuwan data dapat menggunakan pembelajaran transfer untuk membantu dalam berbagai tugas dan menggabungkannya dengan pendekatan pembelajaran lain, seperti pembelajaran penguatan.
Salah satu masalah penting yang memengaruhi pembelajaran transfer dalam NLP adalah ketidakcocokan fitur. Fitur dalam domain yang berbeda dapat memiliki makna yang berbeda, dan karenanya konotasi (mis. cahaya yang menandakan berat dan optik). Perbedaan dalam representasi fitur ini memengaruhi tugas klasifikasi sentimen, model bahasa, dan banyak lagi. Model berbasis pembelajaran mendalam—khususnya, penyematan kata—menunjukkan harapan dalam mengoreksi hal ini, karena model ini dapat menangkap hubungan semantik dan orientasi secara memadai untuk tugas adaptasi domain.12
Karena kesulitan dalam memperoleh data yang diberi label secara manual dalam jumlah memadai untuk tugas visi komputer yang beragam, banyak penelitian meneliti aplikasi pembelajaran transfer dengan neural networks konvolusional (CNN). Salah satu contoh penting adalah ResNet, arsitektur model terlatih yang menunjukkan peningkatan kinerja dalam klasifikasi gambar dan tugas deteksi objek.13 Penelitian terbaru menyelidiki kumpulan data ImageNet yang terkenal untuk pembelajaran transfer, dengan alasan bahwa (bertentangan dengan anggapan umum dalam visi komputer) hanya subset kecil dari kumpulan data ini yang diperlukan untuk melatih model yang dapat digeneralisasi dengan andal.14 Banyak tutorial pembelajaran transfer untuk visi komputer menggunakan keduanya atau salah satu antara ResNet dan ImageNet dengan pustaka keras dari TensorFlow.
Latih, validasi, lakukan tuning, dan terapkan AI generatif, model dasar, dan kemampuan machine learning dengan IBM watsonx.ai, studio perusahaan generasi berikutnya untuk pembangun AI. Bangun aplikasi AI dalam waktu singkat, dengan sedikit data.
Gunakan AI di bisnis Anda dalam perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.
Temukan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.