Apa yang Dimaksud dengan Amazon SageMaker?

Penyusun

Tom Krantz

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

Alice Gomstyn

Staff Writer

IBM Think

Apa yang dimaksud dengan Amazon SageMaker?

Amazon SageMaker adalah layanan yang terkelola sepenuhnya dan dirancang untuk menyederhanakan proses pembuatan, pelatihan, dan penerapan model machine learning (ML).

Dibuat oleh Amazon Web Services (AWS), SageMaker mengotomatiskan banyak tugas padat karya yang terdapat dalam setiap tahap penerapan ML, sehingga mengurangi kompleksitas alur kerja dan mempercepat siklus proses machine learning secara keseluruhan. Hal ini dapat menghasilkan iterasi yang lebih cepat, akurasi yang lebih baik, dan pada akhirnya, nilai bisnis yang lebih besar dari inisiatif machine learning.

SageMaker menawarkan rangkaian alat ML. Misalnya, Autopilot memungkinkan model kecerdasan buatan (AI) dilatih menggunakan kumpulan data tertentu dan memberi peringkat setiap algoritma berdasarkan akurasi, sementara Data Wrangler mempercepat persiapan data, yang menjadikan tahap awal pengembangan model ML lebih efisien.

SageMaker juga mencakup beberapa antarmuka pemrograman aplikasi (API). API ini memungkinkan para ilmuwan data dan pengembang membuat solusi ML yang siap produksi tanpa manajemen infrastruktur yang rumit.

Latar Belakang: Memahami proses machine learning

Untuk memahami dampak Amazon SageMaker, penting untuk memahami cara kerja machine learning. Proses machine learning dapat dibagi menjadi tiga: proses keputusan, fungsi kesalahan, dan pengoptimalan model.

Proses keputusan: Algoritma machine learning terutama bertujuan untuk membuat prediksi atau klasifikasi. Menggunakan data input, baik berlabel maupun tidak berlabel, algoritma machine learning dapat menghasilkan perkiraan dan mengidentifikasi pola dalam data.
Fungsi kesalahan: Fungsi ini mengevaluasi akurasi prediksi model. Dengan membandingkan hasil model dengan contoh yang diketahui, fungsi kesalahan membantu menilai kinerja model dan mengidentifikasi area yang perlu ditingkatkan.
Proses pengoptimalan model: Untuk meningkatkan akurasi model, algoritma machine learning berulang kali menyesuaikan bobotnya berdasarkan perbedaan antara contoh yang diketahui dan perkiraan model. Siklus "evaluasi dan optimalkan" ini berlanjut hingga model mencapai ambang akurasi yang memuaskan.

Amazon SageMaker dapat membantu merampingkan proses ini, sehingga ilmuwan data dapat menerapkan model machine learning secara efisien.

Apa fungsi AWS SageMaker?

AWS SageMaker menyederhanakan siklus proses ML melalui pendekatan terstruktur yang mencakup tiga fase penting: pembuatan contoh data, pelatihan, dan penerapan. Dalam setiap fase, pengembang dapat menggunakan instans, yaitu lingkungan yang terisolasi, atau server, yang mengelola database dan sumber daya komputasi, menetapkan parameter konfigurasi, serta menyediakan infrastruktur TI yang diperlukan.

Pembuatan contoh data

Pengembang dapat memulai dengan membuat contoh data, yang penting untuk melatih model ML. Proses ini mencakup pengambilan, pembersihan, dan penyiapan kumpulan data dunia nyata untuk prapemrosesan. Terkadang, pengembang dapat menggunakan Amazon Ground Truth untuk membuat data gambar sintetis berlabel yang menambah atau menggantikan contoh data. Setelah siap, data dapat diunggah ke Amazon Simple Storage Service (S3), agar dapat diakses untuk digunakan bersama berbagai layanan AWS.

Instans notebook Amazon SageMaker menyediakan lingkungan tangguh bagi pengembang untuk menyiapkan dan memproses data mereka untuk pelatihan. Dengan mengakses data yang disimpan di S3, SageMaker dapat mempercepat proses pengembangan model dengan menggunakan instans ML yang terkelola sepenuhnya untuk melatih model, menjalankan inferensi, dan memproses kumpulan data besar dalam Amazon Elastic Cloud Compute (EC2).

SageMaker mendukung pengodean kolaboratif melalui aplikasi Jupyter Notebook sumber terbuka. Ilmuwan data dapat mengimpor alat mereka sendiri atau menggunakan instans notebook bawaan yang dilengkapi dengan driver penting dan perpustakaan kode yang telah ditulis sebelumnya untuk kerangka kerja pembelajaran mendalam yang populer. Perpustakaan ini dapat terdiri dari operasi matematika, lapisan jaringan neural, dan algoritma optimasi.

SageMaker juga memberikan fleksibilitas kepada pengembang dengan mendukung algoritma khusus yang dikemas sebagai gambar kontainer Docker. Hal ini memungkinkan integrasi dengan Amazon S3, sehingga tim dapat meluncurkan proyek machine learning mereka dengan mudah. Pengembang dapat menyediakan algoritma pelatihan mereka sendiri atau memilih dari serangkaian algoritma bawaan melalui konsol SageMaker. Tutorial dan referensi tersedia untuk memandu pengguna melalui proses ini.

Pelatihan

Pada fase pelatihan, pengembang menggunakan algoritma atau model dasar terlatih untuk menyempurnakan model ML dengan kumpulan data tertentu. Pengembang dapat menentukan lokasi data di bucket Amazon S3 dan memilih jenis instans yang sesuai untuk mengoptimalkan proses pelatihan.

Alat orkestrasi seperti SageMaker Pipelines merampingkan alur kerja dengan mengotomatiskan proses pembuatan, pelatihan, dan penerapan model machine learning secara keseluruhan. Hal ini dapat membantu menghemat waktu dan memastikan akurasi di seluruh alur kerja. Selain itu, Amazon SageMaker JumpStart memungkinkan pengembang untuk menggunakan model bawaan melalui antarmuka no-code, sehingga kolaborasi dapat dilakukan tanpa memerlukan keahlian teknis yang mendalam.

Selama pelatihan model, pengembang dapat menggunakan penyetelan hyperparameter SageMaker untuk mengoptimalkan model bahasa besar (large language model, LLM) guna meningkatkan kinerja di berbagai aplikasi. Debugger memantau metrik jaringan neural, sehingga pengembang mendapatkan wawasan real-time tentang kinerja model dan penggunaan sumber daya. Ini dapat membantu menyederhanakan proses debugging dengan memungkinkan ilmuwan data mengidentifikasi masalah, menganalisis tren, dan mengatur peringatan otomatis dengan cepat untuk manajemen proaktif. SageMaker juga menyediakan kemampuan Edge Manager yang memperluas pemantauan dan manajemen ML ke perangkat edge.

Deployment

Setelah pelatihan selesai, SageMaker secara mandiri mengelola dan menskalakan infrastruktur cloud yang mendasarinya untuk membantu memastikan penerapan berjalan lancar. Proses ini mengandalkan berbagai jenis instans (misalnya, unit pemrosesan grafis atau GPU, yang dioptimalkan untuk beban kerja ML). Penerapan juga dilakukan di beberapa zona ketersediaan, yaitu klaster pusat data yang terisolasi tetapi cukup dekat untuk memiliki latensi rendah, untuk meningkatkan keandalan. Pemeriksaan kesehatan dan titik akhir HTTPS yang aman makin meningkatkan konektivitas aplikasi.

Setelah diterapkan, pengembang dapat menggunakan metrik Amazon CloudWatch untuk memantau kinerja produksi, mendapatkan insight secara real-time, dan mengatur peringatan untuk setiap penyimpangan. Dengan kemampuan pemantauan yang komprehensif, SageMaker dapat mendukung tata kelola yang efektif sepanjang siklus proses ML. Akibatnya, organisasi dapat mempertahankan kontrol dan kepatuhan sekaligus memanfaatkan kekuatan machine learning.

Apa manfaat Amazon SageMaker?

Amazon SageMaker menawarkan berbagai manfaat yang meningkatkan pengalaman machine learning, termasuk:

Lingkungan pengembangan terintegrasi
Pelatihan dan pengoptimalan model
Persiapan dan pelabelan data
Inferensi real-time dan batch
Solusi tanpa server dan hemat biaya
Pemantauan dan debugging
Model harga yang fleksibel

Lingkungan pengembangan terintegrasi (IDE)

Amazon SageMaker Studio bertindak sebagai IDE multifungsi bagi ilmuwan data, yang menyediakan antarmuka intuitif untuk mengelola alur kerja, mengembangkan model, dan memvisualisasikan metrik. Layanan ini mendukung Jupyter Notebook, sehingga pengguna dapat menulis dan menjalankan kode Python secara efisien.

Pelatihan dan pengoptimalan model

Pengguna dapat melatih model ML dengan algoritma bawaan atau algoritma khusus berdasarkan kerangka kerja pelatihan ML populer seperti TensorFlow, PyTorch, dan MXNet. Layanan ini menawarkan penyetelan hyperparameter untuk mengoptimalkan konfigurasi model demi kinerja terbaik. SageMaker juga memungkinkan penyempurnaan model terlatih, sehingga ilmuwan data dapat menyesuaikan model ini dengan kumpulan data dan tugas tertentu.

Persiapan dan pelabelan data

Kumpulan data berkualitas sangat penting untuk membuat model machine learning yang efektif. Ground Truth menyediakan layanan pelabelan data yang memfasilitasi pembuatan kumpulan data pelatihan berkualitas tinggi melalui pelabelan otomatis dan proses tinjauan manusia. Selain itu, Amazon SageMaker menyertakan penyimpanan fitur bawaan yang memungkinkan tim mengelola, berbagi, dan menemukan fitur, yaitu input yang digunakan untuk pelatihan dan inferensi, di berbagai model machine learning. Ini dapat membantu merampingkan proses persiapan data dan meningkatkan kolaborasi.

Inferensi real-time dan batch

Setelah menerapkan model machine learning, SageMaker dapat digunakan untuk inferensi real-time dan batch. Pengguna dapat membuat titik akhir, yaitu URL khusus yang berfungsi sebagai titik akses untuk aplikasi, guna membuat prediksi real time dan mengelola beban kerja secara efisien. Ini sangat berguna untuk aplikasi yang membutuhkan respons instan, seperti dalam skenario AI generatif.

Solusi tanpa server dan hemat biaya

Dengan fitur seperti penskalaan otomatis dan integrasi dengan AWS Lambda, SageMaker menyediakan kemampuan tanpa server yang membantu mengelola sumber daya komputasi secara dinamis berdasarkan permintaan. Hasilnya adalah biaya dan skalabilitas yang dioptimalkan.

Pemantauan dan debugging

SageMaker menawarkan alat seperti Amazon CloudWatch untuk memantau kinerja model ML secara real time, dengan menggunakan layanan AWS lainnya untuk memberikan pandangan holistik tentang kesehatan aplikasi. Fitur debugging memungkinkan ilmuwan data melacak masalah dalam pelatihan dan penerapan model, yang membantu memastikan siklus proses pembelajaran machine learning yang kuat.

Model harga yang fleksibel

AWS menawarkan dua model harga, yakni sesuai permintaan dan bayar sesuai kebutuhan, dengan biaya yang bervariasi berdasarkan jenis instans, penyimpanan data, dan layanan yang digunakan. Selain itu, paket gratis Amazon SageMaker memungkinkan pengguna baru menjelajahi platform tanpa biaya, dengan menyediakan akses terbatas ke beberapa fitur dan sumber daya.

Desain 3D bola yang menggelinding di lintasan

Berita + Insight AI terbaru  

Insight dan berita yang dikurasi oleh para ahli tentang AI, cloud, dan lainnya di Buletin Think mingguan.

Contoh penggunaan AWS SageMaker

Fleksibilitas Amazon SageMaker membuatnya cocok untuk berbagai contoh penggunaan di beragam industri. Contohnya termasuk:

Kesehatan: Model machine learning dapat menganalisis data pasien untuk memprediksi hasil, mempersonalisasi perawatan, dan meningkatkan efisiensi operasional.

Keuangan: Lembaga keuangan dapat menggunakan Amazon SageMaker untuk mengembangkan model deteksi penipuan, penilaian kredit, dan penilaian risiko.

Retail: Perusahaan menggunakan analisis prediktif untuk meningkatkan manajemen inventaris, mempersonalisasi pengalaman pelanggan, dan mengoptimalkan strategi penetapan harga.

Amazon SageMaker dan tata kelola AI

Alat seperti Amazon SageMaker dapat membantu organisasi menerapkan model machine learning secara efektif sehingga mendorong inovasi dan nilai bisnis sekaligus mempertahankan kontrol AI dan kepatuhan terhadap peraturan. Pengguna dapat manfaatkan beberapa alat tata kelola, termasuk:

Manajemen identitas dan akses (Identity and access management, IAM): Fitur ini memungkinkan pengguna untuk mengelola izin dan peran, sehingga membantu memastikan hanya pengguna berwenang yang dapat mengakses data sensitif dan titik akhir model.
Kontrol versi: Pengguna dapat melacak versi model dan konfigurasi untuk mempertahankan jejak audit yang jelas, yang penting untuk kepatuhan dan tata kelola.
Registri model: Registri model bertindak sebagai repositori pusat untuk mengelola artefak dan metadata model, yang membantu memastikan transparansi dan akuntabilitas selama siklus proses pengembangan.

SageMaker Python SDK meningkatkan kemampuan tata kelola Amazon SageMaker melalui integrasi mulus dengan alur kerja dan layanan yang ada. Dengan demikian, organisasi dapat mengotomatiskan pemeriksaan kepatuhan dan mempertahankan pengawasan di seluruh proyek ML secara lebih efektif.

Amazon SageMaker juga dapat diintegrasikan ke dalam data yang lebih luas dan strategi AI. IBM dan AWS telah membentuk kemitraan strategis untuk meningkatkan kemampuan organisasi yang memanfaatkan layanan berbasis cloud. Menggunakan model dasar IBM bersama Amazon SageMaker memungkinkan tim memanfaatkan analisis canggih, meningkatkan manajemen data, dan merampingkan alur kerja. Dengan menerapkan model dalam Amazon VPC, organisasi dapat membantu memastikan akses yang aman dan terkontrol ke sumber daya mereka, yang pada akhirnya mendukung upaya tata kelola.

Dengan kemampuan untuk bekerja di berbagai platform seperti Windows, organisasi dapat menggabungkan alat IBM dan AWS sehingga mudah mengimplementasikan solusi AI dan ML yang disesuaikan dengan kebutuhan mereka. Berkat penggunaan solusi IBM watsonx.governance bersama fitur canggih SageMaker, bisnis dapat mempercepat inisiatif AI, terutama dalam aplikasi AI generatif dan MLOps.