Model IBM watsonx™ dirancang untuk perusahaan dan dioptimalkan untuk domain bisnis dan contoh penggunaan yang ditargetkan. Melalui studio AI IBM® watsonx.ai™ kami menawarkan pilihan model dasar tingkat perusahaan yang hemat biaya yang dikembangkan oleh IBM, model sumber terbuka dan model yang bersumber dari penyedia pihak ketiga untuk membantu klien dan mitra meningkatkan skala dan mengoperasionalkan kecerdasan buatan (AI) lebih cepat dengan risiko minimal. Anda dapat menerapkan model AI di mana pun beban kerja Anda berada, baik on premises maupun di hybrid cloud.
IBM mengambil pendekatan yang berbeda untuk memberikan model dasar tingkat perusahaan:
Perpustakaan model dasar IBM watsonx memberikan Anda pilihan dan fleksibilitas untuk memilih model yang paling sesuai dengan kebutuhan bisnis, kepentingan regional, dan profil risiko Anda dari perpustakaan model dengan hak milik, sumber terbuka, dan model pihak ketiga.
IBM Granite adalah seri unggulan model dasar bahasa besar berdasarkan arsitektur transformator khusus decoder. Model bahasa Granite dilatih pada data perusahaan tepercaya yang mencakup data internet, akademis, kode, hukum, dan keuangan.
Model ini secara konsisten memberikan peningkatan kinerja di seluruh contoh penggunaan populer seperti pembuatan konten, pembuatan ringkasan, klasifikasi, ekstraksi insight, dan retrieval augmented generation (RAG).
Coba watsonx.ai gratis
Lihat cara model Granite dilatih dan sumber data digunakan
IBM Granite yang dilatih untuk konten yang relevan bagi perusahaan memenuhi kriteria tata kelola data, peraturan, dan risiko yang ketat, yang ditetapkan dan ditegakkan oleh kode Etik AI IBM dan Chief Privacy Office.
Peningkatan akurasi untuk domain bisnis perusahaan yang ditargetkan seperti keuangan dan contoh penggunaan seperti RAG, dicapai melalui penyempurnaan obrolan dan teknik penyelarasan model.
Model dengan harga bersaing dengan kebutuhan infrastruktur lebih sedikit, ganti rugi kekayaan intelektual, dan toolkit yang mudah digunakan untuk kustomisasi model dan integrasi aplikasi.
Pilih model dasar generatif yang paling sesuai dengan kebutuhan Anda. Setelah memiliki daftar singkat model untuk contoh penggunaan Anda, uji model secara sistematis menggunakan teknik rekayasa prompt untuk melihat model mana yang secara konsisten memberikan hasil yang diinginkan.
granite-13b-chat
IBM
Mendukung pertanyaan dan jawaban (Q&A), pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.
8192
0,0006
granite-13b-instruct
IBM
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.
8192
0,0006
granite-20b-multilingual
IBM
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan, ekstraksi, penerjemahan, dan tugas-tugas RAG dalam bahasa Prancis, Jerman, Portugis, Spanyol, dan Inggris.
8190
0,0006
llama-2-70b-chat
Meta
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.
4096
0.0018
llama-2-13b-chat
Meta
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG. Penyetelan prompt dapat dilakukan.
4096
0,0006
codellama-34b-instruct
Meta
Tugaskan model khusus untuk kode dengan membuat dan menerjemahkan kode dari prompt bahasa alami.
4096
0.0018
mixtral-8x7b-instruct
Mistral AI
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, serta tugas-tugas RAG dan pembuatan kode.
32768
0,0006
granite-8b-japanese
IBM
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, terjemahan, dan tugas-tugas RAG dalam bahasa Jepang.
4096
0,0006
flan-t5-xl-3b
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG. Penyetelan prompt dapat dilakukan.
4096
0,0006
flan-t5-xxl-11b
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.
4096
0.0018
flan-ul2-20b
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.
4096
0,005
elyza-japanese-llama-2-7b-instruct
ELYZA
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas penerjemahan.
4096
0.0018
mt0-xxl-13b
BigScience
Mendukung Q&A, pembuatan ringkasan, klasifikasi, dan tugas-tugas pembuatan konten.
4096
0,0018
IBM percaya dalam penciptaan, penerapan, dan pemanfaatan model AI yang memajukan inovasi di seluruh perusahaan secara bertanggung jawab. watsonx AI dan platform data IBM memiliki proses menyeluruh dalam membangun serta menguji model dasar dan AI generatif. Untuk model yang dikembangkan IBM, kami mencari dan menghapus duplikasi. Selain itu, kami menggunakan daftar blokir URL, filter untuk konten yang tidak pantas dan kualitas dokumen, pemisahan kalimat, dan teknik tokenisasi, semuanya sebelum pelatihan model.
Selama proses pelatihan data, kami berupaya mencegah ketidakselarasan output model dan menggunakan penyesuaian yang diawasi agar dapat mengikuti instruksi yang lebih baik, sehingga model dapat digunakan untuk menyelesaikan tugas perusahaan melalui rekayasa prompt. Kami terus mengembangkan model Granite dalam beberapa arah, termasuk modalitas lain, konten spesifik industri, dan anotasi data tambahan untuk pelatihan. Di saat yang sama, menerapkan pertahanan perlindungan data secara berkala dan berkelanjutan untuk model yang dikembangkan IBM.
Mengingat pesatnya perubahan lingkungan teknologi AI generatif, proses end-to-end kami diperkirakan akan terus berkembang dan lebih baik. Sebagai bukti ketelitian yang dilakukan IBM dalam pengembangan dan pengujian model dasarnya, perusahaan memberikan ganti rugi hak kekayaan intelektual kontraktual standar untuk model yang dikembangkan IBM, serupa dengan yang disediakan untuk produk perangkat keras dan produk piranti lunak IBM.
Selain itu, berbeda dengan beberapa penyedia model bahasa besar lainnya dan selaras dengan pendekatan standar IBM mengenai ganti rugi, IBM tidak mewajibkan pelanggannya untuk mengganti rugi IBM atas penggunaan (oleh pelanggan) model yang dikembangkan oleh IBM. Serta selaras dengan pendekatan IBM terhadap kewajiban ganti ruginya, IBM tidak membatasi tanggung jawab ganti ruginya untuk model yang dikembangkan oleh IBM.
Model watsonx saat ini yang berada di bawah perlindungan ini meliputi:
(1) Model khusus enkoder dari lini Slate.
(2) Model khusus dekoder dari lini Granite.
Pelajari selengkapnya tentang pemberian lisensi untuk model Granite
Harga inferensi adalah per 1.000 token (1 Unit Sumber Daya). Token input dan penyelesaian dikenakan tarif yang sama. 1.000 token umumnya berisi sekitar 750 kata.
Tidak semua model tersedia di semua wilayah, lihat dokumentasi kami untuk detailnya.
Panjang konteks dinyatakan dalam token.
Pernyataan IBM mengenai rencana, arahan, dan maksudnya dapat berubah atau ditarik tanpa pemberitahuan atas kebijakannya sendiri. Lihat Harga untuk detail selengkapnya. Kecuali ditentukan lain dalam Harga perangkat lunak, semua fitur, kemampuan, dan potensi pembaruan merujuk secara eksklusif pada SaaS. IBM tidak membuat pernyataan bahwa fitur dan kemampuan SaaS dan perangkat lunak adalah sama.