Basis data vektor semakin populer karena memberikan kecepatan dan kinerja yang diperlukan untuk mendorong kasus penggunaan dan aplikasi kecerdasan buatan (AI) generatif . Menurut Gartner®, pada tahun 2026, lebih dari 30% perusahaan akan mengadopsi basis data vektor untuk membangun model fondasi mereka dengan data bisnis yang relevan.1
Tidak seperti basis data relasional tradisional dengan baris dan kolom, titik data dalam database vektor diwakili oleh vektor dengan jumlah dimensi tetap. Karena menggunakan penyematan vektor berdimensi tinggi, basis data vektor lebih mampu menangani kumpulan data yang tidak terstruktur.
Sifat data telah mengalami transformasi mendalam. Data tidak lagi terbatas pada informasi terstruktur yang mudah disimpan dalam basis data tradisional. Data tidak terstruktur, termasuk postingan media sosial, gambar, video, klip audio, dan lainnya, tumbuh 30% hingga 60% dari tahun ke tahun.2
Basis data relasional unggul dalam mengelola kumpulan data terstruktur dan semi terstruktur dalam format tertentu. Memuat sumber data tidak terstruktur ke dalam basis data relasional tradisional untuk menyimpan, mengelola, dan menyiapkan data untuk kecerdasan buatan (AI) adalah proses memakan waktu yang banyak, terutama dengan contoh penggunaan generatif baru seperti pencarian kesamaan.
Pencarian tradisional secara umum mewakili data dengan menggunakan token atau fitur diskrit, seperti kata kunci, tag, atau metadata. Pencarian tradisional bergantung pada kecocokan yang tepat untuk mengambil hasil yang relevan. Misalnya, pencarian untuk ‘smartphone’ akan menampilkan hasil yang berisi kata ‘smartphone’.
Sebaliknya, pencarian vektor merepresentasikan data sebagai vektor padat, yaitu vektor yang sebagian besar atau semua elemennya bukan nol. Vektor direpresentasikan dalam ruang vektor berlanjut, ruang matematika tempat data direpresentasikan sebagai vektor.
Representasi vektor memungkinkan pencarian kesamaan. Misalnya, pencarian vektor untuk “smartphone” mungkin juga mengembalikan hasil untuk “ponsel” dan “perangkat seluler”.
Setiap dimensi vektor padat sesuai dengan fitur laten atau aspek data. Fitur laten adalah karakteristik atau atribut yang mendasari yang tidak diamati secara langsung, tetapi disimpulkan dari data melalui model atau algoritma matematika.
Fitur laten menangkap pola dan hubungan tersembunyi dalam data, memungkinkan representasi item yang lebih bermakna dan akurat sebagai vektor dalam ruang dimensi tinggi.
Vektor adalah bagian dari tensor, yang dalam machine learning (ML) adalah istilah umum untuk sekelompok angka, atau pengelompokan kelompok angka, dalam ruang n-dimensi. Tensor berfungsi sebagai perangkat pembukuan matematika untuk data. Bekerja dari elemen terkecil:
Angka vektor dapat mewakili objek kompleks seperti kata, gambar, video, dan audio yang dihasilkan oleh model ML. Data vektor dimensi tinggi ini, yang berisi banyak fitur, sangat penting untuk machine learning, pemrosesan bahasa alami (NLP), dan tugas AI lainnya. Beberapa contoh penggunaan data vektor meliputi:
Penyematan vektor adalah representasi numerik dari titik data yang mengubah berbagai jenis data, termasuk data nonmatematis seperti kata, audio, atau gambar, menjadi array angka yang dapat diproses oleh model ML.
Model kecerdasan buatan (AI), mulai dari algoritme regresi linier sederhana hingga neural network yang rumit yang digunakan dalam pembelajaran mendalam, beroperasi melalui logika matematika.
Setiap data yang digunakan oleh model AI, termasuk data yang tidak terstruktur, perlu dicatat secara numerik. Penyematan vektor adalah cara mengubah titik data yang tidak terstruktur menjadi array angka yang mengekspresikan makna asli data tersebut.
Berikut adalah contoh penyematan kata yang disederhanakan untuk korpus yang sangat kecil (2 kata), dengan setiap kata direpresentasikan sebagai vektor 3 dimensi:
Dalam contoh ini, setiap kata (“kucing”) dikaitkan dengan vektor unik ([0.2, -0.4, 0.7]). Nilai-nilai dalam vektor mewakili posisi kata dalam ruang vektor 3 dimensi berlanjut.
Kata-kata dengan arti atau konteks yang sama diharapkan memiliki representasi vektor yang serupa. Misalnya, vektor untuk “kucing” dan “anjing” berdekatan, mencerminkan hubungan semantik mereka.
Model penyematan dilatih untuk mengubah titik data menjadi vektor. Basis data vektor menyimpan dan mengindeks hasil dari model embedding ini. Di dalam basis data, vektor dapat dikelompokkan atau diidentifikasi sebagai hal yang berlawanan berdasarkan makna semantik atau fitur di hampir semua jenis data.
Penyematan vektor adalah tulang punggung rekomendasi, chatbot, dan aplikasi generatif seperti ChatGPT.
Misalnya saja kata “mobil” dan “kendaraan”. Mereka memiliki arti yangserupa tetapi dieja secara berbeda. Agar aplikasi AI dapat mengaktifkan penelusuran semantik yang efektif, representasi vektor “mobil” dan “kendaraan” harus menangkap kesamaan semantiknya. Dalam machine learning, penyematan mewakili vektor dimensi tinggi yang mengkodekan informasi semantik ini.
Basis data vektor melayani tiga fungsi utama dalam aplikasi AI dan ML:
Operasi basis data vektor bekerja dengan menggunakan beberapa algoritme untuk melakukan pencarian perkiraan tetangga terdekat (ANN). Algoritma tersebut kemudian dikumpulkan dalam suatu pipeline untuk mengambil dan mengirimkan data yang berdekatan dengan vektor yang dikueri dengan cepat dan akurat.
Misalnya, pencarian ANN dapat mencari produk yang secara visual mirip dalam katalog e-commerce. Penggunaan tambahan termasuk deteksi anomali, klasifikasi dan pencarian semantik. Karena kumpulan data berjalan melalui model hanya sekali, hasilnya dikembalikan dalam hitungan milidetik.
Basis data vektor menyimpan hasil dari algoritma model penyematan, penyematan vektor. Mereka juga menyimpan metadata setiap vektor, termasuk judul, deskripsi, dan tipe data, yang dapat dikueri dengan menggunakan filter metadata.
Dengan menyerap dan menyimpan penyematan ini, basis data kemudian dapat memfasilitasi pengambilan cepat pencarian kemiripan, mencocokkan prompt pengguna dengan penyematan vektor yang serupa.
Vektor perlu diindeks untuk mempercepat pencarian dalam ruang data dimensi tinggi. Basis data vektor membuat indeks pada penyematan vektor untuk fungsi pencarian.
Basis data vektor mengindeks vektor menggunakan algoritma ML. Pengindeksan memetakan vektor ke struktur data baru yang memungkinkan pencarian kesamaan atau jarak yang lebih cepat, seperti pencarian tetangga terdekat , antar vektor.
Vektor dapat diindeks menggunakan algoritma seperti Hierarchical Navigable Small World (HNSW), Locality-Sensitive Hashing (LSH) atau Product Quantization (PQ).
Vektor kueri adalah representasi vektor dari kueri pencarian. Ketika pengguna menanyakan atau meminta model AI, model menghitung penyematan kueri atau prompt. Basis data kemudian menghitung jarak antara vektor kueri dan vektor yang disimpan dalam indeks untuk mengembalikan hasil yang serupa.
Basis data dapat mengukur jarak antar vektor dengan berbagai algoritma, seperti pencarian tetangga terdekat. Pengukuran juga dapat didasarkan pada berbagai metrik kesamaan, seperti kesamaan kosinus.
Basis data mengembalikan vektor yang paling mirip atau tetangga terdekat dengan vektor kueri sesuai dengan peringkat kemiripan. Perhitungan ini mendukung berbagai tugas machine learning seperti sistem rekomendasi, pencarian semantik, pengenalan gambar, dan tugas pemrosesan bahasa alami lainnya.
Basis data vektor adalah cara populer untuk mendorong aplikasi berbasis AI perusahaan karena banyak manfaat yang dapat diberikan:
Basis data vektor menggunakan berbagai teknik pengindeksan untuk memungkinkan pencarian lebih cepat. Pengindeksan vektor dan algoritma penghitungan jarak seperti pencarian tetangga terdekat dapat membantu mengoptimalkan kinerja saat mencari hasil yang relevan di seluruh kumpulan data besar dengan jutaan, bahkan miliaran, titik data.
Salah satu pertimbangannya adalah basis data vektor memberikan hasil perkiraan. Aplikasi yang membutuhkan akurasi lebih besar mungkin perlu menggunakan jenis basis data yang berbeda dengan mengorbankan kecepatan pemrosesan yang lebih lambat.
Basis data vektor dapat menyimpan dan mengelola data tidak terstruktur dalam jumlah besar dengan menskalakan secara horizontal dengan node tambahan, mempertahankan kinerja seiring dengan meningkatnya permintaan kueri dan volume data.
Karena memungkinkan pengambilan data yang lebih cepat, basis data vektor mempercepat pelatihan model dasar.
Basis data vektor biasanya menyediakan fitur bawaan untuk memperbarui dan memasukkan data baru yang tidak terstruktur dengan mudah.
Basis data vektor dibangun untuk menangani kompleksitas tambahan dalam penggunaan gambar, video, atau data multidimensi lainnya.
Dengan berbagai contoh penggunaan mulai dari pencarian semantik hingga aplikasi AI percakapan, basis data vektor dapat disesuaikan untuk memenuhi kebutuhan bisnis dan AI. Organisasi dapat memulai dengan model tujuan umum seperti model seri IBM® Granite, model Llama-2 dari Meta atau model Flan dari Google, dan kemudian menyediakan data mereka sendiri dalam basis data vektor untuk meningkatkan hasil model dan aplikasi AI.
Organisasi memiliki banyak pilihan ketika memilih kemampuan basis data vektor. Untuk menemukan yang memenuhi kebutuhan data dan AI mereka, banyak organisasi mempertimbangkan:
Ada beberapa alternatif untuk dipilih.
Basis data vektor tidak seharusnya dianggap sebagai kemampuan terpisah, melainkan sebagai bagian dari data dan ekosistem AI yang lebih luas.
Banyak yang menawarkan API, ekstensi native atau dapat diintegrasikan dengan basis data Anda. Karena basis data vektor dibangun untuk menggunakan data perusahaan untuk meningkatkan model, organisasi juga harus memiliki tata kelola data dan keamanan yang tepat untuk membantu memastikan bahwa data yang digunakan untuk melatih model bahasa besar (LLM) dapat dipercaya.
Selain API, banyak basis data vektor menggunakan perangkat pengembangan perangkat lunak (SDK) khusus bahasa pemrograman yang dapat menggabungkan API. Menggunakan SDK, pengembang sering merasa lebih mudah untuk bekerja dengan data di aplikasi mereka.
Menggunakan penyimpanan vektor dan indeks sangat cocok untuk aplikasi yang didasarkan pada fakta atau penelusuran berbasis fakta, seperti mengekstraksi informasi spesifik dari dokumen yang kompleks.
Namun, meminta ringkasan topik tidak akan bekerja dengan baik dengan indeks vektor. Dalam hal ini, LLM akan melalui semua konteks yang mungkin berbeda pada topik itu dalam data.
Pilihan yang lebih cepat adalah menggunakan jenis indeks yang berbeda, seperti indeks daftar daripada indeks vektor, karena indeks daftar akan langsung mengambil elemen pertama dalam setiap daftar.
Untuk mengoptimalkan pengembangan basis data vektor, LangChain adalah kerangka kerja orkestrasi sumber terbuka untuk mengembangkan aplikasi yang menggunakan LLM.
Tersedia dalam pustaka berbasis Python dan JavaScript, alat dan API LangChain menyederhanakan proses pembuatan aplikasi yang digerakkan oleh LLM seperti chatbot dan agen virtual. LangChain menyediakan integrasi untuk lebih dari 25 metode penyematan yang berbeda, dan lebih dari 50 penyimpanan vektor yang berbeda (baik yang di-host di cloud maupun lokal).
Untuk mendukung AI tingkat perusahaan, data lakehouse mungkin dipasangkan dengan basis data vektor terintegrasi. Organisasi dapat menyatukan, mengkurasi, dan menyiapkan penyematan vektor untuk aplikasi AI generatif mereka dalam skala besar di seluruh data tepercaya dan terkelola. Hal ini meningkatkan relevansi dan ketepatan beban kerja AI mereka, termasuk chatbot, sistem rekomendasi yang dipersonalisasi, dan aplikasi pencarian kemiripan gambar.
Aplikasi basis data vektor sangat luas dan berkembang. Beberapa contoh penggunaan utama meliputi:
Generasi dengan dukungan pengambilan data (RAG) adalah kerangka kerja AI untuk memungkinkan model bahasa besar (LLM) untuk mengambil fakta dari basis pengetahuan eksternal. Basis data vektor adalah kunci untuk mendukung implementasi RAG.
Perusahaan semakin menyukai RAG dalam alur kerja AI generatif karena waktu yang lebih cepat ke pasar, kesimpulan yang efisien, dan hasil yang dapat diandalkan. Kerangka kerja ini sangat membantu dalam contoh penggunaan seperti layanan pelanggan, SDM, dan pengelolaan SDM.
RAG membantu memastikan bahwa model terhubung dengan fakta terkini yang dapat diandalkan dan bahwa pengguna memiliki akses ke sumber model sehingga klaimnya dapat diverifikasi. Menghubungkan LLM dengan data tepercaya dapat membantu mengurangi halusinasi model.
RAG menggunakan data vektor dimensi tinggi untuk memperkaya prompt dengan informasi yang relevan secara semantik untuk pembelajaran dalam konteks dengan model dasar. RAG membutuhkan penyimpanan dan pengambilan yang efektif selama tahap inferensi, yang menangani volume data tertinggi.
Basis data vektor unggul dalam mengindeks, menyimpan, dan mengambil vektor berdimensi tinggi secara efisien, memberikan kecepatan, ketepatan, dan skala yang diperlukan untuk aplikasi seperti mesin rekomendasi dan chatbot.
Basis data vektor, terutama ketika digunakan untuk mengimplementasikan kerangka kerja RAG, dapat membantu meningkatkan interaksi agen virtual dengan meningkatkan kemampuan agen untuk mengurai basis pengetahuan yang relevan secara efisien dan akurat. Agen dapat memberikan jawaban kontekstual secara real-time untuk pertanyaan pengguna, bersama dengan dokumen sumber dan nomor halaman untuk referensi.
Situs e-commerce, misalnya, dapat menggunakan vektor untuk mewakili preferensi pelanggan dan atribut produk. Hal ini memungkinkan mereka untuk menyarankan item yang mirip dengan pembelian sebelumnya berdasarkan kemiripan vektor, meningkatkan pengalaman pengguna dan meningkatkan retensi.
Teknik pencarian ini digunakan untuk menemukan item atau titik data serupa, biasanya direpresentasikan sebagai vektor, dalam koleksi besar. Pencarian vektor dapat menangkap hubungan semantik antara elemen, memungkinkan pemrosesan yang efektif oleh model machine learning dan aplikasi kecerdasan buatan.
Pencarian ini dapat berupa beberapa bentuk.
Kami menyurvei 2.000 organisasi tentang inisiatif AI mereka untuk mengetahui apa yang berhasil, apa yang tidak, dan cara Anda untuk maju.
IBM Granite adalah rangkaian model AI kami yang terbuka, berkinerja, dan tepercaya, yang dirancang untuk bisnis dan dioptimalkan untuk menskalakan aplikasi AI Anda. Jelajahi opsi bahasa, kode, deret waktu, dan batasan.
Akses katalog lengkap kami yang terdiri dari lebih dari 100 kursus online dengan membeli langganan individu atau multi-pengguna hari ini, memungkinkan Anda untuk memperluas keterampilan Anda di berbagai produk kami dengan satu harga murah.
Dipandu oleh pemimpin terkemuka IBM, kurikulumnya dirancang untuk membantu pemimpin bisnis dalam mendapatkan pengetahuan yang diperlukan untuk memprioritaskan investasi AI yang dapat mendorong pertumbuhan.
Ingin mendapatkan laba yang lebih baik atas investasi AI Anda? Pelajari bagaimana meningkatkan AI gen di berbagai bidang utama mendorong perubahan dengan membantu para pemikir terbaik Anda membangun dan memberikan solusi baru yang inovatif.
Pelajari cara menggabungkan AI generatif dan machine learning dengan percaya diri ke dalam bisnis Anda.
Selami 3 elemen penting dari strategi AI yang kuat: menciptakan keunggulan kompetitif, meningkatkan skala AI di seluruh bisnis, dan memajukan AI yang dapat dipercaya.
1 Gartner Innovation Insight: Vector Databases, Gartner, 4 September 2023.
2 2024 Strategic Roadmap for Storage, Gartner, 27 Mei 2024.