ベクトル データベースは、大量の高次元ベクトル データを効率的に保存、管理、インデックス付けできるように設計されています。
ベクトル データベースは、生成人工知能 (AI) のユースケースとアプリケーションに付加価値を生み出すための関心が急速に高まっています。 ガートナー社によると、2026年までに企業の30%以上がベクターデータベースを採用し、関連するビジネスデータで基盤モデルを構築するようになるという。
行と列を備えた従来のリレーショナル データベースとは異なり、ベクトル データベースのデータ ポイントは、類似性に基づいてクラスター化された、固定数の次元を持つベクトルによって表されます。 この設計により、低レイテンシーのクエリが可能になり、AI 主導のアプリケーションに最適になります。
このモデル選択フレームワークを使用して、パフォーマンス要件とコスト、リスク、導入ニーズのバランスをとりながら、最も適切なモデルを選択してください。
AIデータストアに関する電子ブックに登録する
データの性質は大きく変わりました。 もはや、従来のデータベースに簡単に保存できる構造化された情報だけにとどまりません。 非構造化データは 、ソーシャルメディアの投稿、画像、動画、オーディオクリップなど、前年比で30〜60%増加しています。2 通常、非構造化データソースを従来のリレーショナルデータベースにロードしてAIの保存、管理、準備を行う場合、特に類似検索などの新しい生成的ユースケースでは、そのプロセスは多大な労力を要し、効率的とは言えません。 リレーショナルデータベースは特定の形式の構造化データセットと半構造化データセットの管理に最適ですが、ベクターデータベースは高次元のベクター埋め込みによる非構造化データセットに最適です。
ベクトルを入力します。ベクトルは、機械学習 (ML) モデルによって生成された、単語、画像、動画、音声などの複雑なオブジェクトを表すことができる数値の配列です。 高次元のベクターデータは、機械学習、自然言語処理 (NLP)、その他の AI タスクに不可欠です。 ベクターデータの例としては、次のようなものがあります。
テキスト: 最後にチャットボットとやり取りしたときのことを思い出してください。 自然言語をどのように理解しているのでしょうか? これらは、機械学習アルゴリズムを介して変換される、単語、段落、文書全体を表すことができるベクトルに依存しています。
画像: 画像のピクセルは数値データで記述され、結合されてその画像の高次元ベクトルを構成できます。
音声/オーディオ: 画像と同様に、音波も数値データに分解してベクトルとして表すことができるため、音声認識などの AI アプリケーションが可能になります。
組織がAIに必要とする非構造化データセットの量は今後も増え続けるでしょう。では、何百万ものベクターをどのように処理しているのでしょうか。 ここで、ベクター埋め込みとベクターデータベースが役立ちます。 これらのベクトルは、埋め込みと呼ばれる連続した多次元空間で表現されます。埋め込みは、ベクトルデータを埋め込みに変換することに特化した埋め込みモデルによって生成されます。 ベクターデータベースは、埋め込みモデルの出力を保存し、インデックスを付ける役割を果たします。 ベクトル埋め込みはデータを数値で表現したもので、意味的意味や事実上あらゆるデータ型の類似機能に基づいてデータセットをグループ化します。
たとえば、「車」と「車両」という単語を考えてみましょう。 綴りは異なりますが、どちらも同様の意味を持っています。 AI アプリケーションが効果的なセマンティック検索を可能にするには、「自動車」と「車両」のベクトル表現がそれらのセマンティックな類似性を捉える必要があります。 機械学習に関しては、エンベディングはこの意味情報をエンコードする高次元ベクトルを表します。 これらのベクター埋め込みは、レコメンデーション、チャットボット、ChatGPT などの生成アプリのバックボーンです。
ナレッジ グラフは、オブジェクトやイベントなどのエンティティのネットワークを表し、それらの間の関係を示します。 グラフデータベースは、ナレッジグラフ情報を格納し、グラフ構造として視覚化するための目的に適したデータベースです。 グラフ データベースは、既知のエンティティとそれらの間の複雑な関係を表すノードとエッジに基づいて構築されますが、ベクトル データベースは高次元ベクトルに基づいて構築されます。 その結果、データ ポイント間の複雑な関係を処理するにはグラフ データベースが適しており、画像やビデオなどのさまざまな形式のデータを処理するにはベクトル データベースが適しています。
エンタープライズベクトルデータは、IBM のwatsonx.aiなどの埋め込みモデルにフィードできます。モデルまたはHugging Face (リンクは ibm.com の外部にあります) は、複雑な高次元ベクトル データをコンピューターが理解できる数値形式に変換することにより、データを埋め込みに変換することに特化しています。 これらの埋め込みは、分類や異常検出などの AI タスクで使用されるデータの属性を表します。
ベクトル データベースは、埋め込みモデル アルゴリズムの出力、つまりベクトル埋め込みを保存します。 また、各ベクトルのメタデータも保存され、メタデータ フィルターを使用してクエリできます。 これらの埋め込みを取り込んで保存することにより、データベースは類似性検索の高速な検索を容易にし、ユーザーのプロンプトと類似のベクトル埋め込みを照合します。
データを埋め込みとして保存するだけでは不十分です。 検索プロセスを高速化するには、ベクトルにインデックスを付ける必要があります。 ベクトル データベースは、検索機能のためにベクトル埋め込みにインデックスを作成します。 ベクトル データベースは、機械学習アルゴリズムを使用してベクトルにインデックスを付けます。 インデックス付けにより、ベクトルを新しいデータ構造にマッピングすることで、ベクトル間の最近傍検索など、より高速な類似性検索や距離検索が可能になります。
ベクトルのクエリは、最近傍検索などのアルゴリズムを使用してベクトル間の距離を測定する計算によって実行できます。 この測定は、コサイン類似度などのさまざまな類似性メトリックに基づくことができ、これらのベクトルがどれだけ近いか遠いかを測定するためにそのインデックスによって使用されます。 ユーザーが AI モデルに対してクエリまたはプロンプトを送信すると、同じ埋め込みモデル アルゴリズムを使用して埋め込みが計算されます。 データベースは、クエリ ベクトルとインデックスに格納されているベクトルの間の距離を計算し、類似性の計算を実行します。 類似性ランキングに従って、最も類似したベクトルまたは最近傍ベクトルを返します。 これらの計算は、推奨システム、意味検索、画像認識、その他の自然言語処理タスクなどのさまざまな機械学習タスクをサポートします。
特にカスタマーケアや人事/人材などの主要なユースケースでは、市場投入までの時間の短縮、効率的な推論、信頼性の高い出力のために、ジェネレーティブAIワークフローにおける検索拡張生成(RAG)アプローチを好む企業が増えています。 RAG は、モデルが最新の信頼できる事実にリンクされていること、およびユーザーがモデルのソースにアクセスできることを保証するため、モデルの主張の正確性をチェックできます。 RAG は、大規模な言語モデルを信頼できるデータに固定してモデルの幻覚を軽減する機能の中核です。 このアプローチは、高次元のベクターデータを活用して、基礎モデルによるコンテキスト内学習のための意味的に関連する情報をプロンプトに充実させることに依存しています。 最も大量のデータを処理する推論段階での効果的な保存と取得が必要です。 ベクトル データベースは、これらの高次元ベクトルの効率的なインデックス作成、保存、取得に優れており、レコメンデーション エンジンやチャットボットなどのアプリケーションに必要な速度、精度、スケールを提供します。
ベクター データベース機能への関心と、企業の AI ベースのアプリケーションを強化するための採用が急速に高まっていることは明らかですが、次のようなメリットも採用者にとってビジネス価値を示しています。
速度とパフォーマンス:ベクターデータベースは、検索を高速化するためにさまざまなインデックス技術を使用しています。 ベクトルインデックスと最近傍検索などの距離計算アルゴリズムは、最適化されたパフォーマンスで、数十億とは言わないまでも、数百万のデータポイントにわたって関連する結果を検索する場合に特に役立ちます。
スケーラビリティ:ベクターデータベースは、クエリ要求やデータ量が増加してもパフォーマンスを維持しながら水平方向に拡張することで、大量の非構造化データを保存・管理することができます。
所有コスト:ベクターデータベースは、基礎モデルをゼロからトレーニングしたり、微調整したりするための貴重な代替手段である。 これにより、基礎モデルの推論のコストと速度が削減されます。
柔軟性:ベクターデータベースは、画像、動画、その他の多次元データなど、複雑なデータにも対応できるように設計されています。 セマンティック検索から会話型 AI アプリケーションに至るまでの複数のユースケースを考慮すると、ビジネスと AI の要件を満たすようにベクター データベースの使用をカスタマイズできます。
LLMの長期記憶:組織は、IBM watsonx.aiのGranite シリーズモデル、MetaのLlama-2、GoogleのFlanモデルなどの汎用モデルから始めて、独自のデータをベクトルデータベースで提供して、検索拡張生成に不可欠なモデルとAIアプリケーションの出力を強化できます。
データ管理コンポーネント:ベクターデータベースは通常、非構造化データの更新や挿入を簡単に行うための機能を内蔵している。
組織のデータと AI のニーズを満たすベクター データベース機能を選択するには、幅広い選択肢があります。
いくつかの選択肢から選択できます。
ベクトルデータベース機能が統合されたプラットフォームが、 IBM watsonx.dataに近日登場します。
PostgreSQL のオープン ソース pgvector 拡張機能などのベクトル データベース/検索拡張機能。ベクトルの類似性検索機能を提供します。
ベクター データベースはスタンドアロンの機能として考慮されるべきではなく、より広範なデータおよび AI エコシステムの一部として考慮されるべきです。 多くは API やネイティブ拡張機能を提供しており、データベースと統合できます。 これらは、独自のエンタープライズ データを活用してモデルを強化するように構築されているため、LLM の基盤となるデータが信頼できることを保証するために、適切なデータ ガバナンスとセキュリティを導入する必要もあります。
ここで、信頼できるデータ基盤が AI において重要な役割を果たします。それは、データと、AI に使用される前にデータがどのように保存、管理、統治されるかから始まります。 その中心となるのが、 IBM watsonx.data のようなオープンでハイブリッドかつ管理された データレイクハウス です。データ ファブリック アーキテクチャ にシームレスに適合する Watsonx AI データ プラットフォームの一部です。たとえば、IBM watsonx.data は、すべての構造化データ、半構造化データ、および非構造化データとメタデータにアクセス、カタログ化、管理、変換するために構築されています。 その後、この管理されたデータと watsonx.data のデータを活用できます。 機械学習および生成 AI のユースケース向けの統合ベクトル データベース機能 (2023 年第 4 四半期のテクノロジー プレビュー)。
ベクトル ストアとインデックスの使用は、ファクトまたはファクトベースのクエリに基づくアプリケーションに適しています。 たとえば、昨年の会社の法的条件について質問したり、複雑な文書から特定の情報を抽出したりします。 取得する取得コンテキストのセットは、埋め込み距離を通じてクエリに意味的に最も類似したものになります。 ただし、トピックの概要を取得したい場合、これはベクトル インデックスには適していません。 この場合、LLM にデータ内のそのトピックに関するさまざまなコンテキストをすべて調べてもらいたいと考えます。 代わりに、ベクトル インデックスではなくリスト インデックスなど、別の種類のインデックスを使用することもできます。ベクトル インデックスは最も関連性の高いデータのみを取得するためです。
ベクトル データベースのアプリケーションは膨大であり、成長を続けています。 ユースケースには次のものがあります。
セマンティック検索: クエリの意味またはコンテキストに基づいて検索を実行し、より正確で関連性の高い結果を実現します。単語だけでなくフレーズもベクトルとして表現できるため、セマンティック ベクトル検索機能は一般的なキーワードよりもユーザーの意図をよりよく理解します。
類似性検索と応用:類似の画像、テキスト、音声、動画データを簡単に検索して、高度な画像認識や音声認識、自然言語処理などを含むコンテンツ検索を行います。
レコメンデーションエンジン:たとえば、電子商取引サイトでは、ベクターデータベースとベクターを使用して、顧客の好みや製品属性を表現できます。 これにより、ベクターの類似性に基づいて過去に購入したものと同様のアイテムを提案できるようになり、ユーザーエクスペリエンスが向上し、定着率が高まります。
会話型 AI: 関連するナレッジ ベースを効率的かつ正確に解析し、ユーザーのクエリに対するリアルタイムのコンテキストに応じた回答を、参照用のソース ドキュメントとページ番号とともに提供する機能を強化することで、仮想エージェントの対話を改善します。
AI開発者が従来の機械学習と、基盤モデルを活用した新しい生成AI機能の両方をトレーニング、検証、チューニング、デプロイできる次世代のエンタープライズ・スタジオです。watsonx.ai の AI タスクを利用して、社内または社外の広範な知識ベースから Q&A リソースを構築します。 検索拡張生成など。
利用可能になりました—オープンなデータレイクハウス アーキテクチャに基づいて構築された目的に適したデータストアで、あらゆるデータをどこでも AI ワークロードに拡張可能統合されたベクトル機能を使用して、watsonx.data にベクトル埋め込みを保存、クエリ、検索します (技術プレビューは 2023 年第 4 四半期に予定)。
当社の PostgreSQL Database-as-a-Service サービスにより、チームはより簡単に高可用性、バックアップオーケストレーション、ポイントインタイムリカバリ (PITR)、リードレプリカなどの構築により多くの時間を費やすことができます。 PostgreSQLは、IBM Cloud PostgreSQL拡張機能(近日公開予定)で構成できるオープンソースのベクター拡張であるpgvectorを提供しており、ベクターの類似性検索機能を提供します。
生成 AI モデルを正しく利用する組織は、業務効率の向上や意思決定の改善から、マーケティング コンテンツの迅速な作成まで、無数のメリットを得ることができます。
watsonx Graniteモデルシリーズは、ビジネス・アプリケーションとビジネス・ワークフローへ生成AIモデルの導入を促進するための、生成AIモデルコレクションです。IBMは、Graniteシリーズ最初のモデルの一般提供を発表しました。
RAG は、外部のナレッジ ベースから事実を取得して、最も正確な最新情報に基づいて LLM を確立し、ユーザーに LLM の生成プロセスに関する洞察を提供する AI フレームワークです。
1 Gartner Innovation Insight: Vector Databases(リンクは ibm.com 外部にあり、Gartnerアカウントが必要)、Gartner
2 Gartner 2022 Strategic Roadmap for Storage (リンクは ibm.com 外部にあり、Gartner アカウントが必要)、Gartner