ホーム
Think
トピック
レコメンデーション・エンジン
公開日:2024年6月19日
寄稿者: Rina Cabalar、Cole Stryker
レコメンデーション・エンジンを使うと、ユーザーは自分では見つけられなかったコンテンツ、製品、サービスを見つけることができます。このようなシステムは、電子商取引サイト、メディア・ストリーミング・プラットフォーム、検索エンジン、ソーシャル・メディア・ネットワークなど、多くのオンライン・ビジネスの売上を生み出し、エンゲージメントを育成するために不可欠な要素です。
レコメンダーは、次に観るべき映画や動画、聴くべき類似の曲、関連する検索結果、特定の注文を補完する製品などを提案します。
レコメンデーション・システムによって作成された提案も、ユーザー・エクスペリエンスをパーソナライズするうえで重要な役割を果たします。経営コンサルティング会社McKinsey社(ibm.com外部へのリンク)の調査によると、パーソナライゼーションによって、収益が5%~15%増加する可能性があります。また、顧客の76%は、相互作用がパーソナライズされていないと不満を感じています。
レコメンデーション・システムの市場は拡大しています。2024年には、レコメンデーション・エンジン市場(ibm.com外部へのリンク)は68億8千万米ドルに達すると推定されており、この市場規模は5年で3倍になると予測されています。
基盤モデルのカスタマイズを可能にするAIプラットフォームのメリットを明らかにします。
ユーザーに適切な提案を提供するため、レコメンデーション・エンジンは、データサイエンスと機械学習を組み合わせています。
レコメンダーは通常、最も正確な推奨事項を予測するために、5つのフェーズで動作します。
データはレコメンデーション・システムの基盤であるため、データの収集は極めて重要なステップといえます。収集されるデータには主に、明示的データと暗黙的データの2種類があります。
明示的データには、コメント、いいね、評価、レビューなど、ユーザーのアクションやアクティビティーが含まれます。暗黙的データは、閲覧履歴、ショッピング・カート・イベント、クリック、過去の購入、検索履歴といったユーザーの行動で構成されます。
また、レコメンダーは、他にも人口統計(年齢または性別)や心理統計(興味やライフスタイル)といった顧客データを用いて類似のユーザーを見つけたり、特徴データ(価格帯や商品の種類など)を用いて関連製品やサービスを決定したりします。
分析フェーズでは、機械学習アルゴリズムを用いて、データ・セットを処理、調査します。このアルゴリズムは、パターンを検知し、相関関係を特定して、そのパターンと相関関係の強さを比較検討します。機械学習モデルは、大規模なデータ・セットでトレーニングされることで、適切に推奨できるようになります。
最後のステップでは、データをフィルタリングし、前の分析段階から最も関連性の高い商品を表示します。データ・フィルタリングでは、使用されるレコメンデーション・エンジンのタイプに応じて、特定の数学の公式や数式をデータに適用する必要があります。
オプションで精製ステップを追加すれば、レコメンデーション・システムの出力を定期的に評価して、モデルをさらに最適化することで、その精度と品質を継続的に向上させることもできます。
レコメンダーは、使用するフィルタリング手法に基づいて異なります。レコメンデーション・エンジンには通常、次の3種類があります。
協調フィルタリング・システムは、特定のユーザーと他のユーザーの類似性に基づいて提案をフィルタリングします。協調レコメンダー・システムは、明示的データと暗黙的データを利用し、同じような嗜好を持つユーザーが同じ商品に興味を持ち、将来的にも同様の方法でその商品と相互作用する可能性が高いことを前提としています。
例えば、Amazon(ibm.com外部へのリンク)は、製品の推奨に協調フィルタリングを使用しており、Spotify(ibm.com外部へのリンク)でも、オーディオ・コンテンツにこの手法が使用されています。
協調フィルタリング・レコメンダーは、効果的な提案を行うことができ、通常商品の詳細な説明を必要としません。ただし、協調フィルタリングでは、コールド・スタート問題が生じる傾向があります。この問題は、特に新規ユーザーにおいて、システムから引き出せる過去のデータが限られている場合に発生します。
協調フィルタリング・システムには、主にメモリーベースとモデルベースの2種類があります。
メモリーベースのシステムは、ユーザーとアイテムを行列として表します。このシステムは、類似のユーザーまたは類似のアイテムである「最近傍」を見つけることを目的としているため、k 近傍法(KNN)アルゴリズムを拡張したものといえます。メモリベースのシステムは、さらに次の2タイプに分類されます。
また、モデルベースのシステムがデータの予測機械学習モデルを作成するという別の方法もあります。ユーザー-アイテム行列がこのモデルのトレーニング・データ・セットとして機能することで、欠損値(つまり、ユーザーがまだ見つけていないためにこれから推奨されるアイテム)の予測が得られます。
最も一般的に使用されるモデルベースの協調フィルタリング・アルゴリズムの1つは、行列分解です。この次元削減手法では、多くの場合、大きなユーザー-アイテム行列が、2つの低次元行列(1つはユーザー用、もう1つはアイテム用)に分解されます。次に、2つの行列を乗算して、大きい方の行列内の欠損値(または推奨事項)を予測します。
行列分解のより高度な実装では、ディープラーニング・ニューラル・ネットワークを利用します。他のモデルベースのシステムでは、ベイズ分類器、クラスタリング、決定木などの機械学習アルゴリズムが利用されています。
コンテンツベースのフィルタリング・システムは、アイテムの特徴に基づいて推奨事項をフィルタリングします。コンテンツベースのレコメンダー・システムは、ユーザーが特定のアイテムを気に入った場合、別の類似アイテムも気に入ると仮定します。コンテンツベースのフィルタリングでは、明示的および暗黙的データだけでなく、キーワードやタグによって割り当てられた色、カテゴリー、価格、その他のメタデータといったアイテムの説明も検討されます。
コンテンツベースのフィルタリング・システムは、アイテムとユーザーをベクトル空間内のベクトルとして表します。近接性は、アイテム間の類似性を判断するために使用されます。空間内において2つのベクトルが近いほど、その類似性は高いと考えられます。提供されている特徴に基づいて、前のアイテムに似たベクトルがユーザーに推奨されます。
コンテンツベースのレコメンダーは、ユーザーベースの分類器または回帰モデルを適用します。ユーザーが興味を持っているアイテムの説明と特徴が、モデルのトレーニング・データ・セットとして機能することで、推奨アイテムの予測が得られます。
コンテンツベースのレコメンデーション・システムは、自然言語処理タグを使用することで、そのパフォーマンスをさらに向上させることができます。ただし、このタグ付けプロセスは、データが大量の場合、面倒な作業になる可能性があります。
協調フィルタリングとは異なり、コンテンツベースのフィルタリングは、過去のユーザー・インタラクションではなく、メタデータの特性に基づいているため、コールド・スタートの問題はさほど問題ではありませんが、コンテンツベースのフィルタリングは、多くの場合、ユーザーが以前気に入ったものと類似したものを提案するため、新しいアイテムについて調べる場合には、選択範囲が制限される可能性があります。
その名が示すように、ハイブリッド・レコメンデーション・システムは、協調フィルタリングとコンテンツベースのフィルタリングを統合したものです。
その結果、ハイブリッド・アプローチは、レコメンデーション・エンジンのパフォーマンスを大幅に向上させることができますが、高度なアーキテクチャーと強力な計算能力が求められます。
例えば、Netflix社は、映画やテレビ番組の推奨に、ハイブリッド・レコメンデーション・システム(ibm.com外部へのリンク)を使用しています。
レコメンデーション・エンジンは、企業とユーザーの両方に価値をもたらします。ここでは、組織がレコメンデーション・システムに投資することで得られるメリットをいくつかご紹介します。
適切な製品やサービスを推奨することで、ユーザーは膨大なカタログを延々とスクロールする時間を節約することができます。例えば、Netflixで視聴される作品の80%は、推奨アルゴリズムが提案したものです。さらに、関連性の高いコンテンツを提案することで、エクスペリエンスをパーソナライズすることができます。
McKinsey社の調査によると、顧客体験の向上(ibm.com外部へのリンク)は、顧客満足度の向上にもつながり、正確には20%上昇します。顧客の満足度が向上すると、エンゲージメントが高まり、そしてブランドへのロイヤルティーも高まるので、企業は信頼を築き、より多くの顧客を維持できるようになります。
パーソナライズされた推奨事項を提供することで、ユーザーはより多くの商品を表示してクリックするようになり、最終的にはユーザーが購入者に変わる可能性があります。McKinsey社の調査で、よりポジティブでパーソナライズされた顧客体験により、販売コンバージョン率が10%~15%上昇することが判明しました。
顧客のコンバージョン率は売上を促進し、売上は収益を促進します。McKinsey社は、Amazonで購入されるものの35%が製品の推奨によるものであると指摘しています(ibm.com外部へのリンク)。一方、Netflix社はレコメンダー・システムにより、10億米ドルを超える節約効果があると推定しています。
レコメンデーション・システムには限界があり、組織に課題をもたらします。ここでは、最も一般的な課題をいくつかご紹介します。
レコメンデーション・エンジンには、大量のデータの分析とフィルタリングが伴います。これには、複雑なアーキテクチャーとコンピューティング・リソースへの多額の投資が必要です。
レコメンダー・システムは、適切な推奨事項をリアルタイムで決定して表示できるだけのスピードが求められます。これは、リアルタイムの提案を数百、数千のユーザーに同時に提供する場合にはさらに困難になります。それが数百万人のユーザーとなればなおさらです。
間違ったメトリクスに基づいて機械学習アルゴリズムを最適化すると、無関係な推奨につながる可能性があります。評価が高い商品は、新しい商品やあまり知られていない商品、あるいはレビューが少ない商品よりも頻繁に提案される場合があります。しかし、最も人気がある商品や最もよく購入されている商品が、顧客が興味を持っているものではない可能性があります。
機械学習アルゴリズムは、収集されたデータ、タグ付けされたデータ、トレーニング・データ、外部のデータ・ソースといったデータに存在する社会的バイアスや、モデルをチューニングする評価者としての人間が持つ社会的バイアスを学習する可能性もあります。その結果、推奨事項が不正確になることがあります。
一部のユーザーは、プライバシーの懸念から、レコメンデーション・システムに関するデータ収集への企業の取り組みをオプトアウトする場合があります。また、企業は、データを収集して保管する際に、規制要件やコンプライアンス基準を考慮しなければならない可能性もあります。
ここでは、企業がレコメンデーション・システムを使用できる方法をいくつかご紹介します。レコメンダー・テクノロジーの進化に伴い、他のユースケースやアプリケーションが登場する可能性もあります。
小売業者やオンライン販売業者は、レコメンデーション・エンジンを使用して売上を伸ばすことができます。レコメンダーは、他の買い物客も購入した商品や、買い物客がすでに注文したものとマッチする製品を提案することができます。
レコメンデーション・システムは、位置情報や季節に基づいた推奨に加え、新製品や割引品の販売促進にも使用できます。また、めったに購入されない商品のリーチを増やしたり、そのような商品をバンドルとして、あるいは人気のある製品とともによく購入される製品として、推奨するために使用することもできます。
Amazonは、レコメンデーション・エンジンを活用しているeコマース企業の代表例です。
レコメンデーション・システムは、過去のデータとユーザーの好みに基づいて、ユーザーが関心を持ち、楽しむ可能性が高い関連コンテンツを提案できます。
次に観るべきテレビ・シリーズ、読むべき電子書籍、聴くべきアーティスト、プレイすべきゲーム、参加すべきコンサートなど、パーソナライズされた推奨事項を提供することで、ユーザー・エクスペリエンスを向上させます。
Netflix、Spotify、YouTubeは、レコメンダーを利用しているメディアおよびエンターテイメント分野の企業です。
旅行とホスピタリティーの分野では、レコメンデーション・エンジンは、個人の予算や旅行履歴に応じて、ホテルや宿泊施設のオプション、レストラン、アクティビティー、エクスペリエンスを提案できます。
このようにパーソナライズされた旅行を推奨して、旅行者のニーズに対応することで、顧客満足度が向上します。
組織はレコメンデーション・エンジンを使用することで、有望な見込み客を増やすことができます。レコメンダーは、ブログ記事、お客様事例、Webセミナー、ホワイト・ペーパーなどのコンテンツを提案して、新しいサービスを紹介し、見込み客を引きつけることができます。
マーケティング・チームは、ニュースレター、ソーシャル・メディア広告、ターゲットを絞ったEメール・メッセージを通じて、このような提案を配信できます。
AIOps、すなわち、IT運用のための人工知能は、AIを使用してITサービス管理と運用ワークフローを自動化および合理化します。
AIOpsでレコメンデーション・エンジンを使用してソリューションを提案することで、IT運用チームは迅速に行動し、技術的な問題に適切に対応できます。
生成AI、基盤モデル、機械学習機能のトレーニング、検証、チューニング、デプロイが容易になり、少量のデータで時間をかけずにAIアプリケーションを開発できます。IBM watsonx.aiは、基盤モデルを活用した新たな生成AI機能と従来の機械学習を統合した、AIライフサイクル全体をカバーする優れたスタジオです。
ライブラリー、サービス、アプリケーションの強力かつ柔軟なポートフォリオにより、AIのビジネス価値を促進します。
データ・サイロを排除し、複雑さを軽減し、データ品質を向上させることで、卓越した顧客体験と従業員体験を実現するデータ・ストラテジーを設計します。
データ・ファブリック・アーキテクチャーで構築されたプラットフォームを使用して、結果をより迅速に予測します。データの場所に関係なくデータを収集、編成、分析します。
IBM® Watson Knowledge Studioを使用すると、特定のドメイン向けにカスタマイズされた言語分析モデルを作成できます。
このお客様事例では、レコメンデーション・システムの実装に関する実際の例をご紹介します。
IBM Case Managerが、IBM® Watson Machine Learning、IBM® Watson Visual Recognition、IBM® Watson OpenScaleを使用して、AIレコメンデーション・モデルに従って保険請求の妥当性を確認する方法をご覧ください。
私たちの日常生活の一部となっている機械学習の実際の応用例をご覧ください。
予測分析とは何か、そしてそのメリット、タイプ、ユースケースはどのようなものかご覧ください。
最新のデータ・プラットフォームを使用することで、いかに組織のデータの変換と分析が可能になり、より良い意思決定ができるようになるか詳しくご紹介します。