ホーム Topics OLAPとは OLAP(オンライン分析処理)とは
IBMのOLAPソリューションはこちら AI関連の最新情報を購読する
黒と青の背景
OLAPとは

OLAP( オンライン分析処理)は、データ・ウェアハウスデータレイク、またはその他のデータ・リポジトリー内の大量のデータに対して高速で複雑なクエリーや多次元分析を実行するためのテクノロジーです。OLAPは、ビジネス・インテリジェンス(BI) 、意思決定サポート、およびさまざまなビジネス予測およびレポート・アプリケーションで使用されます。

ほとんどのビジネス・データには、表示、追跡、分析のためにデータを分類する複数の次元、つまり複数のカテゴリーがあります。例えば、売上の数値には、場所(地域、国、州/県、店舗)、時間(年、月、週、日)、製品(衣類、男性/女性/子ども、ブランド、タイプ)などに関する複数の次元がある場合があります。

しかし、データ・ウェアハウスまたはデータレイク内では、データ・セットは表に保管され、それぞれの表がデータを一度に編成できるのはそれらの次元のうち2つのみです。 OLAPは複数のリレーショナル・データ・セットからデータを抽出し、それを多次元形式に再編成することで、非常に高速な処理と非常に洞察に富んだ分析を実現します。

Prestoの学習と操作

データ分析に役立つオープンソースのSQLエンジンであるPrestoの導入方法については、O'Reilly社が提供する資料をご覧ください。

関連コンテンツ

IDCレポートを読む

OLAPキューブとは

ほとんどのOLAPシステムの中核であるOLAPキューブは、アレイ・ベースの多次元データベースであり、従来のリレーショナル・データベースよりもはるかに迅速かつ効率的に複数のデータの次元を処理して分析することができます。

リレーショナル・データベース表は、スプレッドシートのように構成されており、二次元の行と列の形式で個々のレコードを保管します。データベース内の各データの「ファクト」は、2つの次元(行と列)、例えば地域総売上などの交点に配置されます。

SQLやリレーショナル・データベースのレポート作成ツールは、表に保管された多次元データの照会、レポート、分析をもちろん行えますが、データ量が増加するにつれてパフォーマンスが遅くなります。そして、結果を再編成してさまざまな次元にフォーカスするには多くの作業が必要です。

ここで、OLAPキューブが登場します。 OLAPキューブは単一の表を追加の階層で拡張し、それぞれの階層が追加の次元(通常は次元の「概念階層」の次のレベル)を付加します。例えば、キューブの最上位階層で地域別の売上を編成し、追加の階層を国、州/県、市、さらには特定の店舗とすることができます。

理論的には、キューブに無限の数の階層を含めることができます。(3より大きい次元を表すOLAPキューブはハイパーキューブと呼ばれることがあります。) そして、階層内に小さいキューブを置くことができます。例えば、各店舗の階層に販売員や製品別に売上を整理したキューブを含めるなどです。実際には、データ・アナリストは最適な分析とパフォーマンスを実現するために、必要な階層のみを含むOLAPキューブを作成します。

ドリルダウン

ドリルダウン操作は、概念階層の下方に移動するか、キューブに新しい次元を追加するかの2つの方法のうちの1つによって、あまり詳細でないデータをより詳細なデータに変換します。例えば、組織の暦四半期または会計四半期の売上データを表示している場合、「時間」の次元の概念階層を下方に移動することで、ドリルダウンして各月の売上を見ることができます。

ロールアップ

ロールアップはドリルダウン機能の反対です。概念階層の上方へ移動するか、次元の数を減らすことによって、OLAPキューブ上のデータを集約します。例えば、各市ではなく各国のデータを表示することで、「場所」の次元の概念階層を上方に移動することができます。

スライスとダイス

スライス操作は、メインのOLAPキューブから単一の次元を選択することで、サブキューブを作成します。例えば、組織の最初の会計四半期または暦四半期(時間の次元)のすべてのデータを強調表示することで、スライスを実行できます。

ダイス操作は、メインのOLAPキューブ内の複数の次元を選択することで、サブキューブを分離します。例えば、組織の暦四半期または会計四半期(時間の次元)と米国およびカナダ(場所の次元)のすべてのデータを強調表示することで、ダイス操作を実行できます。

ピボット

ピボット機能では、現在のキューブの表示を回転させて、データの新しい表現を提示し、データを動的に多次元表示できるようにします。OLAPピボット機能は、Microsoft Excelなどのスプレッドシート・ソフトウェアのピボット・テーブル機能に相当します。しかし、Excelのピボット・テーブルが難しいのに対して、OLAPピボットは使用が比較的簡単で(専門知識がそれほど必要ない)、応答時間と照会パフォーマンスがより迅速です。

MOLAPとROLAPとHOLAP

多次元OLAPキューブと直接機能するOLAPは、多次元OLAPMOLAP )と呼ばれます。 さらに、ほとんどの用途において、MOLAPは多次元データ分析の最速かつ最も実用的なタイプです。

ただし、その他に2つの種類のOLAPがあり、場合によってはそちらの方が適していることがあります。

ROLAP

ROLAP関係OLAP)は、データを最初にキューブに再編成せずに、リレーショナル表のデータを直接操作する多次元データ分析です。

前述のように、SQLは多次元の照会、レポート、分析に完全に対応できるツールです。しかし、必要なSQL Queryは複雑で、パフォーマンスは遅くなる可能性があります。結果として得られるデータの表示は静的で、データの異なる表示をするために回転させることはできません。ROLAPは、大量のデータを直接処理する能力がパフォーマンスや柔軟性よりも重要である場合に最適です。

HOLAP

HOLAPハイブリッドOLAP )は、単一のOLAPアーキテクチャー内のリレーショナル・データベースと多次元データベースの間で作業の最適な分割を行おうとするものです。リレーショナル表には大量のデータが含まれ、OLAPキューブは集計と推論的な処理に使用されます。HOLAPには、MOLAPとROLAPの両方をサポートするOLAPサーバーが必要です。

HOLAPツールはデータ・キューブからリレーショナル表に「ドリルスルー」することができます。これは迅速なデータ処理と柔軟なアクセスへの土台となります。このハイブリッド・システムは、優れた拡張性を提供できますが、リレーショナル・データ・ソースにアクセスする際に常に生じる遅延を避けることはできません。また、その複雑なアーキテクチャーでは通常、より頻繁な更新と保守が必要になります。リレーショナル・データベースと多次元データベースからのすべてのデータを保管して処理しなければならないためです。この理由により、HOLAPは結局さらに高価になってしまうことがあります。

OLAPとOLTP

オンライン・トランザクション処理OLTP)は、トランザクション指向のデータとアプリケーションに焦点を当てた、データ処理のメソッドとソフトウェアを指します。

OLAPとOLTPの間の主な違いは、名前にあります。OLAPは本質的に分析を意味し、OLTPはトランザクションを意味します。

OLAPツールは、トランザクション・データと履歴データの両方を含むデータ・ウェアハウス内のデータの多次元分析を行うように設計されています。実際、OLAPサーバーは通常、データウェアハウジング・ソリューションの中央の分析層です。OLAPの一般的な用途には、データ・マイニングやその他のビジネス・インテリジェンス・アプリケーション、複雑な解析計算、予測シナリオのほか、財務分析、予算編成、予測プランニングのようなビジネス・レポート作成機能があります。

OLTPは、最近のトランザクションをできるだけ迅速かつ正確に処理してトランザクション指向のアプリケーションをサポートするように設計されています。OLTPの一般的な用途には、ATM、電子商取引ソフトウェア、クレジット・カード決済システム、オンライン予約、予約システム、記録管理ツールなどがあります。

この2つのアプローチの違いについて詳しくは、「OLAP vs. OLTP: What's the Difference?」を参照してください。

OLAPとクラウド・アーキテクチャー

OLAPは、企業のデータを多次元分析のための最も実用的な形式に変換することにより、企業がデータを最大に活用できるようにします。これにより、次には、価値あるビジネス洞察を判別するのが容易になります。しかし、これらのシステムが社内のみに保持されると、拡張の可能性は制限されます。

クラウド・ベースのOLAPサービスは、安価でセットアップが容易なため、中小企業やスタートアップ企業にとって予算の面で魅力的です。企業は、超並列処理(MPP)の使用により比類のないスピードで高度な分析を実行する、クラウド・ベースのデータ・ウェアハウスの広大な可能性を活用できます。そのため、企業はクラウドのスピードと規模でOLAPを使用し、クラウド・データ・ウェアハウスからデータを移動せずに膨大な量のデータを分析できます。

Constance Hotels, Resorts & Golfは、インド洋の島々に9つの施設を持つ高級ホテル・グループです。しかし、島と島の間の通信が欠如していることにより、ビジネス・データが各リゾートに隔離され、組織的なサイロ状態になっていました。同組織はクラウド・データ・ウェアハウスと分析アーキテクチャーを構築して、オンプレミスのシステムやツールをすべて、クラウド・ベースの中央データ・リポジトリーにリンクしました。これを行う際に、同社は、高度な予測分析を活用してOLAPシステムを実装するために必要なグループ全体にわたる洞察を取得しました。

クラウド・アーキテクチャー内のOLAPは、将来を見据えて構築された、迅速かつ費用対効果の高いソリューションです。キューブが作成されると、チームは既存のビジネス・インテリジェンス・ツールを使用して即座にOLAPモデルに接続し、クラウド・データから対話式にリアルタイムで洞察を引き出すことができます。

関連ソリューション
IBM Db2 Warehouse on Cloud

IBM Db2 Warehouse on Cloudは、マネージド・パブリッククラウド・サービスです。IBM Db2 Warehouseは、オンプレミスでハードウェアに、あるいはプライベートクラウドにセットアップできます。

IBM Db2 Warehouse on Cloudの詳細はこちら
キュービング・サービス

IBM DB2 Warehouseは、動的ウェアハウジングを提供し、データ・ウェアハウスに対するOLAPの直接サポートを提供することで、データ・ウェアハウス環境を統合して簡素化します。

キュービング・サービスの詳細はこちら
参考情報 AIに最適なデータ・ウェアハウスを選択する方法

データを洞察に変えることで、イノベーションを加速し、ビジネスの成果を早期に実現します。

OLAP vs. OLTP: What’s the Difference?

これらの用語はしばしば混同されがちですが、その主な違いとは何でしょうか。そして自分の状況に合ったものを選ぶにはどうすればよいでしょうか。

次のステップ

オープンなデータレイクハウス・アーキテクチャー上に構築された、目的に合ったデータ・ストアであるIBM watsonx.dataを使用すれば、あらゆるデータのAIワークロードをどこにでも拡張できます。

watsonx.dataの詳細はこちら デモの予約