データ統合とは

執筆者

Phill Powell

Staff Writer

IBM Think

Ian Smalley

Staff Editor

IBM Think

データ統合とは

その名が示すとおり、データ統合とは、さまざまなソースからデータを収集し、単一の場所にまとめることを意味します。データ統合により、ユーザーは単一のアクセスポイントからデータを利用できるようになり、データのインサイト生成が促進されます。

データは、あたかもデータの各単位が構造と目的において同一であるかのように、情報の集合体として単に「データ」と呼ばれることがよくあります。しかし、現実は大きく異なります。組織にとってのデータは、ショッピングカートにリンゴがいっぱい入っているような状態ではありません。むしろ、そのカートは大部分またはほとんどが異なる形式（リンゴ、バナナ、オレンジなど）のデータでいっぱいなのです。

一般的なデータ駆動型組織は、多数のデータ・ソースからのさまざまな種類のデータに依存していますが、先進的な企業はデータ統合ツールを使用して、情報が満載のデータ・ウェアハウスをより効率的に処理し始めています。

情報は未加工データとして始まりますが、企業はその情報にデータ分析を適用し、ビジネス・インテリジェンスに関する洞察を導き出すことができます。現時点では、そのデータ分析をビジネス上の意思決定に効果的に導入できるかどうかは組織の責任ですが、少なくとも企業はより完全かつ即時のデータ・アクセスが可能になり、意思決定に役立つ情報を得ることができるようになります。

The DX Leaders

「The DX Leaders」は日本語でお届けするニュースレターです。AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。

データ統合のメリット

データ統合（データ・インテグレーションとも呼ばれます）には、いくつかの重要な利点があります。

より良い意思決定

全体的な影響という点では、データ統合の最大の長期的なメリットは、全担当者に関連データを提供することによって、すべての部門と機能にわたって、組織全体の意思決定プロセスを促進できることでしょう。データ統合によって、収集した顧客データ全体を分析し、メトリクスに基づいた行動が決定できるようになるので、企業が顧客とより良い関係を築くのにも役立ちます。

コスト縮小

組織の全データを一元的に収集することのもう1つの利点は、社内の非効率性を明らかにするデータ分析への扉を開くことです。社内の非効率性を放置しておくのは、罰金を払っているようなものです。非効率性を軽減することは、コスト削減につながります。また、統合プロセスによってデータ品質が向上するため、情報システムの稼働がより確実になります。

時間の節約

見過ごされがちなことですが、企業が収集したさまざまなデータ資産の中から必要な情報を検索するために、従業員はどれだけの時間を費やしているでしょうか。データ資産を見つけるのが難しい場合、余分な時間がかかります。その対策案がこちら。時間のかかるタスクを削減できるデータ・ウェアハウスなどの１か所の中央リポジトリー内にデータをすべて格納するのです。

緊急時の対応

データ統合と結び付けられることはあまりないですが、組織のデータが中央レポジトリーにあり、そのデータが処理されクリーニンアアップされていれば、災害復旧関連の緊急対応がよりスムーズに進む可能性が高いことは注目に値するでしょう。

データ統合の手法

データ統合プロジェクトに使用される手法は増え続けています。

ETL

最も重要なデータ統合技術は、ETL（抽出、変換、ロード）として知られる手法です。ETLプロセスは、ETLツールがデータ・ソースから情報を抽出することから始まります。そして、そのデータは標準的な情報フォーマットに変換されます。最後に、選択した宛先にデータがロードされます。

ELT

ETL戦略と対になる新たな戦略は、ELT（抽出、ロード、変換）と呼ばれます。ELTステップの再配置は非常に重要です。ELTでは、データは抽出され、一種のステージング領域にロードされます。組織内のさまざまなエンティティーがデータをさまざまな角度から研究し、最終的にデータを変換する間、データはここに残ります。

データウェアハウス

すべてのデータを集中リポジトリーで一元管理するのが現実的なアプローチです。さまざまなソース・システムからデータ・セットを受け入れるデータウェアハウスを使用することで、より高度なデータ・セキュリティーを実現できます。その後、ETLツールを使用してデータを自動化し、ウェアハウスに統合します。

データレイク

データ・ウェアハウジングは、データのクリーニングまたは処理に部分的に使用されます。一方、データレイクは、データ処理機能を一切提供しない単なるデータ・リポジトリーです。データレイクは基本的に、データを最も未加工の状態で保管する場所です。一般的に、企業が不明瞭なデータを保管するのはここです。

データ・マート

すべては規模の問題です。データウェアハウスは、すべてのデータを受け入れて保存するように設計されています。データ・マートとは、より焦点を絞った小規模なデータウェアハウスです。したがって、企業はデータウェアハウスを使用している一方で、社内の部門またはグループは、特定のニーズに特化したデータ・マートを持っている場合があります。

ハンド・コーディング

自動化の時代において、手作業によるコーディングは時代遅れに思えます。ただし、単純なデータ統合作業が必要となる状況は数多くあります。このような作業は、データ・エンジニアによる手作業のコーディングによって実行されます。エンジニアが作成するコードは、データを1つの場所に「囲い込む」のに役立ちます。

データ仮想化

企業が検討すべきもう1つのデータ統合ソリューションは、データ仮想化です。データは既存のサイロに留まり、各データ・ソースに追加された仮想化レイヤーを通じて表示されます。残念ながら、この方法には拡張性の低下などの制限があります。

IBM Storage FlashSystem

IBM Storage FlashSystem：VMwareのコスト、シンプルさ、レジリエンスを最適化

IBM FlashSystemがVMware環境を最適化して、コスト効率、シンプルさ、レジリエンスを実現する方法をご覧ください。このセッションでは、IBM FlashSystemがデータの安全性、アクセシビリティ、性能を強化し、最新のITインフラストラクチャーにとって理想的なソリューションにする方法に焦点を当てます。

IBM Storage FlashSystemはこちら

参考情報

データ・セキュリティーの習得：重要な情報の保護

データ・セキュリティーの要点と、組織にとって最も価値ある資産であるデータを保護する方法はこちら。新たなサイバー脅威から機密情報を保護するのに役立つさまざまな型やツール、戦略についてご確認ください。

サイバー脅威に備える：レジリエンスを再定義するストレージ戦略

このオンデマンドWebセミナーでは、巧妙化するサイバー攻撃に備えるための革新的な戦略と、組織全体のレジリエンスを高めるための実践的なアプローチをご紹介します。データ保護とビジネス継続性を両立するための第一歩として、ぜひご視聴ください。

IBMのストレージ・ソリューションでデータとAIワークロードを最適化

データ・セキュリティーと拡張性を確保しつつ、AIや機械学習、分析プロセスを強化できるように設計された高性能のファイル・ストレージとオブジェクト・ストレージを使用して、データの課題を克服する方法をご確認ください。

フラッシュ・ストレージ技術でパフォーマンスを最大化

フラッシュ・メモリーとストレージの種類について学び、企業がフラッシュ・テクノロジーをどのように活用して効率を向上させ、レイテンシーを削減し、将来を見据えたデータ・ストレージ・インフラストラクチャーを導入しているかをご覧ください。

IBM FlashSystemを用いたサイバー・レジリエンスの強化

IBM FlashSystemがデータ・セキュリティーとレジリエンスをどのように向上させ、最適化された性能とリカバリー戦略でランサムウェアやサイバー攻撃からの保護を実現できるかをご確認ください。

データ統合とは

執筆者

データ統合とは

The DX Leaders

データ統合のメリット

データ統合の手法

ETL

ELT

データウェアハウス

データレイク

データ・マート

ハンド・コーディング

データ仮想化

IBM Storage FlashSystem：VMwareのコスト、シンプルさ、レジリエンスを最適化

最近の動向

参考情報