データファブリックとは何ですか?

執筆者

Alexandra Jonker

Staff Editor

IBM Think

Tom Krantz

Staff Writer

IBM Think

データファブリックとは何ですか?

データ・ファブリックは、組織全体でデータ・アクセスを民主化するために設計された最新のデータ・アーキテクチャーです。インテリジェントで自動化されたシステムを使用して、大規模にサイロを取り除き、データ資産を管理し、データ管理を最適化します。

過去10年間、ハイブリッドクラウド、人工知能、モノのインターネット（IoT）、エッジコンピューティングの進歩により、ビッグデータが指数関数的に増加しました。この急増により、膨大な量のデータが異種の事業単位に散在し、ますます複雑なデータ環境が構築されています。

IBM Institute for Business Value（IBV）が2025年に行った調査によると、CEOの50%が、最近の投資のペースにより組織内のテクノロジーが分断されていると述べています。その結果、データサイロ、セキュリティリスク、意思決定のボトルネックなどの課題を克服するために、データの統合とガバナンスが重要になりました。

データ・ファブリックは、機械学習（ML)、アクティブ・メタデータ、アプリケーション・プログラミング・インターフェース（API)、およびその他のテクノロジによってサポートされる、統合されたエンド・ツー・エンドのデータ管理を提供します。

これはソフトウェアではなく、データレイク、データウェアハウス、SQL Database、およびその他のソースから、組織のオンプレミスおよびマルチクラウド環境全体のデータの統合ビューを作成する、設計上のアプローチです。このアプローチでは、組織は分散したデータを単一の場所やデータ・ストアに移動する必要はなく、完全に分散化されたアプローチを取る必要もありません。

これらのコア機能は、データ・サイロと増大するデータ量に対処するだけでなく、ビジネス・ユーザー向けのシンプルなセルフサービス・データ・アクセスも可能にします。その結果、リアルタイム・データと高品質の履歴データのネットワークが実現し、企業全体のデジタル・トランスフォーメーションとBusiness Intelligence（BI）イニシアチブが加速されるとともに、自動化されたガバナンスによって安全でコンプライアンスに準拠したデータストラテジーが確保されます。

データ・ファブリックはどのよう場面で使用されますか？

多くの組織では、（構造化データ、半構造化データ、および非構造化データを含む）爆発的なデータ増加により、従来のデータ管理アプローチでは手に負えなくなっています。この課題は、データウェアハウス、データレイク、ハイブリッドクラウド環境の急拡大によってさらに深刻化します。

これらのストレージ・システムは通常、大量のデータ向けの低コストのソリューションとして活用されます。しかし、多くの場合、適切なメタデータ管理が欠如しており、データの検索、解釈、および効率的な使用が困難になっています。

サイロ化されたデータにより、この複雑さはさらに増します。これまで、企業には人事、サプライチェーン、顧客情報用に個別のデータ・プラットフォームがあり、データの種類やニーズが重複しているにもかかわらず、それぞれが独立して運用されていることがありました。

これらの課題は、ダーク・データ、つまり放置され、信頼できないとみなされ、最終的には使われない情報が大量に蓄積される事態を招きます。実際、企業データの60%は分析されていないと推定されています。¹

企業はこうした課題に対処するために、データ・ファブリックを利用しています。最新のアーキテクチャは、データを統合し、ガバナンスを自動化し、セルフサービス・データ・アクセスを大規模に実現します。データ・ファブリックは、異種のシステム間でデータを接続することで、意思決定者がこれまで隠されていた接点を発見し、他の方法では使用されなかったデータからより価値のあるビジネス成果を導き出せるようにします。

データ・ファブリック・ソリューションは、民主化や意思決定の利点だけでなく、エンタープライズAIワークフローにおいて不可欠であることも証明されています。IBM IBVが2024年に行った調査によると、CFOの67%が、自社の経営幹部が新しいテクノロジーを迅速に活用するために必要なデータを保有していると回答しています。しかし、テクノロジー・リーダーのうち、自社のデータが生成AIを効率的に拡張するために必要な品質、アクセス性、セキュリティを備えていると強く同意しているのはわずか29%です。

データ・ファブリックを使用することで、組織は、ガバナンスとプライバシーの要件が自動的に適用された状態で、AIシステムにデータを配信するための信頼できるデータ・インフラストラクチャーをより簡単に構築できます。

動画：エンタープライズAI向けのデータ戦略の構築

IBMニュースレター

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

データ・ファブリックの主な機能

データ・ファブリック・アーキテクチャーは、次のコア機能を通じて、データ・アクセス、統合、保護に対する障害を最小限に抑えます。

データ・カタログ
データ統合
データ・ガバナンスとセキュリティー
セルフサービスのデータ・アクセス
統合されたライフサイクル

データ・カタログ

データ・ファブリック・アーキテクチャーは、データ資産の詳細なライブラリであるデータ・カタログを活用します。これらのカタログは、アクティブ・メタデータ（ナレッジ・グラフ、セマンティクス、AIを使用）を使用してデータ資産をリアルタイムで整理し、ユーザーがユースケースに適したデータを迅速かつ簡単に見つけられるようにします。このメタデータは、分類法、所有権とアクティビティー情報、関連資産などを通じて、さまざまなデータに対するビジネス上の共通理解を可能にします。

データ統合

データ・ファブリックでは、データ統合プロセスによって、異種のデータ・ソースからのデータが統合され、一貫した構造に変換されて、分析や意思決定に利用できるようになります。この接続処理は、バッチ処理、リアルタイム・データ統合、変更データ・キャプチャ（CDC）などのさまざまな統合方式によって行われます。スマートな統合プロセスにより、ストレージ・コストを最小限に抑えながら性能を最大化できます。

データ・ガバナンスとセキュリティー

データ・ファブリックは、大規模なデータ・ガバナンスとデータ・セキュリティ・ポリシーを作成および適用するための統一された方法を提供します。たとえば、データアクセス制御は、ユーザー・グループやデータ分類などのメタデータを介して、機密データに簡単かつ自動的にリンクできます。データファブリックは、こうした信頼性が高く保護されたビジネス対応データを通じて、組織がAIを運用化できるようにサポートします。

セルフサービスのデータ・アクセス

データ・ファブリックは、データ消費のためのセルフサービス・マーケットプレイスとして機能します。データ・プロファイリングやメタデータ管理などの主要なガバナンス機能により、データ・エンジニア、データ・サイエンティスト、およびビジネス・ユーザーは、高品質なデータを迅速に検出し、アクセスし、共同作業を行うことができます。ユーザーはデータ資産を検索し、タグと注釈を付け、コメントを追加できます。成果として、IT部門への依存が大幅に減少します。

統合されたライフサイクル

データ・ファブリックには、データ・ファブリックのライフサイクル全体にわたるエンド・ツー・エンドの管理も含まれます。このアプローチでは、機械学習オペレーション（MLOps）とAIを活用することで、データ・パイプラインなどのデータ・ファブリック・アーキテクチャーのさまざまなコンポーネントの作成、構築、テスト、展開、最適化および監視のための統合されたエクスペリエンスを実現します。

IBMお客様事例

お客様のビジネス課題（顧客満足度の向上、営業力強化、コスト削減、業務改善、セキュリティー強化、システム運用管理の改善、グローバル展開、社会貢献など）を解決した多岐にわたる事例のご紹介です。

データ・ファブリックとデータ・メッシュ

データ・メッシュは、特定のビジネス・ドメイン（マーケティング、営業、カスタマー・サービスなど）ごとにデータを整理し、特定のデータセットの作成者により多くの所有権を提供する分散型データ・アーキテクチャです。

データ・ファブリックはデータ・メッシュと共存し、多くの場合、その機能を強化します。データ製品の作成やグローバル・ガバナンスの実施など、データ・メッシュの主要コンポーネントを自動化できます。

データ・ファブリックとデータ・メッシュについてさらに詳細を見る

データ・ファブリックとデータレイクハウス

データレイクハウスは従来のデータ管理プラットフォームの欠陥を解決することを目的として登場しました。データレイクの柔軟なデータ・ストレージ機能とデータウェアハウスの高性能分析機能を組み合わせたものです。

データ・ファブリックは、データレイクハウスやその他のデータ・プラットフォームの進化における次の段階と考えることができます。組織はこれによってデータ管理を簡素化し、レイクハウス・データへのアクセスを改善します。データ共有の促進、データの統合とガバナンスの自動化、セルフサービスのデータ消費のサポートなど、ストレージ・レポジトリーだけでは提供できない機能をサポートします。

データレイクハウス、データ・ファブリック、データ・メッシュの関係についての詳細はこちら

データ・ファブリックの仕組み

個々のデータ・ストレージ・システムとは異なり、データ・ファブリックはデータ環境全体に流動性を生み出し、データ・グラビティ―の問題（新しいデータの量が増えるにつれてデータの移動が困難になるという考え方）に対抗します。データ・ファブリックは、データの移動、トランスフォーメーション、統合に必要となる技術的な複雑さを解消し、すべてのデータを企業全体で利用できるようにします。

しかし、データ・ファブリックはどのようにしてこれを実現するのでしょうか。

データ・ファブリックは、一連のデータサービスを使用します。その仕組みを理解するにあたり、3つの基本的なコンポーネントであるデータ仮想化、フェデレーテッド・アクティブ・メタデータ、機械学習について調査することが有用です。

データ仮想化

データ仮想化により、データを物理的に移動することなくアクセスできるようになります。データ仮想化ツールは、従来のETL（抽出、変換、ロード）プロセスを用いる代わりに、さまざまなソースに直接接続し、必要なメタデータのみを統合します。次に、データが一元化されたリポジトリーにあるかのように、ユーザーがリアルタイムでデータを検索してアクセスできるようにする仮想データ層を作成します。

動画：データ・ファブリックにおけるデータ仮想化

フェデレーテッド・アクティブ・メタデータ

フェデレーテッド・アクティブ・メタデータにより、データがより見つけやすく、使いやすくなります。静的かつ手動でキュレートされるパッシブ・メタデータとは異なり、フェデレーテッド・アクティブ・メタデータは、セマンティック・ナレッジ・グラフとAI/MLテクノロジーを使用して、さまざまなシステムや形式のメタデータを継続的に分析し、パターンを検知し、データを統合します。

これらのシステムは、データのタグ付け、プロファイリング、分類を自動的に行うことができます。また、メタデータの変更に基づいてアラートやアクションをトリガーできるため、データ・エコシステムのレジリエンスと自己管理性が向上します。

機械学習

機械学習（ML）は、データ・ファブリック内の重要なプロセスを自動化し、高度でインテリジェントなデータ・アーキテクチャーへと変えます。MLを使用すると、ガバナンス・ポリシーを自動的に適用したり、リアルタイムの洞察を生成したり、セキュリティの脆弱性を検知したり、データ・リネージュを追跡したり、データ品質の問題を修正したりすることができます。

データ・ファブリック・アーキテクチャー

データ・ファブリックアーキテクチャーはビジネスニーズによって異なりますが、主要な機能については共通しています。Forrester社のEnterprise Data Fabric Enables DataOpsレポートによると、データ・ファブリックは通常、次の6つの基本コンポーネントで構成されます。²

データ管理：このレイヤーは、データ・ガバナンス、セキュリティ、品質を担当します。
データ取り込み：このレイヤーは、さまざまなソース（オンプレミスとクラウド・データの両方）からのデータをファブリックに結合します。
データ処理：このレイヤーは、データを変換、統合、クレンジングし、ビジネス全体のチームが使用できるようにします。
データ・オーケストレーション：このレイヤーは、さまざまなデータ・システム間でのデータの移動を管理し、データを使用できるようにします。
データ検出：このレイヤーは、データ・カタログとメタデータ管理を使用して、ユーザーがデータを簡単に見つけて理解できるようにします。
データ・アクセス：このレイヤーは、ダッシュボードやその他のデータ可視化ツールによるデータ消費を容易にし、適切な権限を保証します。

データ・ファブリックのメリットとは

データ・ファブリックには、全体的なデータ管理とアクセスの向上に加えて、次のようなビジネス上のメリットもあります。

効率の向上
データの民主化
リスクの低減
拡張性と俊敏性

効率の向上

複数のプラットフォームにわたるデータ・ガバナンス、統合およびその他のデータ・サービスを自動化することで、データ管理と分析が合理化されます。ボトルネックを減らすことで、企業は生産性を向上させ、ビジネス・ユーザーがより迅速に意思決定を行えるようにし、技術チームのワークロードを軽減できます。

さらに、インテリジェントな統合機能により、ストレージとコストを最小限に抑えながら性能を最適化できます。

データの民主化

データ・ファブリック・アーキテクチャーはセルフサービス・アプリを推進し、技術チームの枠を超えてデータ・アクセスを拡大します。ユーザーに組織データの統一されたビューを提供し、データの場所や、過去にサイロ化されていた程度に関係なく、接続を作成します。

リスクの低減

アクセス可能で可視化されたデータは、データのカタログ化とガバナンスの実施を非常に容易にします。データ・アクセスが拡大した結果、多くの場合、ガバナンスのガードレールが強化され、機密データのマスキングや暗号化など、データ・セキュリティーのアプローチも強化されます。

拡張性と俊敏性

データ・ファブリック・アーキテクチャーはモジュール式で、拡張性を備えています。また、水平方向（増え続けるデータ量に対応するため）と垂直方向（プロセスと性能の強化）の両方で拡張できます。

分析によるビジネス予測の改善に向けた4つのステップ

分析とビジネス・インテリジェンスを活用して、貴社と顧客に最大の利益をもたらす将来の成果を計画、予測、形成します。

参考情報

Gartner®社による予測（2024年）：AIがアナリティクス・ユーザーに与える影響

ABIソリューションの進化する状況について独自の洞察を提供し、データおよび分析のリーダーにとって重要な調査結果、仮定、推奨事項をご覧ください。

AI向けハイブリッド・オープン・データレイクハウス

データ・アクセスを簡素化し、データ・ガバナンスを自動化します。ワークロードのコスト最適化、AIと分析の拡張など、データレイクハウス戦略をデータ・アーキテクチャーに統合することで、あらゆるデータをあらゆる場所で利用できるようになります。

データの差別化要因

データ駆動型の組織を構築し、ビジネス上の優位性を推進するためのデータ・リーダー向けガイドはこちらです。

AIと分析の大規模なデータ管理

オープンなデータレイクハウス・アプローチがどのように信頼できるデータを提供し、分析とAIプロジェクトをより迅速に実行できるかをご覧ください。

AI、データ、分析戦略の連携を成功させる方法

4つの重要なステップで、データおよび分析戦略をビジネス目標に結び付けましょう。

採用率の低さを克服して賢明な決定を下す

ビジネス・インテリジェンスの課題がなぜ解決されないのか、そしてそれが組織全体のユーザーにとって何を意味するのかを詳しく見てみましょう。

脚注

¹ “The State of Dark Data,” Splunk, 2019

² “The Forrester Wave™: Enterprise Data Fabric, Q2 2022: The 15 Providers That Matter Most and How They Stack Up,” Forrester, 2020.

データファブリックとは何ですか?

執筆者

データファブリックとは何ですか?

データ・ファブリックはどのよう場面で使用されますか？

The DX Leaders

ご登録いただきありがとうございます。

データ・ファブリックの主な機能

データ・カタログ

データ統合

データ・ガバナンスとセキュリティー

セルフサービスのデータ・アクセス

統合されたライフサイクル

IBMお客様事例

データ・ファブリックとデータ・メッシュ

データ・ファブリックとデータレイクハウス

データ・ファブリックの仕組み

データ仮想化

フェデレーテッド・アクティブ・メタデータ

機械学習

データ・ファブリック・アーキテクチャー

データ・ファブリックのメリットとは

参考情報

脚注