データ・リーダーとして、結局のところ、データが提供する価値は、どこにデータがあったとしても適切な時期に適切なものを提供することであるのはおわかりでしょう。この能力はデータ戦略の一部として、最新のデータ・アーキテクチャーを実現しているかどうかに依存します。
目的に合ったデータ・アーキテクチャーとはビジネス・ニーズをデータやシステム要件に変換して、組織全体のデータの保護とフローを管理することです。 これはすべてに適用できる公式ではないことに注意してください。フレームワークはビジネス要件が主導すべきもので、短期的、長期的な目標の両方をサポートする必要があります。「単一で構造化された保存データ・アーキテクチャーの時代は終わりました」とIBM Expert Labsのデータ・エリート・アーキテクト、Paul Christensenは言います。 「現代のビジネスを推進するのは、動いているデータ、動かないデータ、いろいろな形式のデータ、品質と信頼性がさまざまなレベルのデータです。」
オンプレミス、クウラド両方にこれまでにないほどデータが分散しているので、ビジネスの特殊ニーズを満たして、データ分析を適用し、大規模にデータとAIを利用するためにデータ・アーキテクチャー・ソリューションが欠かせません。 今日のほとんどの組織にとって、最新データ・アーキテクチャーは単に選択可能なものではなく、緊急に必要なものなのです。
どうやってこうした特別なニーズを見つけ出して、ふさわしいテクノロジーを選択するのでしょうか。データ・トポロジーは実際のシナリオを分類、管理して、ユーザー、利用方法、制約、データ・フローを考慮して、将来的なニーズにも高い回復力を持つ最新データ・アーキテクチャーを構築するのに役に立ちます。
watsonxのご紹介
AI関連の最新情報の購読を申し込む
クラウド・モダナイゼーションの流行によって、必ずしも複雑さやコストが減少したり、データ・サイロがなくなったり、ガバナンスやコンプライアンスの管理が向上するわけではありません。実際には、調査によるとデータの68%は未使用になります。¹
データ・アクセスを単純化して、セルフサービスでのデータ消費を促進して、意志決定を改善するデータ・ファブリックを導入します。 データ・ファブリックには、組織内のデータに必要なデータ・フロー、プロセス、消費者をサポートするための適切なコントロールが含まれています。この最新データ・アーキテクチャーは、インテリジェントで自動化された機能を通じて、さまざまなデータ・パイプラインやクラウド環境のエンドツーエンドの統合方法を円滑なものにします。
データ・ファブリックの基盤となるのは、フェデレーテッド・アクティブ・メタデータで、これはたいていの場合、データを記述するデータと呼ばれています。データベースまたはデータ・ソースとターゲットも重要なコンポーネントです。これらのソースは、トランザクション処理、運用処理、ハイブリッド・トランザクション処理、分析処理、AI、 Business Intelligence、レポート作成、高度な分析など、必要なあらゆるワークロードをサポートする能力に基づいて選択する必要があります。
「お客様には、最大9種類のデータベースがあって、それぞれのデータベースには多数のインスタンスがあるかもしれません。データ・ファブリックは、お客様が管理しようとしているデータ・サイロや断片化したデータに秩序を与えます」と、IBMのデータベース・ポートフォリオのプロダクト・リーダー、Edward Calvesbertは述べています。
仮想化レイヤーを通じて、データ・ファブリックは、既存のシステム、データベース、データレイク、 データ・ウェアハウス、エッジ、インメモリ・リポジトリーなど、複数のソースからのリアルタイムデータをまとめます。これらのソースはトランザクション、運用、分析などのワークロードを実行しているかもしれませんし、構造化データ、非構造化データを保管しているかもしれません。このオーケストレーションでデータ関連のあらゆる場所が一元的に管理できます。
このエンドツーエンド機能で、データ・ファブリックによってさまざまなソースのデータをうまく組み合わせ、アクセス、管理できるので、ビジネス・ユーザー、データサイエンティスト、データ・エンジニア、データ・アナリストがデータを活用できます。また、さまざまな分野で大規模なイノベーションを可能にします。例えばAIでは、管理されたデータセットをAIアプリケーションに供給します。
ここまで話題にしてきたのはデータ・ファブリックです。しかしデータ主導アーキテクチャーとしてデータの広範な全社利用を合理化する別のアプローチ、データ・メッシュについてはどうでしょう。
データ・ファブリックとデータ・メッシュはどちらもアーキテクチャーの概念です。どちらもユースケース主導の設計になっていて、データの無秩序な増加、データ・ガバナンス、データの可用性という難問の解決を目指します。データ・ファブリックやデータ・メッシュの手法はどちらも継続的なデータ検出とセルフサービスのデータ・ナレッジ・カタログに依存しています。幸いにも、これらのデータ・アーキテクチャー概念は補完的なものになっています。
違いは何でしょう。データ・メッシュ・アーキテクチャーはドメイン固有でテクノロジーは依存せず、分析ユースケース向けの設計です。これに対して、データ・ファブリック・アーキテクチャーは運用と分析のユースケース向けの設計です。データ・ファブリックはすべてのデータ資産を一元的に見せますが、実際にはデータ・ストレージは分散、集中のどちらか、ないしは両者が混在しているでしょう。同様に、データ・ファブリック・アーキテクチャーは連合型から分散型まで複数の組織構造をサポートしています。最後に、データ・ファブリック・アーキテクチャーはAIと機械学習テクノロジーを利用して、データ検出、データ分類、ポリシー適用を自動化します。
1 Rethink Data: Put More of Your Business Data to Work – From Edge to Cloud (PDF、リンク先はibm.com外です)、 Seagate Technology、2020年7月。
2 “Data Integrity Trends: Chief Data Officer Perspectives in 2021 (リンク先はibm.com外です)。 Corinium、2021年6月18日。