IBM InfoSphere QualityStage

データを調査、クレンジング、管理して、情報資産の価値を高めます

暗い背景に紫の球形

データ品質の創出とモニタリングに役立つ豊富な機能を提供

IBM InfoSphere QualityStageは、データ品質と情報ガバナンスの取り組み支援を目的として設計されており、データの調査、クレンジング、管理を可能にして、お客様、ベンダー、ロケーション、製品などの主要エンティティにおける視点の一貫性維持に役立ちます。このソリューションは、ビッグデータ、ビジネス・インテリジェンス、データ・ウェアハウジング、アプリケーション移行、およびマスター・データ管理といった各種プロジェクトに高品質のデータを提供するのに役立ちます。IBM System zでも使用できます。

Gartner社のレポートを読む
良質なデータ

データのプロファイリング、標準化、確率的マッチング、エンリッチメントなどの機能を提供します。

統合されたプラットフォーム

完全な情報統合プラットフォームの一部としてデータ品質機能を提供します。

情報ガバナンス支援

組織間で機能を使用できるようにして、情報ガバナンス・ポリシーをサポートします。

機械学習によるビジネス用語の自動割り当て

特定の列への用語割り当てと提案に列名とデータ・クラスを使用して、機械学習によるメタデータ分類プロセス(自動タグ付け)を加速します。

主な機能

詳細なデータ・プロファイリング

データを詳細にプロファイリング・分析することで、テーブルとファイルの内容、品質、構造を理解します。例として、列分析、データ分類、データ品質スコア、関係分析、複数列主キー分析、重複分析が挙げられます。

200以上のデータ品質ルールを標準装備

データの変換中、およびデータ・ウェアハウス、データレイク、またはアプリケーションにデータを読み込む前に、データ品質ルールを実行することで、「不良」データの取り込みを防止します。標準装備されている200以上のルールを使用して、データを適任者に転送し、確実に修正を加えて信頼できるデータにします。

250以上のデータ・クラスを標準装備

個人を特定できる情報(PII)、機密データ、およびその他のクラスのデータが保存される場所を特定します。また、クレジットカード、納税者番号、米国の電話番号など、標準装備されている250以上のデータ・クラスを使用して、列に含まれるデータ型も識別します。有効な値のリスト、正規表現(regex)、Javaクラスの3種類のデータ・クラスを作成およびカスタマイズできます。

データの標準化とレコードの照合

さまざまなソースから収集された全データをターゲット環境の共通形式または標準に合成します。重複を削除し、複数のシステムを統合ビューにまとめて、信頼できる正確なデータを作成します。

標準装備のガバナンス

データ・ルール別健全性概要レポートを利用すると、情報ガバナンスにリンクされていないルールも表示されます。この仕組みには、例外を管理するためにデータ・ルールを有効にするケースに対応する目的があります。

オンプレミスまたはクラウドへのデプロイメント

柔軟な導入オプションとサブスクリプション価格で、プライベートクラウドまたはパブリッククラウドに移行できます。オンプレミスの容量を拡張したり、クラウドに直接移行したりできます。価値実現までの時間短縮、管理コストの削減、サブスクリプション料金体系のリスク軽減に役立ちます。

詳細なデータ・プロファイリング

データを詳細にプロファイリング・分析することで、テーブルとファイルの内容、品質、構造を理解します。例として、列分析、データ分類、データ品質スコア、関係分析、複数列主キー分析、重複分析が挙げられます。

200以上のデータ品質ルールを標準装備

データの変換中、およびデータ・ウェアハウス、データレイク、またはアプリケーションにデータを読み込む前に、データ品質ルールを実行することで、「不良」データの取り込みを防止します。標準装備されている200以上のルールを使用して、データを適任者に転送し、確実に修正を加えて信頼できるデータにします。

250以上のデータ・クラスを標準装備

個人を特定できる情報(PII)、機密データ、およびその他のクラスのデータが保存される場所を特定します。また、クレジットカード、納税者番号、米国の電話番号など、標準装備されている250以上のデータ・クラスを使用して、列に含まれるデータ型も識別します。有効な値のリスト、正規表現(regex)、Javaクラスの3種類のデータ・クラスを作成およびカスタマイズできます。

データの標準化とレコードの照合

さまざまなソースから収集された全データをターゲット環境の共通形式または標準に合成します。重複を削除し、複数のシステムを統合ビューにまとめて、信頼できる正確なデータを作成します。

標準装備のガバナンス

データ・ルール別健全性概要レポートを利用すると、情報ガバナンスにリンクされていないルールも表示されます。この仕組みには、例外を管理するためにデータ・ルールを有効にするケースに対応する目的があります。

オンプレミスまたはクラウドへのデプロイメント

柔軟な導入オプションとサブスクリプション価格で、プライベートクラウドまたはパブリッククラウドに移行できます。オンプレミスの容量を拡張したり、クラウドに直接移行したりできます。価値実現までの時間短縮、管理コストの削減、サブスクリプション料金体系のリスク軽減に役立ちます。

ユースケース

紫色のデータレイクのアイソメトリック図

データレイク・ガバナンス

データの統合、品質、可用性をデータレイク環境に組み込んで、解明プロセスを加速し、インサイト活用の道を開きます。

紫色のデータウェアハウスのアイソメトリック図

エンタープライズ・データ・ウェアハウス(EDW)のオフロード

モダナイゼーション手法の中でも特に効果的な一例として、EDWデータとETLワークロードをApache Hadoopデータレイクにオフロードすることが挙げられます。

関連製品

データ・インシデントを迅速に検知して解決

データ・オブザーバビリティーにより、すべてのデータ・インシデントを1か所でアラート、対応、解決します。

IBM BigQuality

Hadoopのビッグデータ・ストレージ・クラスターに、データ品質、プロファイリング、クレンジング、モニタリング用の豊富な機能一式を提供します。

IBM Knowledge Catalog

ガバナンス・プラットフォームと統合されたエンタープライズ・データ・カタログで、データ・シチズンがビジネスにすぐに使えるデータを迅速に発見、キュレート、分類、管理、分析、共有するのに役立ちます。

IBM InfoSphere Information Server for Data Quality

統一された環境でデータをクレンジングし、データ品質を監視します。

次のステップ

専門家による成功に役立つ参考情報はこちら

その他の参考情報 サポート コミュニティー データ分析コンサルティング・サービス