IBM InfoSphere® QualityStage® 旨在支持您的数据质量和信息治理计划。它使您能够调查、清理和管理数据,帮助您维护关键实体(包括客户、供应商、位置和产品)的一致视图。该解决方案可帮助您为大数据、商业智能、数据仓库、应用程序迁移和主数据管理项目提供高质量的数据。也可用于 IBM System z®。
提供的功能包括数据剖析、标准化、概率匹配和丰富数据
作为完整信息集成平台的一部分提供数据质量功能
支持跨组织功能以支持您的信息治理策略
将数据集成、质量和可用性嵌入数据湖环境中,以加速探索并释放洞察分析。
最有效的现代化方法之一是将 EDW 数据和 ETL 工作负载卸载到 Apache Hadoop 数据湖。
利用深入的数据剖析和分析,了解表格和文件的内容、质量和结构。这包括列分析、数据分类、数据质量评分、关系分析、多列主键分析和重叠分析。
在转换数据时以及将其加载到数据仓库、数据湖或应用程序之前,通过运行数据质量规则来控制“坏”数据的摄取。使用超过 200 个内置规则将数据路由到要修复数据的正确人员,以确保数据可信。
识别个人身份信息 (PII)、敏感数据和其他类别数据的存储位置。您还可使用 250 多种内置数据类(包括信用卡、纳税人 ID 和美国电话号码)来识别某一列中所含数据的类型。支持创建和自定义三种数据类:有效值列表、正则表达式 (regex) 和 Java 类。
将来自不同来源的所有数据转换为目标环境的通用格式或标准。删除重复项并将多个系统合并到单个视图中,以创建可信的准确数据。
利用按数据规则列出的运行状况摘要报告,该报告还显示与信息治理无关的规则,以支持启用异常管理的数据规则。
利用灵活的部署选项和订阅定价,过渡到私有云或公有云。您可以扩展本地部署容量或直接迁移到云。缩短价值实现时间,降低管理成本并降低风险订阅定价。
通过使用列名和数据类别为给定列分配并建议术语,利用机器学习加速元数据分类过程(自动标记)。