换句话说,数据智能可帮助组织回答有关其数据核心问题,包括:
组织拥有哪些数据?为什么会存在这些数据?
这些数据从何而来,又位于何处?
谁在使用数据?他们如何使用它,以及他们应该如何使用它以获得最佳结果?
不同的数据集如何相互关联?
数据智能通过使用一组相互关联的流程和工具来自动执行并简化元数据管理、数据发现、数据治理、质量保证、数据分析和其他活动,从而回答了这些问题。
根据 IBM 数据差异化因素的数据,多达 68% 的企业数据从未被分析过。由于触手可及的数据量庞大,组织可能难以应用质量控制和实施治理策略。用户无法始终为他们的工作找到合适的数据,甚至可能不知道这些数据何时存在。
数据智能的出现是为了解决这一问题,它将现有工具(如数据目录、数据沿袭解决方案、数据市场、人工智能 (AI) 和机器学习 (ML))整合到单个综合的过程中。
这个统一流程使组织能够更深入地洞察其数据并了解从中获取最大价值的方法。通过这种方式,DI 可以实现自助服务分析,并支持商业智能和生成式 AI 等关键举措。
数据管理是一门广泛的学科,它监督从创建到处置的整个数据生命周期。数据管理涉及收集、存储和处理数据的实用性,而数据智能则涉及对数据的理解。
数据智能与数据管理相辅相成,为组织提供所需的洞察分析,使其能够在采集、保护、清理和共享数据方面做出更明智的选择。
自从 Web 2.0 问世和云计算兴起以来,各组织一直在从更多数据源(网络应用程序、业务系统、物联网设备)收集更多数据(客户数据、运营数据、交易数据)。生成式 AI 的诞生只会增加所有这些数据的价值和数量。
管理这些数据(跟踪其使用方式和变化情况、安全地进行存储、简化访问、使其保持干净和最新)可能十分困难。如果数据管理不当,数据消费者便很难找到他们所需的数据,更遑论从中获得可操作的洞察信息。
组织长期以来一直具备管理数据的能力,包括映射端到端数据生命周期的数据沿袭工具、定义使用策略的治理工具、数据分析和清理工具等等。然而,这些能力往往是零散的,分散在不同的产品和功能中。
数据智能学科的主要创新是将这些工具与先进的 AI 和 ML 技术结合在单个平台或紧密集成的数据堆栈中。
IDC 表示,当前的许多数据智能平台都是从数据目录工具发展而来的。自 2020 年以来,供应商越来越多地将其目录与辅助解决方案(例如数据沿袭工具和数据市场)捆绑在一起,或者将这些功能直接构建到其目录中。1
数据智能是一个发展中的领域,不同的供应商和从业者对该学科提出了自己的看法。不过,大多数人都认为数据智能包括五项核心功能:
数据沿袭是随着时间的推移跟踪数据流的过程。它能让我们清楚地了解数据的来源、变化情况及其在数据管道中的最终目的地。
数据沿袭可帮助用户了解数据在整个生命周期中如何变化,从而使企业数据更加可靠。它还可以帮助组织检测错误、识别依赖关系并预测数据集的更改如何影响更广泛的企业运营和 IT 系统。
一些供应商提供数据智能平台,将各种特性和功能结合到一个解决方案中。其他公司则提供互补解决方案的集成组合。无论哪种情况,大多数数据智能计划背后的基本技术工具包括:
数据沿袭工具自动映射数据流、转型和依赖关系,提供对数据生命周期的关键洞察分析。数据沿袭解决方案使组织能够了解数据的来源、数据如何在企业 IT 生态系统中移动、如何变化以及数据消费者如何使用它。
AI 和 ML 工具、新型生成式 AI 应用程序和大型语言模型 (LLM) 有助于将数据智能实践提升到超越传统数据管理的范畴。无论是作为独立解决方案还是内置于其他工具中,AI 和 ML 都可以自动丰富数据和元数据,简化数据挖掘并实现高级 AI 数据管理。
例如,集成式 LLM 可自动生成和更新数据目录中的元数据,从而提供更多便于用户理解的解释,以便更多利益相关者能更轻松地访问数据。由 LLM 提供支持的自然语言界面可让用户无需使用结构化查询语言 (SQL) 或其他专用语言即可查询数据集和揭示数据洞察信息。
AI 工具还可以帮助执行治理政策和质量控制,例如通过发现和分类敏感数据或识别重复的数据集。
数据湖、数据仓库和湖仓一体是具有不同特性和功能的数据管理与存储解决方案。
数据仓库汇总、清理和准备数据,以便用于商业智能和数据分析工作。
数据湖以低成本存储大量原始数据。
湖仓一体将湖的灵活数据存储和仓库的高性能分析功能结合到一个解决方案中。
数据仓库、数据湖和湖仓一体使组织能够将来自不同来源的数据汇集到集中的仓库中,实现对据整合工作的支持。通过它们还可以更轻松地访问和使用数据,以供分析、BI、AI、ML 和数据科学应用程序使用。
数据智能可帮助组织:
通过全面的数据目录、数据沿袭工具和积极的元数据管理,了解他们的数据。
通过可搜索的数据目录、集成数据存储和集中式数据产品中心促进数据访问。
通过自动更新的元数据、数据剖析和清理来确保数据质量。
通过既定的治理策略和数据产品中心(托管着用于特定用途的精选资产)来指导数据的使用。
因此,组织可以获得诸如以下的优点:
数据智能通过为用户提供理解和使用企业数据所需的洞察分析来促进数据素养并实现自助分析。所有级别和所有角色的利益相关者都可以使用数据做出更明智的决策。
IBM 数据差异化因素报告称,82% 的企业会遭遇阻碍关键工作流程的数据孤岛。数据智能有助于通过集中、统一的数据目录和市场消除这些孤岛并降低数据基础设施的复杂性。
整个组织的用户都可以找到适合其目的的正确数据,从而提升运营效率并促进协作。
据 Gartner 称,由于数据质量低下,组织平均会损失 1,290 万美元。2通过数据沿袭、数据分析与治理工作,数据智能可保持高水平的数据质量,因而组织可从其数据中获取更多价值。
数据智能将治理框架集成到关键数据访问点,例如数据目录和数据市场。这有助于确保数据消费者仅将数据用于授权目的,防止黑客攻击、盗窃、滥用和不合规行为。治理对于金融和医疗保健等受到高度监管的行业尤为重要。
根据 IBM 商业价值研究院的数据,表现最佳的 CEO 中有 72% 认为拥有最先进的生成式 AI 工具可以为组织带来竞争优势。先进的生成式 AI 需要大量高质量、易于获取的数据。
数据智能有助于提高数据质量、促进访问和执行治理政策,确保数据仅用于正确的目的,这是负责任 AI 的核心部分。
数据智能的一个特殊用例是在 AI 模型领域。模型智能是指理解、管理和治理组织产品组合中各种 AI 和 ML 模型生命周期的实践。
当今,许多组织并不依赖单一模型,而是使用多种模型来实现不同的目的。数据智能计划为组织提供了所需的透明度,使其能够以正确的理由为正确的模型选择正确的数据。
具体而言,数据智能可以帮助组织从治理角度(这些数据是否被授权用于该模型?)以及适用性角度(此数据是否准确且与此模型足够相关?)选择正确的数据
此外,许多供应商正在将模型管理功能纳入其数据智能产品。例如,一些数据目录正在引入模型目录功能,允许它们以盘点企业数据的相同方式盘点组织的 AI 和 ML 模型。
数据智能是一种了解组织所拥有的数据的方式,即数据的定义特征、如何访问以及如何使用。数据分析、数据科学和商业智能是使用这些数据的方式。
数据科学是一门结合了数学、统计学、编程、高级分析、AI、ML 和主题专业知识的专业学科。
商业智能 (BI) 是指人们用来收集、管理和分析企业数据以便为业务运营提供信息的工具和技术。
数据智能通过帮助用户更好地理解和使用其组织的数据集来促进数据分析、数据科学和 BI。当用户知道组织拥有什么类型的数据以及这些数据可作什么用途时,他们可以更轻松地连接到适合其目的的正确数据集。
例如,数据科学家可以找到高质量、合规的数据来培训机器学习算法;BI 用户可以找到针对其特定领域专门编制的数据集。
所有链接均为 ibm.com 外部链接。
1 IDC MarketScape: Worldwide Data Intelligence Platform Software 2024 Vendor Assessment,IDC,2024 年 11 月。
2 Data Quality: Best Practices for Accurate Insights,Gartner。
IBM 在 2024 年 Gartner 数据集成工具魔力象限报告中连续第 19 年被评为领导者。
了解为什么 AI 驱动的数据智能和数据集成对于推动结构化和非结构化数据的准备工作和加速实现 AI 成果至关重要。
了解将湖仓一体战略集成到数据架构中的强大功能,包括优化工作负载的成本、扩展 AI 和分析,以及随时随地使用所有数据。
深入了解数据领导者指南,了解如何构建数据驱动型组织和推动业务优势。
IBM web domains
ibm.com, ibm.org, ibm-zcouncil.com, insights-on-business.com, jazz.net, mobilebusinessinsights.com, promontory.com, proveit.com, ptech.org, s81c.com, securityintelligence.com, skillsbuild.org, softlayer.com, storagecommunity.org, think-exchange.com, thoughtsoncloud.com, alphaevents.webcasts.com, ibm-cloud.github.io, ibmbigdatahub.com, bluemix.net, mybluemix.net, ibm.net, ibmcloud.com, galasa.dev, blueworkslive.com, swiss-quantum.ch, blueworkslive.com, cloudant.com, ibm.ie, ibm.fr, ibm.com.br, ibm.co, ibm.ca, community.watsonanalytics.com, datapower.com, skills.yourlearning.ibm.com, bluewolf.com, carbondesignsystem.com