简化、统一和连接您的所有数据
章 03
阅读时间 5 分钟
大多数组织都在处理不同来源的大量数据。 这些数据通常是孤立的,并且分散在多个云、数据存储、位置和供应商之间 — 使得访问数据对数据科学家、业务分析师和其他相关者来说既费时又复杂。
三分之一的企业将数据复杂性和数据孤岛视为实现AI 的首要障碍。1
解决如何在复杂、分散的环境中简化数据访问的问题,是为 AI 计划成功实施奠定坚实基础。
如想从数据中获取宝贵的业务洞察,必须确保任何用户或应用程序都能访问和关联数据。
如想从数据中获取宝贵的业务洞察,必须确保任何用户或应用程序都能访问和关联数据。
数据整合面临的挑战
许多组织都依赖于过时的数据架构,这些架构试图将分散且孤立的数据整合到数据仓库或数据湖中。 使用提取、转换和加载 (ETL) 过程将数据复制到单个数据存储中的整合方法既耗时又昂贵,会增加数据环境的复杂性。 大多数组织最终仍然拥有多个存储库。 因此,数据科学家一直在冗长的数据准备周期中挣扎,并且难以将数据组织到单一视图中。
统一数据环境,实现更轻松的访问和通用查询
data fabric是从架构角度应对这些挑战的方案,可帮助企业统一和简化 AI 信息架构,并使用户能够更快地访问所需的业务数据。
data fabric使用数据虚拟化来访问整个环境中的不同数据源,因此您不再需要移动数据或创建重复的数据集。 数据虚拟化可以提供单一的无缝的视图,无需复制数据。 因此,data fabric可以实现自助式数据访问,从而允许用户在数据源头轻松地查询数据。 该功能使数据科学家和其他数据公民能够更快地访问信息 — 无论信息位于哪个平台或什么地理位置。 自助访问还意味着用户可以立即开始查询数据,而无需等待数据工程师首先查找和准备数据。
到 2023 年,使用data fabric来动态连接、优化和自动化数据管理流程的组织将能够把集成数据交付时间减少 30%。2
Data fabric 的另一个关键元素是使用查询语义层执行通用查询的能力,该语义层本质上是将查询抽象或转换为通用语言。 无论贵组织使用什么查询引擎,data fabric的语义层都可以通过远远高于标准数据仓库的速度来查询分布式数据,并具有更高的准确性。
跨越复杂的分散环境来简化、统一和连接数据,对于确保贵公司的 AI 计划及时成功实施至关重要。
1 Global AI Adoption Index 2021 (PDF, 5.9 MB), IBM 和 Morning Consult, 2021 年。
2 数据集成工具魔力象限, Gartner, 2021 年 3 月 9 日。