发布日期:2024 年 3 月 12 日
撰稿人:Phill Powell、Ian Smalley
超大规模是一种分布式计算环境和架构,旨在提供极高的可扩展性来适应大规模工作负载。相关术语“超大规模企业”是指超大规模数据中心,其规模远大于传统的本地数据中心。
IT 从业者都知道,有些作业中规中矩,而有些项目则在数量级方面超出了正常需求。这些超大的案例要求进行额外处理并需要更大的分寸感。简而言之,它们需要借助由超大规模计算实现的特殊能力。
超大规模计算与使用标准企业数据中心相对应。在超大规模计算领域,企业会构建或帮助打造几乎可无限扩展的大型数据库。
全面了解 IBM 全球数据平台——该平台旨在让任何人都能随时随地访问任何内容。
订阅 IBM 时事通讯
借助超大规模技术,处理企业日常产生的数据流和数据量的方式发生了巨变。
可能很难有人记得,曾几何时,企业的整个数据中心可能是在办公室机柜中一台单独的服务器上运行的。
随后出现了虚拟机管理程序,它们用作抽象层,让虚拟机 (VM) 中的应用程序能够在不同的物理硬件安装之间迁移,而这是超大规模数据中心兴起的关键时刻。
在大多数情况下,原有的老式本地数据中心根本无法处理现在生成的数据量,尤其是超大规模应用程序生成的数据。
超大规模数据中心(也称为超大规模企业)占用的物理空间远大于传统的本地数据中心,后者的大小往往在 929 平方米的范围之内。
根据 IDC 对超大规模企业的定义(ibm.com 外部链接),企业必须使用 5,000 台或更多服务器,并投入至少 929 平方米的专用运营空间,才能被视为真正的超大规模企业。
超大规模设施往往超出这一范围数倍,其建筑面积通常接近 5574 平方米,大约相当于一个标准美式橄榄球场的大小。
虽然这样的大小可能在超大规模企业中非常典型,但比起全球规模最大的存储设施却相差甚远。这一设施正是位于中国内蒙古呼和浩特市和林格尔县的中国电信大型数据中心(ibm.com 外部链接)。该设施耗资 30 亿美元建造,占地面积达 99.4 万平方米,耗电量达 150 兆瓦。(要想直观地表示该设施有多么庞大,不妨想象一下大约 165 个足球场拼接在一起总共占用的空间。)
超大规模企业是超大规模计算发展的必然结果,是主要用于交付和管理超大规模应用程序的超大规模数据中心。
超大规模企业在很大程度上与传统数据中心相同,但旨在以远大于典型本地数据中心的规模提供服务。为此,超大规模企业在其设施中构建并运行着庞大的硬件和软件基础设施。分布在多个数据中心的数百万台服务器提供了似乎无穷无尽的存储和计算资源。
由于数据流量可能会大幅波动(尤其是在运行大型应用程序时),因此,当计算环境中的需求有所增加时,超大规模企业能够适应这样的流量,并让超大规模运营保持稳定。为此,超大规模企业在本质上充当了一种负载均衡器,同时处理多个任务并根据需要调配计算资源。
由于超大规模技术的进入成本和其他相关成本较高,一些企业尚未做好充分利用该技术的准备。然而,对于大多数企业来说,积极的方面远胜于这些成本。
虚拟化让云计算和 CSP 托管超大规模数据中心能够适应云计算及其所生成数据的多种用途。与此同时,用户就不必再纠缠于数据中心运行现场的诸多细节和偶尔出现的运营难题,而是通过应用程序编程接口 (API) 与所需的云资源交互。
超大规模基础设施是超大规模计算的基础,能够促进高性能和高冗余,让超大规模项目成为云计算活动和大数据处理的理想之选。
超大规模基础设施专门为高效处理用于超大规模用途的项目而构建,因此,即使在处理庞大的工作负载时,也能提高运营的成本效益。
仅当服务器之间具有快如闪电的强大连接功能(可实现低延迟)时,搭建服务器场才会带来好处,这样,这些服务器就能够有效地相互通信。超大规模企业可以提供这方面的条件。
超大规模市场目前由“五大”公有云供应商主导,其中每个云服务供应商 (CSP) 都拥有自己的优势。
截至 2023 年第一季度,AWS 拿下了 32% 的市场份额(ibm.com 外部链接),从而成为全球最大的超大规模云服务供应商。其云主题产品侧重于存储方案、计算能力、自动化、数据库和数据分析等方面。
许多企业已经是 Microsoft 某款产品的消费者,因此这些企业可能已经很熟悉 Microsoft 及其产品了。Microsoft 的产品包括企业软件,这些软件可与 Microsoft Azure 这一超大规模产品完美集成。(市场份额:23%)
Google 由于精通数据处理而声名鹊起,许多企业仍然青睐 GCP(市场份额约为 10%),尤其是那些渴望进行高级分析以及进军人工智能 (AI) 领域的企业。
IBM Cloud 在技术方面享誉已久,能够充分利用 IBM 在众多领域(如 AI 和企业数据中心事务处理)的专业知识。IBM Cloud 为基础设施即服务 (IaaS)、平台即服务 (PaaS) 和软件即服务 (SaaS) 提供了全面的服务。
OCI 的优势包括易于迁移关键企业工作负载,以及能够构建云原生应用程序。OCI 的另一个卖点是其极低的定价:Oracle 声称其提供与 AWS 相同的基本服务时收费远低于 AWS。
简要概述一下:AWS 之所以出类拔萃,是因为支持全球访问和高级可扩展性。GCP 对于需要顶级数据管理并希望涉足机器学习等功能的企业颇具吸引力,而 Microsoft 的 Azure 则实现了顺畅的产品集成并增强了安全性。
除了排名前三的竞品之外,IBM Cloud 目前利用 AI 开展的工作也备受关注,这使得其超大规模产品广为业界所熟知。此外,Oracle 一直将 OCI 作为一个平台提供给客户,旨在节省资金和托管云原生应用。
显而易见,这些供应商在其采用的方法和拥有专长的特定领域等方面各有千秋、差异显著,但也存在共同的相似之处。例如,其中前三大供应商现在提供支持零信任网络访问 (ZTNA) 协议的云原生服务,此类协议旨在提供 VPN 的替代方案,而 VPN 可能会出现安全漏洞。
不同企业在就其超大规模需求进行协商时会采用不同的策略。
设立精心设计的超大规模数据中心需要投入巨资,不是所有企业都具备这样的财务实力,也并非所有企业都希望进行这样的资金投入。请记住,我们谈论的不仅仅是施工成本,还要考虑需要购买大量的设备。
此外,据观察,一些超大规模设施的耗电量比小城市还要大。因此,企业有关采用超大规模数据中心的战略通常还必须考虑电费和环境问题。
作为购买设备的替代方案,一些企业采用的做法仍然是主机托管,即租用服务器或其他计算设备。
超大规模企业对于物联网 (IoT) 设备及其管理方式也产生了影响。事实上,很多企业正在将超大规模云与已有设备结合使用(在很多情况下都会这样),这有助于降低 IoT 生态系统的基础设施投资成本,从而让企业得到更多实惠。
探索部署 IBM Storage Scale 最简单的方法,其性能和容量可从 1 个节点扩展到 1000 多个节点。
用 IBM b 型和 c 型 SAN 交换机更新您的存储基础设施,可降低总拥有成本。
利用支持多种应用程序和着陆区的加速器,让 IBM Cloud 平台的采用开启“超速”模式。
使用 IBM 软件(如 IBM FlashSystem)和 IBM 硬件解决方案,让数据存储方程式左右两侧实现平衡。
存储区域网络 (SAN) 是针对特定环境量身定制的专用网络,整合了服务器、存储系统、网络交换机、软件和服务。
数据中心是一个物理房间、一座建筑物或一处设施,其中放置着用于构建、运行和交付应用程序和服务,以及用于存储和管理与这些应用程序和服务相关的数据的 IT 基础设施。
对象存储是一种数据存储架构,非常适合存储、归档、备份和管理大量静态非结构化数据,可靠、高效且经济实惠。
数据存储是指用于记录和保留数字信息,以备当前或未来使用的磁性、光学或机械介质。
IT 基础设施是指运营和管理企业 IT 服务及 IT 环境所需的组合组件。
延迟是系统延时的衡量指标。网络延迟是指数据通过网络从一个点传输到另一个点所需的时间。