高性能计算 (HPC) 是一种利用强大处理器集群并行处理海量多维数据集(也称为大数据)并以极高速度解决复杂问题的技术。HPC 实时解决了当今一些最复杂的计算问题。
HPC 系统的运行速度通常比最快的商用台式机、笔记本电脑或服务器系统快一百万倍以上。
几十年来,超级计算机(搭载数百万个处理器或处理器核心的专用计算机)一直是高性能计算的关键。超级计算机仍在存在;截至目前,最快的超级计算机是美国的 Frontier(ibm.com 外部链接),其处理速度为 1.102 exaflops,即每秒百亿亿次浮点运算 (flops)。但如今,越来越多的组织在托管在本地或云端的高速计算机服务器集群上运行 HPC 服务。
HPC 工作负载揭示了重要的新洞察分析,推动了人类知识的进步,并创造了显著的竞争优势。例如,HPC 用于 DNA 测序、自动化股票交易,并运行人工智能 (AI) 算法和模拟(例如自动驾驶汽车),实时分析来自物联网传感器、雷达和 GPS 系统的 TB 数据流,以做出瞬间决策。
了解桌面即服务 (DaaS) 如何帮助企业实现与本地部署应用程序相同水平的性能和安全性。
注册获取应用程序现代化指南
标准计算系统主要通过串行计算来解决问题,它将工作负载划分为一系列任务,然后在同一处理器上逐个运行这些任务。
相比之下,HPC 使用:
大规模并行计算
并行计算在多台计算机服务器或处理器上同时运行多个任务。大规模并行计算是利用成千上万至数百万个处理器或处理器内核进行并行计算。
计算机集群(也称 HPC Cluster)
HPC Cluster 由多台联网的高速计算机服务器组成,并配备用于管理并行计算工作负载的中央调度程序。这些计算机(也称为节点)使用高性能多核 CPU 或者现在更为常用的 GPU,后者适用于严格数学计算、机器学习模型和图形密集型任务。单个 HPC Cluster 可以包含 10 万个或更多节点。
高性能组件
HPC Cluster 中的所有其他计算资源,例如网络、内存、存储和文件系统等,都具有高速和高吞吐量等特性。它们也是低延迟组件,能够与节点保持同步,并优化集群的计算能力和性能。
仅仅在十年前,HPC 的高昂成本(包括拥有或租赁一台超级计算机,或在本地数据中心构建和托管 HPC Cluster 集群)使得大多数组织对 HPC 可望而不可及。
如今,云中的 HPC(有时称为 HPC 即服务 (HPCaaS))为企业提供了一种速度更快、可扩展性更强且更经济实惠的方式来利用 HPC 技术。HPCaaS 通常包括访问托管在云服务提供商数据中心的 HPC Cluster 和基础设施,以及网络功能(例如 AI 和数据分析)以及 HPC 专业知识。
今天,三种融合趋势推动云中的 HPC:
需求激增
各行各业的组织越来越依赖解决复杂问题所带来的实时洞察分析和竞争优势,而只有 HPC 应用程序才能实现这一点。举例来说,信用卡欺诈检测是我们所有人都依赖并且大多数人都曾经历过的事情,它越来越多地依赖 HPC 技术,能够更快地识别欺诈行为,减少烦人的误报,即使在欺诈行为不断变化的情况下亦是如此。
低延迟、高吞吐量 RDMA 网络的流行
远程直接内存访问 (RDMA) 使一台联网计算机能够访问另一台联网计算机的内存,而不会涉及任何计算机的操作系统或中断任何计算机的处理。这有助于最大限度地减少延迟并最大化吞吐量。新兴的高性能 RDMA 网络架构,包括 InfiniBand、虚拟接口架构和基于融合以太网的 RDMA等,实质上正在使基于云的 HPC 成为可能。
广泛的公有云和私有云 HPCaaS 的可用性
如今,每个领先的公有云服务提供商都提供 HPC 服务。一些组织继续在本地运行受到严格监管或敏感的 HPC 工作负载,但许多组织正在采用或迁移到由硬件和解决方案供应商提供的私有云 HPC 服务。
HPC 应用程序已成为与 AI 应用程序普遍相关的代名词,特别是机器学习和深度学习应用;如今,大多数 HPC 系统都是在考虑到这些工作负载的情况上创建的。这些 HPC 应用程序正在推动以下领域的持续创新:
医疗保健、基因组学和生命科学
人类基因组测序的首次尝试耗时 13 年;如今,HPC 系统仅用一天时间即可完成这项工作。医疗保健和生命科学领域的其他 HPC 应用包括:药物发现和设计、癌症快速诊断和分子建模等。
金融服务
除了自动化交易和欺诈检测之外,HPC 还为蒙特卡罗模拟和其他风险分析方法中的应用提供支持。
政府和国防
在这一领域,两个不断增长的 HPC 用例是天气预报和气候建模,二者均涉及处理庞大的历史气象数据和数百万个每日气候相关数据点的变化。其他政府和国防领域的应用包括能源研究和情报工作。
能源
在与政府和国防领域有重叠的某些情况上,与能源相关的 HPC 应用包括地震数据处理、油藏模拟和建模、地理空间分析、风力模拟和地形测绘。
无论您的工作负载需要混合云环境还是包含在云中的环境,IBM Cloud 都能通过高性能计算工具来满足您的需求。
为了应对当今的挑战并为未来做好准备,您需要将 IBM AI 软件与您的基础设施和数据策略集成在一起。
IBM® Spectrum LSF Suites 产品组合重新定义了集群虚拟化和工作负载管理,为任务关键型 HPC 环境提供集成系统。
IBM 是目前唯一一家提供完整量子技术堆栈的公司,其拥有最先进硬件、集成系统和云服务。
超级计算是一种高性能计算,通过使用功能强大的计算机(即超级计算机)进行确定或计算,从而减少解决问题的总体时间。
量子计算即将引发一场范式转变。依赖于这种植根于自然物理定律的新兴技术的软件,可能很快就会彻底改变计算领域。