topics 하이퍼스케일 하이퍼스케일이란 무엇인가요?
IBM 스토리지 솔루션을 통한 확장 IBM 뉴스레터 구독하기
컴퓨터 모니터, 서버, 구름, 점의 픽토그램 콜라주가 포함된 일러스트

게시일: 2024년 3월 12일
기고자: Phill Powell, Ian Smalley

하이퍼스케일이란 무엇인가요?

하이퍼스케일은 극도의 확장성을 사용하여 대규모 워크로드를 수용할 수 있게 설계된 분산 컴퓨팅 환경 및 아키텍처입니다. 관련 용어인 '하이퍼스케일러'는 기존 온프레미스 데이터 센터보다 훨씬 큰 하이퍼스케일 데이터 센터를 의미합니다.

IT 업계 종사자라면 누구나 알다시피, 일반적인 업무가 있는가 하면 일반적인 요구 사항을 초과하는 프로젝트도 있습니다. 이러한 초대형 케이스에는 추가적인 처리와 더 큰 비율 감각이 필요합니다. 즉, 하이퍼스케일 컴퓨팅이 지원하는 특수한 능력이 필요합니다.

하이퍼스케일 컴퓨팅은 표준 엔터프라이즈 데이터 센터를 사용하는 것에 대응하는 개념입니다. 하이퍼스케일 컴퓨팅에서 기업은 거의 무한대로 확장 가능한 대규모 데이터베이스를 구축하거나 생성하는 데 도움을 줍니다.

하이브리드 클라우드로 현대화 가속화

IBM zSystems 및 하이브리드 클라우드를 통해 메인프레임 애플리케이션 현대화를 가속화하는 데 도움이 되는 IBM 전략에 대한 개요를 읽어보세요.

관련 내용

IBM Global Data Platform 솔루션 개요 읽기

데이터 센터에서 하이퍼스케일러까지

하이퍼스케일 기술은 기업에서 매일 생성되는 데이터의 흐름과 양이 처리되는 방식에 큰 변화를 가져왔습니다.

기억이 가물가물할 수 있지만, 회사의 전체 데이터 센터가 사무실 캐비닛 안의 단일 서버에서 실행되었던 때가 있었습니다.

그 후 하이퍼바이저가 등장하여 추상화 계층으로 사용되면서 가상 머신(VM)의 애플리케이션을 물리적 하드웨어 설치에서 다른 설치로 재배치할 수 있게 되었습니다. 이는 하이퍼스케일 데이터 센터의 부상에서 중요한 순간이었습니다.

대부분의 경우, 기존의 온프레미스 데이터 센터는 현재 생성되는 데이터, 특히 하이퍼스케일 애플리케이션에서 생성되는 데이터의 양을 처리할 수 없습니다.

하이퍼스케일 데이터 센터(하이퍼스케일러라고도 함)는 기존 온프레미스 데이터 센터보다 훨씬 더 큰 물리적 공간을 차지하며, 10,000ft² 가량의 규모를 유지하는 경향이 있습니다.

하이퍼스케일러에 대한 IDC의 정의(ibm.com 외부 링크)에 따르면, 진정한 하이퍼스케일러로 간주되려면 사용 서버 5,000개 이상, 운영 공간 최소 10,000ft²의 요건을 충족해야 합니다.

하이퍼스케일 시설은 그보다 몇 배나 큰 경우가 많으며, 건물 크기가 미국 정규 축구장 크기인 60,000ft²에 육박하는 경우가 많습니다.

이는 일반적인 하이퍼스케일 규모일 뿐 스토리지 옵션의 가장 큰 예는 아닙니다. 중국 내몽골 지역의 호홋 호링거에 위치한 대규모 China Telecom 데이터 센터(ibm.com 외부 링크)는 독보적인 규모를 자랑합니다. 건설 비용이 30억 달러에 달하는 이 시설은 면적이 1,070만 평방피트에 이르며 150메가와트의 전력을 사용합니다. (축구장 165개를 합친 공간을 상상하면 이 시설의 엄청난 규모를 가늠할 수 있습니다.)

하이퍼스케일러는 어떻게 작동하나요?

하이퍼스케일 컴퓨팅에서 파생된 하이퍼스케일러는 주로 초대형 애플리케이션을 제공하고 관리하기 위해 사용되는 하이퍼스케일 데이터 센터입니다.

하이퍼스케일러는 대부분 기존 데이터 센터와 구조 면에서는 비슷하지만, 일반적인 온프레미스 데이터 센터보다 훨씬 더 큰 규모로 설계되었습니다. 이를 위해 하이퍼스케일러 시설에 방대한 하드웨어 및 소프트웨어 인프라를 구축하고 운영합니다. 여러 데이터 센터에 분산된 수백만 대의 서버가 무궁무진한 스토리지와 컴퓨팅 리소스를 제공합니다.

데이터 트래픽은 특히 대규모 애플리케이션을 실행할 때 급격하게 변동할 수 있으므로 하이퍼스케일러는 이러한 트래픽을 수용하고 컴퓨팅 환경 내에서 수요가 증가할 때 하이퍼스케일 운영을 안정화합니다. 하이퍼스케일러는 기본적으로 로드 밸런서의 한 형태로서 작업을 저글링하고 필요에 따라 컴퓨팅 리소스를 다시 리디렉션하여 이를 수행합니다.

하이퍼스케일의 이점

도입 비용 및 기타 관련 비용으로 인해 하이퍼스케일 기술을 활용할 준비가 되어 있지 않은 기업들도 있습니다. 그러나 대부분의 기업에서는 긍정적인 영향이 이러한 비용을 능가합니다.

관리형 데이터 센터

가상화클라우드 컴퓨팅을 가능하게 하며, CSP는 클라우드 컴퓨팅의 다양한 사용과 생성되는 데이터를 수용하기 위해 하이퍼스케일 데이터 센터를 호스팅합니다. 한편, 사용자는 데이터 센터를 직접 운영할 때 발생하는 많은 세부 사항과 때로 겪을 수 있는 운영상의 문제에서 벗어나 애플리케이션 프로그래밍 인터페이스(API)를 통해 필요한 클라우드 리소스와 상호 작용할 수 있습니다.

대규모 작업을 위한 설계

하이퍼스케일 컴퓨팅의 기반이 되는 하이퍼스케일 인프라는 고성능과 이중화를 모두 촉진하므로 하이퍼스케일 프로젝트는 클라우드 컴퓨팅 활동과 빅 데이터 처리에 적합한 옵션이 될 수 있습니다.

효율성

하이퍼스케일 인프라는 하이퍼스케일 용도를 효율적으로 처리하도록 특별히 설계되었기 때문에 대규모 워크로드를 처리하는 경우에도 운영 비용 효율성을 높일 수 있습니다.

향상된 네트워킹

서버가 강력하고 빛처럼 빠른 연결(낮은 지연 시간)을 갖고 있어 서버가 서로 효과적으로 통신할 수 없다면 본질적으로 서버 팜을 구축하는 것은 크게 도움이 되지 않습니다. 하이퍼스케일러가 바로 이를 제공합니다.

선도적인 하이퍼스케일 제공업체

하이퍼스케일 시장은 현재 퍼블릭 클라우드 제공업체 '빅 5'가 주도하고 있으며, 각 클라우드 서비스 제공업체(CSP)는 저마다의 강점을 보유하고 있습니다.

Amazon Web Services(AWS)

2023년 1분기 현재 AWS는 32%의 시장 점유율(ibm.com 외부 링크)을 달성하여 최대 규모의 하이퍼스케일 클라우드 서비스 제공업체가 되었습니다. 클라우드 테마 제품은 스토리지 옵션, 컴퓨팅 성능, 자동화, 데이터베이스 및 데이터 분석과 같은 측면에 중점을 둡니다.

Microsoft Azure

많은 기업이 이미 Microsoft 제품 또는 다른 제품을 사용하고 있으므로 해당 회사와 제품에 대해 이미 친숙하게 알고 있을 수 있습니다. 여기에는 하이퍼스케일 제품인 Microsoft Azure와 잘 통합되는 Microsoft의 엔터프라이즈 소프트웨어가 포함됩니다. (시장 점유율: 23%)

Google Cloud Platform(GCP)

Google은 뛰어난 데이터 처리 기술로 명성을 얻었으며, 특히 고급 분석에 참여하고 인공 지능(AI)으로 영역을 확장하려는 기업들은 여전히 GCP(시장의 약 10%)를 찾고 있습니다.

IBM Cloud

IBM Cloud는 오랜 기간 쌓아온 기술력을 바탕으로 AI, 엔터프라이즈 데이터 센터 등 다양한 분야에서 전문성을 활용하고 있습니다. IBM Cloud는 서비스형 인프라(IaaS), 서비스형 플랫폼(PaaS)서비스형 소프트웨어(SaaS)를 위한 포괄적인 서비스를 제공합니다.

Oracle Cloud Infrastructure(OCI)

OCI는 중요한 엔터프라이즈 워크로드를 쉽게 마이그레이션하고 클라우드 네이티브 앱을 구축할 수 있다는 장점이 있습니다. OCI의 또 다른 장점은 공격적으로 저렴한 가격으로, Oracle은 AWS와 동일한 기본 서비스를 훨씬 적은 비용으로 제공한다고 주장합니다.

'빅 5'는 어떻게 다른가요?

간략하게 요약하자면 AWS는 글로벌 액세스와 고급 확장성으로 두각을 나타냅니다. GCP는 최고 수준의 데이터 관리가 필요하고 머신 러닝과 같은 기능으로 진출하려는 기업에게 매력적이며, Microsoft의 Azure는 원활한 제품 통합과 향상된 보안을 제공합니다.

상위 3개 경쟁사 외에도 IBM Cloud는 현재 하이퍼스케일 제품에 대한 정보를 제공하는 AI 작업으로 상당한 관심을 불러일으키고 있습니다. 그리고 Oracle은 비용을 절감하고 클라우드 네이티브 애플리케이션을 호스팅하기 위해 구축된 플랫폼인 OCI를 제공하고 있습니다.

각 제공업체는 접근 방식과 특정 전문 분야는 크게 다르지만 모두 공통적으로 공유하는 유사점이 있습니다. 예를 들어, 현재 상위 3개 업체는 보안 취약점이 발생할 수 있는 VPN의 대안을 제공하기 위해 설계된 제로 트러스트 네트워크 액세스(ZTNA) 프로토콜을 지원하는 클라우드 네이티브 서비스를 제공하고 있습니다.

하이퍼스케일의 경제성

기업마다 다양한 전략으로 하이퍼스케일 요구 사항을 협상하는 방식에 접근합니다. 

모든 기업이 정교한 하이퍼스케일러를 구축하는 데 필요한 막대한 재정적 투자를 감당할 수 있거나, 이러한 재정적 투자를 원하는 것은 아닙니다. 단순히 구축 비용만을 이야기하는 것이 아니라는 점을 기억하셔야 합니다. 대규모 장비 구매도 감안해야 합니다.

또한 일부 하이퍼스케일 시설은 소도시 하나보다 전력을 더 많이 사용하는 것으로 관찰되었습니다. 따라서 하이퍼스케일러 사용에 대한 회사의 전략을 세울 때 전력 비용과 환경 문제도 고려해야 합니다.

일부 기업은 장비를 구매하는 대신 서버나 기타 컴퓨팅 장비를 대여하는 코로케이션 방식을 여전히 사용하고 있습니다.

하이퍼스케일러는 사물인터넷(IoT) 기기 및 관리 방식에도 영향을 주었습니다. 하이퍼스케일 클라우드를 기존 장비와 함께 사용하는 경우가 많기 때문에 IoT 에코시스템에 대한 인프라 투자 비용을 절감할 수 있어 기업이 더 나은 가치를 누릴 수 있습니다.

관련 솔루션
IBM Storage Scale

1개에서 1000개 이상의 노드로 확장되는 성능과 용량으로 IBM Storage Scale을 가장 쉽게 배포하는 방법을 알아봅니다.

IBM Storage Scale 살펴보기

IBM storage area network(SAN) 솔루션

IBM b형 및 c형 SAN 스위치로 스토리지 인프라를 업데이트하여 총 소유 비용을 절감하세요.

IBM storage area network (SAN) 솔루션 살펴보기

IBM Consulting Cloud Accelerator

다양한 앱과 랜딩 존을 지원하는 Accelerator를 통해 IBM Cloud 플랫폼 도입을 가속화하세요.

IBM Consulting Cloud Accelerator 살펴보기
IBM 스토리지

IBM FlashSystem과 같은 IBM 소프트웨어 및 IBM 하드웨어 솔루션을 사용하여 데이터 스토리지 방정식의 양쪽 균형을 맞출 수 있습니다.

IBM 스토리지 살펴보기

리소스 SAN(Storage Area Network)이란 무엇인가요?

SAN(Storage Area Network)은 서버, 스토리지 시스템, 네트워킹 스위치, 소프트웨어 및 서비스를 결합하여 특정 환경에 맞게 조정된 전용 네트워크입니다.

데이터 센터란 무엇인가요?

데이터 센터는 애플리케이션 및 서비스를 구축, 실행 및 제공하고 이러한 애플리케이션 및 서비스와 관련된 데이터를 저장 및 관리하기 위한 IT 인프라를 수용하는 물리적 공간, 건물 또는 시설입니다.

오브젝트 스토리지란 무엇인가요?

오브젝트 스토리지는 대량의 정적이고 비정형적인 데이터를 안정적이고 효율적이며 경제적으로 저장, 보관, 백업 및 관리하는 데 이상적인 데이터 스토리지 아키텍처입니다.

데이터 스토리지란 무엇인가요?

데이터 스토리지는 현재 또는 미래의 사업 운영을 위해 디지털 정보를 기록하고 보존하는 자기, 광학 또는 기계적 매체를 말합니다.

IT 인프라란 무엇인가요?

IT 인프라는 엔터프라이즈 IT 서비스 및 IT 환경의 운영 및 관리에 필요한 구성 요소의 결합을 뜻합니다.

지연 시간(Latency)이란 무엇인가요?

지연 시간은 시스템의 지연을 측정한 값입니다. 네트워크 지연 시간이란 데이터가 네트워크를 통해 한 지점에서 다른 지점으로 이동하는 데 걸리는 시간을 말합니다.

다음 단계 안내

하이퍼스케일은 스토리지 문제에 새로운 차원을 추가하여 완전히 새로운 기회의 영역을 열어주었습니다. IBM Storage Scale을 통해 비즈니스에서 이 강력한 새 기능을 최대한 활용하는 방법을 알아보세요.

IBM Storage Scale 살펴보기