IBM watsonx 모델은 기업을 대상으로 설계되었으며 특정 비즈니스 영역과 사용 사례에 최적화되어 있습니다. IBM은 AI 스튜디오 IBM watsonx.ai를 통해 고객과 파트너사가 인공 지능(AI)을 최소한의 위험으로 신속하게 확장하고 운영할 수 있도록 IBM에서 개발한 합리적인 가격의 엔터프라이즈급 파운데이션 모델, 오픈 소스 모델 및 타사 제공업체에서 제공한 모델을 선택하여 제공합니다. AI 모델은 온프레미스 및 하이브리드 클라우드 환경을 포함하여 워크로드가 있는 모든 곳에 배포할 수 있습니다.
IBM은 차별화된 접근 방식을 통해 엔터프라이즈급 파운데이션 모델을 제공합니다:
IBM watsonx 파운데이션 모델 라이브러리는 독점, 오픈 소스 및 타사 모델 라이브러리에서 비즈니스 요구 사항, 지역적 관심사 및 위험 프로필에 가장 적합한 모델을 선택할 수 있는 선택권과 유연성을 제공합니다
IBM Granite는 디코더 전용 트랜스포머 아키텍처를 기반으로 하는 대규모 언어 기반 모델의 플래그십 시리즈입니다. Granite 언어 모델은 인터넷, 학술, 코드, 법률 및 재무를 아우르는 신뢰할 수 있는 엔터프라이즈 데이터로 학습됩니다
해당 모델은 콘텐츠 생성, 요약, 분류, 인사이트 추출 및 검색 증강 생성(RAG)과 같은 인기 있는 사용 사례에서 일관되게 향상된 성능을 제공합니다.
엔터프라이즈 관련 콘텐츠를 학습한 IBM Granite는 IBM AI 윤리 원칙 및 개인정보 보호 최고 책임자(CPO)가 정의하고 시행하는 엄격한 데이터 거버넌스, 규제 및 위험 기준을 충족합니다.
채팅 미세 조정 및 모델 정렬 기술은 RAG와 같은 재무 및 사용 사례와 같은 특정 엔터프라이즈 비즈니스 영역에 대한 정확도를 개선합니다.
인프라 요구 사항이 적고 IP 면책이 가능하며 사용자 지정 모델 및 애플리케이션 통합을 위한 간편한 툴킷이 제공되는 합리적인 가격의 모델입니다.
요구 사항에 가장 적합한 생성형 파운데이션 모델을 선택하세요. 사용 사례에 맞는 몇몇 모델을 선별한 후 프롬프트 엔지니어링 기법을 활용하여 모델을 체계적으로 테스트함으로써 원하는 결과를 일관적으로 제공하는 모델을 파악하세요.
granite-13b-chat
IBM
질문 및 답변(Q&A), 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.
8192
0.0006
granite-13b-instruct
IBM
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.
8192
0.0006
granite-20b-multilingual
IBM
프랑스어, 독일어, 포르투갈어, 스페인어 및 영어로 Q&A, 요약, 분류, 생성, 추출, 번역 및 RAG 작업을 지원합니다.
8190
0.0006
llama-2-70b-chat
Meta
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.
4096
0.0018
llama-2-13b-chat
Meta
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다. 프롬프트 조정 가능
4096
0.0006
codellama-34b-instruct
Meta
자연어 프롬프트에서 코드를 생성하고 번역하여 코드를 위한 작업별 모델 제공.
4096
0.0018
mixtral-8x7b-instruct
Mistral AI
Q&A, 요약, 분류, 생성, 추출, RAG 및 코드 생성 작업을 지원합니다.
32768
0.0006
granite-8b-japanese
IBM
일본어로 Q&A, 요약, 분류, 생성, 추출, 번역 및 RAG 작업을 지원합니다.
4096
0.0006
flan-t5-xl-3b
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다. 프롬프트 조정 가능
4096
0.0006
flan-t5-xxl-11b
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.
4096
0.0018
flan-ul2-20b
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.
4096
0.005
elyza-japanese-llama-2-7b-instruct
ELYZA
Q&A, 요약, RAG, 분류, 생성, 추출 및 번역 작업을 지원합니다.
4096
0.0018
mt0-xxl-13b
BigScience
Q&A, 요약, 분류 및 생성 작업을 지원합니다.
4096
0.0018
기업들은 한 곳에서 자체 데이터로 파운데이션 모델과 머신 러닝을 활용하여 생성형 AI 워크로드를 가속화할 수 있다는 전망에 큰 기대를 걸고 있습니다.
IBM은 엔터프라이즈 전반을 책임감 있게 혁신하는 AI 모델 생성, 배포 및 활용이 가능하다고 믿습니다. IBM의 watsonx AI와 데이터 플랫폼은 파운데이션 모델과 생성적 AI를 구축하고 테스트하기 위한 엔드투엔드 프로세스를 갖추었습니다. IBM은 당사가 개발하는 모델을 훈련하기 전에 중복을 찾아 제거하고, URL 차단 목록, 유해한 콘텐츠 배제 및 문서 품질 관리를 위한 필터, 문장 분할, 토큰화 기법을 모두 적용합니다. 데이터 훈련 프로세스에서는 모델 결과의 불일치를 방지하기 위해 노력하며, 지도형 미세 조정을 활용하여 보다 면밀한 지침 준수를 가능하게 함으로써 모델이 프롬프트 엔지니어링을 통해 엔터프라이즈 작업 완료에 사용될 수 있도록 합니다. 당사는 기타 모달 기능(Modality), 업계별 콘텐츠, 훈련을 위한 추가적인 데이터 어노테이션 등 다양한 방향으로 Granite 모델의 개발을 이어나가고 있으며, 동시에 IBM이 개발한 모델에 대해 정기적이고 지속적인 안전 장치를 배포하고 있습니다. IBM의 watsonx AI와 데이터 플랫폼은 파운데이션 모델과 생성적 AI를 구축하고 테스트하기 위한 엔드투엔드 프로세스를 갖추었습니다. IBM은 당사가 개발하는 모델을 훈련하기 전에 중복을 찾아 제거하고, URL 차단 목록, 유해한 콘텐츠 배제 및 문서 품질 관리를 위한 필터, 문장 분할, 토큰화 기법을 모두 적용합니다.
데이터 훈련 프로세스에서는 모델 결과의 불일치를 방지하기 위해 노력하며, 지도형 미세 조정을 활용하여 보다 면밀한 지침 준수를 가능하게 함으로써 모델이 프롬프트 엔지니어링을 통해 엔터프라이즈 작업 완료에 사용될 수 있도록 합니다. 당사는 기타 모달 기능(Modality), 업계별 콘텐츠, 훈련을 위한 추가적인 데이터 어노테이션 등 다양한 방향으로 Granite 모델의 개발을 이어나가고 있으며, 동시에 IBM이 개발한 모델에 대해 정기적이고 지속적인 안전 장치를 배포하고 있습니다.
생성적 AI 기술 환경이 급속히 변화하는 만큼 엔드투엔드 프로세스 또한 지속적으로 진화하고 개선되어야 합니다. IBM은 자사의 하드웨어 및 소프트웨어 제품에 제공하는 것과 유사하게 IBM에서 개발한 모델에 표준 계약 지적 재산권 배상을 제공합니다. 이는 IBM이 파운데이션 모델의 개발과 테스트에 투입하는 막대한 노력의 증명입니다.
더 나아가 IBM은 일부 대형 언어 모델 제공자와 달리 고객이 IBM에서 개발한 모델을 사용할 때 IBM에 배상하도록 요구하지 않습니다. 이는 IBM의 배상에 관한 표준 접근법에 부합하는 것입니다. 또한 IBM은 자사의 배상 의무에 대한 접근법에 부합하도록 IBM에서 개발한 모델의 배상 책임에 한도를 적용하지 않습니다.
현재 이러한 보호가 적용되는 watsonx 모델은 다음과 같습니다.
(1) Slate 인코더 전용 모델 제품군
(2) Granite 디코더 전용 모델 제품군
추론 가격은 토큰 1,000개(리소스 단위 1개) 기준입니다. 입력 및 완료 토큰은 같은 비율로 부과됩니다. 토큰 1,000개는 보통 약 750단어입니다.
지역에 따라 일부 모델을 사용하지 못할 수 있으므로, 자세한 내용은 당사의 문서를 참조하세요.
토큰으로 표현한 컨텍스트 길이.
IBM이 제시한 계획, 방향, 의도에 대한 설명은 IBM의 단독 재량에 따라 예고 없이 변경되거나 철회될 수 있습니다. 자세한 내용은 가격 책정을 참고하세요. 소프트웨어 가격 책정에 달리 명시되지 않는 한, 모든 특징, 기능 및 잠재적 업데이트는 SaaS에만 적용됩니다. IBM은 SaaS와 소프트웨어의 특징 및 기능이 동일함을 보증하지 않습니다.