Modelos de cimientos compatibles con watsonx.ai
Puede trabajar con modelos de base de terceros y IBM en IBM watsonx.ai.You puede utilizar modelos de base proporcionados por IBM y listos para su uso inmediato, o desplegar modelos de base bajo demanda para utilizarlos exclusivamente en su organización.
Cómo elegir un modelo
Para revisar los factores que pueden ayudarte a elegir un modelo, como las tareas e idiomas compatibles, consulta Elegir un modelo y Puntos de referencia del modelo Foundation.
Para obtener más información sobre los modelos de base proporcionados con watsonx.ai para la incrustación y la reclasificación de texto, consulte Modelos de codificador compatibles.
Acceso a modelos de otros proveedores a través de la pasarela de modelos
A través de la pasarela de modelos, puedes acceder de forma segura a modelos base de distintos proveedores e interactuar con ellos. La pasarela de modelos ofrece una API de OpenAI-compatible que redirige las solicitudes a estos modelos básicos. Utiliza la pasarela de modelos para alternar de forma eficiente entre varios proveedores de modelos, enrutando y formateando las solicitudes a través de una interfaz unificada. Con estos modelos, puedes crear e implementar agentes de IA, patrones RAG y mucho más.
Para obtener más información, consulte «Puerta de enlace modelo ».
La disponibilidad del modelo Foundation varía según la ubicación del centro de datos. Para más detalles, consulte Disponibilidad regional de los modelos de cimientos.
Modelos de cimientos por método de despliegue
Dependiendo del método de implementación, puede utilizar modelos de base en hardware multiusuario directamente o implementar modelos en hardware dedicado para su uso por parte de su organización. Para obtener más información sobre las diversas formas en que puede utilizar para implementar modelos, consulte Métodos de implementación de modelos de Foundation.
Modelos de base proporcionados que están listos para usar
Una colección de modelos de base de IBM y de código abierto se despliegan en IBM watsonx.ai. Puede solicitar estos modelos de cimentación en el Prompt Lab o mediante programación.
Para obtener detalles sobre la medición de la inferencia del modelo base en watsonx.ai, consulte Tarifas de facturación para la inferencia de modelos base. Para más información sobre la descripción del servicio IBM watsonx.ai con varios proveedores de nube, consulte:
Puede trabajar con los siguientes tipos de modelos de cimentación proporcionados:
IBM modelos de base
En la siguiente tabla se enumeran los modelos de base IBM compatibles que IBM proporciona para la inferencia.
También puede acceder a algunos modelos de la fundación IBM desde repositorios de terceros, como Hugging Face. IBM los modelos de cimientos que obtenga de un repositorio de terceros no serán indemnizados por IBM. Sólo los modelos de la fundación IBM a los que acceda desde watsonx.ai están indemnizados por IBM. Para más información sobre las protecciones contractuales relacionadas con la indemnización de IBM, consulte el Acuerdo de Relación con el Cliente de IBM.
| Nombre de modelo | ID de modelo API | Precio de USD/1,000 fichas) |
Precio de USD/1,000 fichas) |
Ventana contextual (tokens de entrada + salida) |
Más información |
|---|---|---|---|---|---|
| granite-4-h-small | ibm/granite-4-h-small |
$0.0000636 | $0.000265 | 131.072 | - Modelo de tarjeta - Página web |
| granite-3-8b-instruct | ibm/granite-3-8b-instruct |
$0.000212 | $0.000212 | 131.072 | - Ficha modelo - Página web - Documento de investigación |
| granite-guardian-3-8b | ibm/granite-guardian-3-8b |
$0.0002 | $0.0002 | 131.072 | • Ficha del modelo • Sitio web |
| granite-8b-code-instruct | ibm/granite-8b-code-instruct |
$0.000636 | $0.000636 | 128.000 | - Ficha modelo - Página web - Documento de investigación |
| Nombre de modelo | ID de modelo API | Precio de entrada ( ) (puntos de datos USD/1,000 ) |
Precio de salida ( USD/1,000 data points) |
Longitud del contexto Puntos de datos mínimos |
Más información |
|---|---|---|---|---|---|
| granite-ttm-512-96-r2 | ibm/granite-ttm-512-96-r2 |
$0.0001378 | $0.0004028 | 512 | - Modelo de ficha - Página web - Documento de investigación |
| granite-ttm-1024-96-r2 | ibm/granite-ttm-1024-96-r2 |
$0.0001378 | $0.0004028 | 1.024 | - Modelo de ficha - Página web - Documento de investigación |
| granite-ttm-1536-96-r2 | ibm/granite-ttm-1536-96-r2 |
$0.0001378 | $0.0004028 | 1.536 | - Modelo de ficha - Página web - Documento de investigación |
Modelos de bases de terceros
La siguiente tabla enumera los modelos de fundaciones de terceros compatibles que se proporcionan con watsonx.ai.
| Nombre de modelo | ID de modelo API | Proveedor | Precio de USD/1,000 fichas) |
Precio de USD/1,000 fichas) |
Ventana contextual (tokens de entrada + salida) |
Más información |
|---|---|---|---|---|---|---|
| allam-1-13b-instruct | sdaia/allam-1-13b-instruct |
Centro Nacional de Inteligencia Artificial y Autoridad Saudita de Datos e Inteligencia Artificial | $0.001908 | $0.001908 | 4.096 | - Modelo de tarjeta |
| gpt-oss-120b | openai/gpt-oss-120b |
OpenAI | $0.000159 | $0.000636 | 131.072 | - Modelo de tarjeta - OpenAI blog |
| llama-4-maverick-17b-128e-instruct-fp8 | meta-llama/llama-4-maverick-17b-128e-instruct-fp8 |
Meta | $0.000371 | $0.001484 | 131.072 | - Modelo de tarjeta - ' Meta AI blog |
| llama-3-3-70b-instruct | meta-llama/llama-3-3-70b-instruct |
Meta | $0.0007526 | $0.0007526 | 131.072 | - Modelo de tarjeta - ' Meta AI blog |
| llama-3-2-11b-vision-instruct | meta-llama/llama-3-2-11b-vision-instruct |
Meta | $0.000371 | $0.000371 | 131.072 | - Modelo de ficha - ' Meta AI blog - Documento de investigación |
| llama-3-2-90b-vision-instruct | meta-llama/llama-3-2-90b-vision-instruct |
Meta | $0.00212 | $0.00212 | 131.072 | - Modelo de ficha - ' Meta AI blog - Documento de investigación |
| llama-guard-3-11b-vision | meta-llama/llama-guard-3-11b-vision |
Meta | $0.000371 | $0.000371 | 131.072 | - Modelo de ficha - ' Meta AI blog - Documento de investigación |
| llama-3-405b-instruct | meta-llama/llama-3-405b-instruct |
Meta | $0.0053 | $0.01696 | 16.384 | - Modelo de tarjeta - ' Meta AI blog |
| mistral-large-2512 | mistralai/mistral-large-2512 |
Mistral AI | $0.000636 | $0.001908 | 256 000 | • Tarjeta de modelo • Entrada de blog para Mistral Large 3 |
| mistral-medium-2505 | mistralai/mistral-medium-2505 |
Mistral AI | $0.00337 | $0.01007 | 131.072 | - Tarjeta modelo - Blog post para Mistral Medium 3 |
| mistral-small-3-1-24b-instruct-2503 | mistralai/mistral-small-3-1-24b-instruct-2503 |
Mistral AI | $0.000106 | $0.000318 | 131.072 | • Tarjeta modelo • Entrada de blog para Mistral 3.1 |
| mt0-xxl-13b | bigscience/mt0-xxl |
BigScience | $0.001908 | $0.001908 | 4.096 | - Modelo de tarjeta " - Documento de investigación |
Implantar modelos de cimientos bajo demanda
Puede trabajar con un modelo de fundación de un conjunto de modelos seleccionados por la Fundación de la Familia Tiffany ( IBM ) para implementarlo para uso exclusivo de su organización.
Puede elegir desplegar los siguientes modelos de cimientos bajo demanda:
- IBM implantar modelos de cimientos bajo demanda
- Modelos de bases de despliegue bajo demanda de terceros
El despliegue de modelos a petición especificando el tamaño de la configuración de despliegue ha quedado obsoleto. Utilice la configuración de hardware de la GPU para la implantación de nuevos modelos y para calcular el precio de los modelos de alojamiento. Para obtener más información sobre los entornos de alojamiento de modelos y los precios de los modelos de implementación bajo demanda, consulte Detalles de facturación para activos de IA generativa.
IBM desplegar modelos de base bajo demanda
La siguiente tabla enumera los modelos de bases e IBM es que puede implementar bajo demanda.
Algunos modelos de cimientos de IBM también están disponibles en repositorios de terceros, como Hugging Face. IBM los modelos de cimientos que obtenga de un repositorio de terceros no serán indemnizados por IBM. Sólo los modelos de la fundación IBM a los que acceda desde watsonx.ai están indemnizados por IBM. Para más información sobre las protecciones contractuales relacionadas con la indemnización de IBM, consulte el Acuerdo de Relación con el Cliente de IBM.
| Nombre de modelo | Tamaño de la configuración de despliegue |
Ventana contextual (tokens de entrada + salida) |
|---|---|---|
| granite-vision-3-3-2b | – | 131.072 |
| granite-3-3-8b-instruct | Pequeña | 131.072 |
| granite-3-3-2b-instruct | Pequeña | 131.072 |
| granite-3-2-8b-instruct | Pequeña | 131.072 |
| granite-3-1-8b-base | Pequeña | 131.072 |
| granite-8b-japanese | Pequeña | 4.096 |
| granite-20b-multilingual | Pequeña | 8.192 |
| granite-13b-chat-v2 | Pequeña | 8.192 |
| granite-3b-code-instruct | Pequeña | 128.000 |
| granite-8b-code-instruct | Pequeña | 128.000 |
| granite-20b-code-instruct | Pequeña | 8.192 |
| granite-34b-code-instruct | Pequeña | 8.192 |
| granite-20b-code-base-schema-linking | Pequeña | 8.192 |
| granite-20b-code-base-sql-gen | Pequeña | 8.192 |
| granite-3-8b-base | Pequeña | 4.096 |
Implementación de modelos de base a petición de terceros
Precio por hora del alojamiento de la GPU en USD + Cuota de acceso por hora en USD = Precio total por hora en USD
Para obtener más información sobre los precios de la configuración de la GPU, consulte Costes de facturación por hora para modelos de implementación bajo demanda.
La siguiente tabla enumera los modelos de bases de terceros que puede implementar bajo demanda.
| Nombre de modelo | Proveedor | Tarifa de acceso por hora en USD | Tamaño de la configuración de despliegue |
Ventana contextual (tokens de entrada + salida) |
|---|---|---|---|---|
| allam-1-13b-instruct | Centro Nacional de Inteligencia Artificial y Autoridad Saudita de Datos e Inteligencia Artificial | – | Pequeña | 4.096 |
| codellama-34b-instruct-hf | Code Llama | – | Medio | 16.384 |
| deepseek-r1-distill-llama-8b | DeepSeek IA | – | Pequeña | 131.072 |
| deepseek-r1-distill-llama-70b | DeepSeek IA | – | Grande | 131.072 |
| eurollm-1-7b-instruct | Proyecto completo | – | Pequeña | 4.096 |
| eurollm-9b-instruct | Proyecto completo | – | Pequeña | 4.096 |
| gpt-oss-20b | OpenAI | – | – | 131.072 |
| gpt-oss-120b | OpenAI | – | – | 131.072 |
| llama-2-13b-chat | Meta | – | Pequeña | 4.096 |
| llama-2-70b-chat | Meta | – | Grande | 4.096 |
| llama-3-8b-instruct | Meta | – | Pequeña | 8.192 |
| llama-3-70b-instruct | Meta | – | Grande | 8.192 |
| llama-3-1-8b | Meta | – | Pequeña | 131.072 |
| llama-3-1-70b | Meta | – | Grande | 131.072 |
| llama-3-1-8b-instruct | Meta | – | Pequeña | 131.072 |
| llama-3-1-70b-instruct | Meta | – | Grande | 131.072 |
| llama-3-1-70b-gptq | Meta | – | – | 131.072 |
| llama-3-1-405b-instrcut-fp8 | Meta | – | – | 131.072 |
| llama-3-2-11b-vision-instruct | Meta | – | Pequeña | 131.072 |
| llama-3-2-90b-vision-instruct | Meta | – | – | 131.072 |
| llama-3-3-70b-instruct | Meta | – | Medio | 131.072 |
| llama-3-3-70b-instruct-hf | Meta | – | Grande | 131.072 |
| llama-4-maverick-17b-128e-instruct-fp8 | Meta | – | – | 131.072 |
| llama-4-maverick-17b-128e-instruct-int4 | Meta | – | – | 131.072 |
| llama-4-scout-17b-16e-instruct-fp8-dynamic | Meta | – | – | 131.072 |
| codestral-2501 | Meta | $34.30 | – | 65.536 |
| ministral-3b-instruct-2512 | Mistral AI | – | – | 262.144 |
| ministral-8b-instruct-2512 | Mistral AI | – | – | 262.144 |
| ministral-8b-instruct-2410 | Mistral AI | $8.60 | – | 131.072 |
| mistral-large-2512 | Mistral AI | – | – | 256 000 |
| mistral-large-instruct-2407 | Mistral AI | $34.30 | Grande | 131.072 |
| mistral-large-instruct-2411 | Mistral AI | $34.30 | Grande | 131.072 |
| mistral-medium-2505 | Mistral AI | $34.30 | – | 131.072 |
| mistral-medium-2508 | Mistral AI | $34.30 | – | 131.072 |
| mistral-nemo-instruct-2407 | Mistral AI | – | Pequeña | 131.072 |
| mistral-small-3-1-24b-instruct-2503 | Mistral AI | – | – | 131.072 |
| mistral-small-3-2-24b-instruct-2506 | Mistral AI | – | – | 131.072 |
| mixtral-8x7b-base | Mistral AI | – | Medio | 32.768 |
| mixtral-8x7b-instruct-v01 | Mistral AI | – | Medio | 32.768 |
| mt0-xxl-13b | BigScience | – | Pequeña | 4.096 |
| pixtral-12b | Mistral AI | – | – | 128.000 |
| poro-34b-chat | LumiOpen | – | Medio | 2.048 |
Más información
- IBM modelos de base
- Modelos de bases de terceros
- Para obtener una lista de los modelos que se proporcionan en cada centro de datos regional, consulte Disponibilidad regional de modelos base.
- Para obtener más información sobre los precios de los modelos de base, consulte Detalles de facturación para activos generativos de IA.
- Para obtener información sobre precios y limitación de tarifas, consulte watsonx.ai Planes de tiempo de ejecución.