Modelos fundacionales - IBM watsonx.ai

Elija el modelo que necesita

Seleccione el modelo IBM Granite, de código abierto o de terceros, que mejor se adapte a su negocio e impleméntelo en las instalaciones o en la nube.

El punto de vista de IBM sobre los modelos de IA

Elija el modelo fundacional adecuado

Novedades

Nuevo modelo

Granite 3.3 ya está disponible en la biblioteca de modelos fundacionales de watsonx.

Mistral Medium 3 ya está disponible en watsonx.ai

Nueva característica del modelo

Meta Llama 4 Maverick y Llama 4 Scout ya están disponibles en watsonx.ai

Nueva característica del modelo

Los nuevos modelos Granite 3.3 tienen capacidades de conversión de voz a texto y un rendimiento mejorado del modelo lingüístico

Nueva característica del modelo

Biblioteca de modelos fundacionales

Elija el modelo que mejor se adapte a su caso de uso específico, a las consideraciones presupuestarias, a los intereses regionales y al perfil de riesgo.

Ver la biblioteca de modelos de incrustración

Modelos IBM

Adaptada a las empresas, la familia IBM Granite de modelos abiertos, eficaces y de confianza ofrece un rendimiento excepcional a un precio competitivo, sin comprometer la seguridad.

Ver la biblioteca de modelos de IBM

Más información sobre Granite

Modelos de Meta Llama

Los modelos Llama son modelos de lenguaje grandes, abiertos y eficientes, diseñados para ofrecer versatilidad y un rendimiento sólido en una amplia gama de tareas de lenguaje natural.

Ver la biblioteca de modelos Meta

Más información sobre nuestra asociación

Modelos de IA de Mistral

Los modelos Mistral son modelos lingüísticos rápidos, eficaces y de peso abierto diseñados para la modularidad y optimizados para la generación de texto, el razonamiento y las aplicaciones multilingües.

Ver la biblioteca de modelos Mistral

Otros proveedores de modelos de terceros

Hay varios modelos fundacionales de otros proveedores disponibles en watsonx.ai.

Ver la biblioteca de modelos

Historias de clientes

¿Qué sucede cuando entrena un potente modelo de IA con sus propios datos únicos? Mejores experiencias para los clientes y un valor más rápido con la IA. Explore estas historias y descubra cómo.

Wimbledon

Wimbledon utilizó modelos fundacionales de watsonx.ai para entrenar su IA y crear crónicas sobre el tenis.

Lea el caso de éxito

The Recording Academy

La Recording Academy utilizó AI Stories con IBM watsonx para generar y escalar contenido editorial en torno a los nominados a los GRAMMY.

Lea el anuncio

The Masters

El Masters utiliza watsonx.ai para llevar a las plataformas digitales conocimientos sobre los hoyos con IA combinados con opiniones de expertos.

Lea el anuncio

AddAI.Life

AddAI.Life utiliza watsonx.ai para acceder a modelos de lenguaje de gran tamaño de código abierto seleccionados para construir asistentes virtuales de mayor calidad.

Lea el caso de éxito

Modelos fundacionales de IBM

Vea cómo se entrenaron los modelos de Granite (PDF)

Más información sobre Granite

Nombre del modelo

Proveedor

Casos de uso

Longitud del contexto

Precio

Dólar/1 millón de tokens*

gpt-oss-120b

OpenAI

Implementación privada en las instalaciones o en el edge, flujos de trabajo de razonamiento, uso de herramientas (por ejemplo, búsqueda y ejecución de código), cadena de pensamiento personalizable, resultados estructurados y esfuerzo de razonamiento ajustable

128 000

0,15 tokens de entrada (input)
0,60 tokens de salida (output)

granite-3-3-8b-instruct

Nuevo

Modelo destacado

IBM

Admite razonamiento y planificación, preguntas y respuestas (Q&A), soporte de relleno en el medio, resumen, clasificación, generación, extracción, RAG y tareas de codificación.

128k

0,20

granite-3-2-8b-instruct

IBM

Admite tareas de razonamiento y planificación, preguntas y respuestas, resumen, clasificación, generación, extracción, GAR y codificación.

128k

0,20

granite-vision-3-2-2b

IBM

Admite casos de uso de imagen a texto para análisis de gráficos, gráficos e infografías, y preguntas y respuestas contextuales.

16 384

0,10

granite-3-2b-instruct (v3.1)

IBM

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y codificación.

128k

0,10

granite-3-8b-instruct (v3.1)

Modelo destacado

IBM

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y codificación.

128k

0,20

granite-guardian-3-8b (v3.1)

IBM

Admite la detección de HAP o PII, jailbreak, sesgo, violencia y otros contenidos dañinos.

128k

0,20

granite-guardian-3-2b (v3.1)

En desuso

IBM

Admite la detección de HAP o PII, jailbreak, sesgo, violencia y otros contenidos dañinos.

128k

0,10

granite-13b-instruct

En desuso

IBM

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.

8192

0,60

granite-8b-code-instruct

IBM

Modelo de código específico para cada tarea mediante la generación, explicación y traducción de código a partir de una instrucción en lenguaje natural.

128k

0,60

granite-8b-japanese

En desuso

IBM

Admite preguntas y respuestas, resumen, clasificación, generación, extracción, traducción y tareas RAG en japonés.

4096

0,60

*Los precios indicados son orientativos, pueden variar según el país, no incluyen impuestos ni aranceles aplicables y están sujetos a la disponibilidad de la oferta de productos

Metamodelos

Más información sobre nuestra asociación

Nombre del modelo

Proveedor

Casos de uso

Longitud del contexto

Precio

Dólar/1 millón de tokens*

llama-4-scout-17b-16e-instruct

Nuevo

Meta

Razonamiento multimodal, procesamiento de contextos largos (10 millones de tokens), generación y análisis de código, operaciones multilingües (compatible con 200 idiomas), STEM y razonamiento lógico.

128k

Vista previa gratuita

llama-4-maverick-17b-128e-instruct-fp8

Nuevo

Meta

128k

Entrada: 0,35/Salida: 1,40

llama-3-3-70b-instruct

Meta

Admite tareas de preguntas y respuestas, resumen, generación, codificación, clasificación, extracción, traducción y RAG en inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.

128k

0,71

llama-3-2-90b-vision-instruct

Meta

Admite subtítulos de imágenes, transcripción de imagen a texto (OCR) incluida la escritura a mano, extracción y procesamiento de datos, preguntas y respuestas contextuales e identificación de objetos.

128k

2,00

llama-3-2-11b-vision-instruct

Meta

128k

0,35

llama-guard-3-11b-vision

Meta

Admite filtrado de imágenes, detección de HAP o PII y filtrado de contenido dañino.

128k

0,35

llama-3-2-1b-instruct

Meta

128k

0,10

llama-3-2-3b-instruct

Meta

128k

0,15

llama-3-405b-instruct

Meta

128k

Entrada: 5,00 / Salida: 16,00

*Los precios indicados son orientativos, pueden variar según el país, no incluyen impuestos ni aranceles aplicables y están sujetos a la disponibilidad de la oferta de productos

Modelos Mistral

Nombre del modelo

Proveedor

Casos de uso

Longitud del contexto

Precio

Dólar/1 millón de tokens*

mistral-medium-2505

Nuevo

Mistral AI

Admite codificación, subtítulos de imágenes, transcripción de imagen a texto, llamada a funciones, extracción y procesamiento de datos, preguntas y respuestas contextuales, razonamiento matemático

128k

Entrada: 3,00 / Salida: 10,00

mistral-small-3-1-24b-instruct-2503

Nuevo

Mistral AI

Admite subtítulos de imágenes, transcripción de imagen a texto, llamada a funciones, extracción y procesamiento de datos, preguntas y respuestas contextuales e identificación de objetos

128k

Entrada: 0,10/Salida: 0,30

pixtral-12b

En desuso

Mistral AI

128k

0,35

mistral-large-2

En desuso

Mistral AI

Admite tareas de Q&A, resumen, generación, codificación, clasificación, extracción, traducción y RAG en francés, alemán, italiano, español e inglés.

128k*

Entrada: 3,00 / Salida: 10,00

*Los precios indicados son orientativos, pueden variar según el país, no incluyen impuestos ni aranceles aplicables y están sujetos a la disponibilidad de la oferta de productos

Modelos fundacionales de terceros

Nombre del modelo

Proveedor

Casos de uso

Longitud del contexto

Precio

Dólar/1 millón de tokens*

allam-1-13b-instruct

SDAIA

Admite preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y traducción en árabe.

4096

1,80

jais-13b-chat (árabe)

core42

Admite preguntas y respuestas, resumen, clasificación, generación, extracción y traducción en árabe.

2048

1,80

flan-t5-xl-3b

En desuso

Google

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG. Disponible para ajuste de consignas.

4096

0,60

flan-t5-xxl-11b

En desuso

Google

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.

4096

1,80

flan-ul2-20b

En desuso

Google

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.

4096

5,00

elyza-japanese-llama-2-7b-instruct

En desuso

ELYZA

Admite tareas de preguntas y respuestas, resumen, RAG, clasificación, generación, extracción y traducción.

4096

1,80

*Los precios indicados son orientativos, pueden variar según el país, no incluyen impuestos ni aranceles aplicables y están sujetos a la disponibilidad de la oferta de productos

Incrustación de la biblioteca de modelos

Utilice modelos embedding de código abierto y desarrollados por IBM, implementados en IBM watsonx.ai, para tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos. O elija un proveedor de modelos embedding de terceros.

Modelos de incrustación de IBM

Nombre del modelo

Proveedor

Casos de uso

Longitud del contexto

Precio

Dólar/1 millón de tokens*

granite-embedding-107m-multilingual

Nuevo

IBM

Tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0,10

granite-embedding-278m-multilingual

IBM

Tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0,10

slate-125m-english-rtrvr-v2

IBM

Tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0,10

slate-125m-english-rtrvr

IBM

Tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0,10

slate-30m-english-rtrvr-v2

IBM

Tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0,10

slate-30m-english-rtrvr

IBM

Tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0,10

*Los precios indicados son orientativos, pueden variar según el país, no incluyen impuestos ni aranceles aplicables y están sujetos a la disponibilidad de la oferta de productos

Modelos de incrustación de terceros

Nombre del modelo

Proveedor

Casos de uso

Longitud del contexto

Precio

Dólar/1 millón de tokens*

all-mini-l6-v2

Nuevo

Microsoft

Tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

256

0,10

all-minilm-l12-v2

OS-NLP-CV

Tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

256

0,10

multilingual-e5-large

Intel

Tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0,10

*Los precios indicados son orientativos, pueden variar según el país, no incluyen impuestos ni aranceles aplicables y están sujetos a la disponibilidad de la oferta de productos

Recursos

Cómo elegir el modelo fundacional de IA adecuado

Consulte el manual de instrucciones completo de Granite

IA generativa y ML para la empresa

Hugging Face e IBM trabajan juntos en el código abierto

Propiedad intelectual

IBM cree en la creación, implementación y utilización de modelos de IA que impulsen la innovación en toda la empresa de manera responsable. El portfolio de IA de IBM watsonx cuenta con un proceso integral para crear y probar modelos fundacionales e IA generativa. Para los modelos desarrollados por IBM, buscamos y eliminamos duplicaciones, y empleamos listas de bloqueo de URL, filtros para contenido objetable y calidad de documentos, división de oraciones y técnicas de tokenización, todo ello antes de la fase de entrenamiento del modelo.

Durante el proceso de entrenamiento con datos, trabajamos para evitar desajustes en los resultados del modelo y utilizamos ajustes supervisados para facilitar el seguimiento de las instrucciones, de manera que el modelo pueda usarse para completar tareas empresariales mediante prompt engineering. Seguimos desarrollando los modelos Granite en varias direcciones, incluyendo otras modalidades, contenido específico para cada sector y más anotaciones de datos para el entrenamiento, a la vez que implementamos medidas de protección de datos periódicas y continuas para los modelos desarrollados por IBM.

Dada la rápida evolución del panorama tecnológico de la IA generativa, se espera que nuestros procesos integrales evolucionen y mejoren continuamente. Como testimonio del rigor que IBM pone en el desarrollo y prueba de sus modelos fundacionales, la empresa ofrece su indemnización contractual estándar por propiedad intelectual para los modelos desarrollados por IBM, similar a la que ofrece para el hardware y los productos de software de IBM.

Además, a diferencia de otros proveedores de modelos de lenguaje de gran tamaño y en consonancia con el enfoque estándar de IBM en materia de indemnización, IBM no exige a sus clientes que le indemnicen por el uso que hagan de los modelos desarrollados por IBM. Asimismo, en consonancia con el enfoque de IBM respecto a su obligación en materia de indemnización, IBM no limita su responsabilidad por los modelos desarrollados por IBM.

Entre los modelos watsonx que actualmente gozan de estas protecciones figuran:

(1) Familia Slate de modelos solo con codificador

(2) Familia Granite de modelo solo de decodificación

Más información sobre las licencias para modelos Granite (PDF)

De el siguiente paso

Empiece a poner en práctica y escalar la IA generativa y el machine learning para su negocio explorando nuestra prueba sin coste o solicitando una demostración en directo.

Más opciones para profundizar

Conecte con la comunidad de IBM

Lea la documentación de SaaS

Lea la documentación del software

Encuentre asistencia técnica

Notas a pie de página

^* La longitud del contexto es compatible con el proveedor del modelo, pero la longitud real del contexto en la plataforma es limitada. Para más información, consulte Documentación.

La inferencia se factura en unidades de recursos. 1 unidad de recursos equivale a 1000 tokens. Los tokens de entrada y finalización se cobran al mismo precio. 1000 tokens equivalen generalmente a unas 750 palabras.

No todos los modelos están disponibles en todas las regiones. Consulte nuestra documentación para obtener más información.

Longitud del contexto expresada en tokens.

Las declaraciones relativas a los planes, dirección e intenciones de IBM están sujetas a cambio o retirada sin previo aviso a discreción exclusiva de IBM. Ver Precios para obtener más detalles. A menos que se especifique lo contrario en precios de Software, todas las características, capacidades y actualizaciones potenciales se refieren exclusivamente a SaaS. IBM no garantiza que las características y capacidades de SaaS y del software sean las mismas.

Modelos fundacionales en watsonx.ai

Elija el modelo que necesita

Novedades

Biblioteca de modelos fundacionales

Historias de clientes

Modelos fundacionales de IBM

Metamodelos

Modelos Mistral

Modelos fundacionales de terceros

Incrustación de la biblioteca de modelos

Modelos de incrustación de IBM

Modelos de incrustación de terceros

Recursos

Propiedad intelectual

Notas a pie de página