Los modelos de IBM watsonx están diseñados para la empresa y optimizados para dominios de negocio y casos de uso específicos. A través del estudio de IA IBM® watsonx.aiofrecemos una selección de modelos fundacionales rentables y de nivel empresarial desarrollados por IBM, modelos de código abierto y modelos procedentes de proveedores externos para ayudar a los clientes y socios a escalar y poner en funcionamiento la inteligencia artificial (IA) más rápido con un riesgo mínimo. Puede implementar los modelos de IA dondequiera que se encuentre su carga de trabajo, tanto en las instalaciones como en la nube híbrida.
IBM adopta un enfoque diferenciado para ofrecer modelos fundacionales de nivel empresarial:
La biblioteca de modelos fundacionales de IBM watsonx le brinda la opción y flexibilidad de elegir el modelo que mejor se adapte a sus necesidades comerciales, intereses regionales y perfiles de riesgo de una biblioteca de modelos propios, de código abierto y de terceros.
IBM Granite es una serie insignia de modelos fundacionales de lenguaje de gran tamaño basados en una arquitectura transformadora de solo decodificador. Los modelos de lenguaje Granite se entrenan con datos empresariales confiables que abarcan áreas de Internet, académicos, de código, legales y financieros.
Los modelos ofrecen constantemente un rendimiento mejorado en casos de uso populares, como generación de contenido, resumen, clasificación, extracción de insights y generación aumentada de recuperación (RAG).
Inicie la prueba gratuita de watsonx.ai
Vea cómo se entrenaron los modelos de Granite y cómo se utilizaron las fuentes de datos
Entrenado con contenido relevante para la empresa, IBM Granite cumple con rigurosos criterios de gobernanza de datos, normativos y de riesgo definidos y aplicados por el Código de ética de IA de IBM y la Oficina Principal de Privacidad.
Precisión mejorada en dominios empresariales específicos, como las finanzas, y casos de uso como la RAG, mediante técnicas de ajuste del chat y alineación de modelos.
Un modelo a un precio competitivo con menos requisitos de infraestructura, indemnización de IP y un kit de herramientas fácil de usar para la personalización del modelo y la integración de aplicaciones.
Seleccione el modelo fundacional generativo que mejor se adapte a sus necesidades. Después de haber seleccionado modelos para su caso de uso, pruébelos sistemáticamente por medio de técnicas de ingeniería de indicaciones para ver cuáles arrojan siempre los resultados deseados.
granite-13b-chat
IBM
Admite tareas de preguntas y respuestas (Q&A), resumen, clasificación, generación, extracción y RAG.
8192
0.0006
granite-13b-instruct
IBM
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.
8192
0.0006
granite-20b-multilingual
IBM
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, traducción y RAG en francés, alemán, portugués, español e inglés.
8190
0.0006
llama-2-70b-chat
Meta
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.
4096
0.0018
llama-2-13b-chat
Meta
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG. Disponible para el ajuste rápido.
4096
0.0006
codellama-34b-instruct
Meta
Modelo de tarea específica para código que genera y traduce un código desde una indicación de lenguaje natural.
4096
0.0018
mixtral-8x7b-instruct
Mistral AI
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y generación de código.
32768
0.0006
granite-8b-japanese
IBM
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, traducción y RAG en japonés.
4096
0.0006
flan-t5-xl-3b
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG. Disponible para el ajuste rápido.
4096
0.0006
flan-t5-xxl-11b
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.
4096
0.0018
flan-ul2-20b
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.
4096
0.005
elyza-japanese-llama-2-7b-instruct
ELYZA
Admite tareas de preguntas y respuestas, resumen, RAG, clasificación, generación, extracción y traducción.
4096
0.0018
mt0-xxl-13b
BigScience
Admite tareas de Preguntas y respuestas, resumen, clasificación y generación.
4096
0.0018
Las empresas están entusiasmadas con la posibilidad de aprovechar los modelos fundacionales y aprendizaje automático en un solo lugar, con sus propios datos, para acelerar las cargas de trabajo de IA generativa.
IBM cree en la creación, el despliegue y la utilización de modelos de IA que impulsan la innovación en toda la empresa de manera responsable. La plataforma de datos y de IA watsonx tiene un proceso de extremo a extremo para diseñar y probar modelos fundacionales e IA generativa. Para los modelos desarrollados por IBM, buscamos y eliminamos duplicaciones; además, empleamos listas de bloqueo de URL, filtros para contenido objetable y calidad de documentos, división de oraciones y creación de tokens, todo antes del entrenamiento del modelo.
Durante el proceso de entrenamiento con datos, trabajamos para evitar desalineaciones en las salidas del modelo y utilizamos ajustes supervisados para permitir un mejor seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante la ingeniería de indicaciones. Continuamos desarrollando los modelos Granite en varias direcciones, entre ellas otras modalidades, contenido específico de las industrias y más anotaciones de datos para el entrenamiento, al tiempo que desplegamos salvaguardas de protección de datos para los modelos desarrollados por IBM.
Dado el cambiante panorama de la tecnología de la IA generativa, se espera que nuestros procesos de extremo a extremo evolucionen y mejoren continuamente. Como testimonio del rigor que IBM ejerce en el desarrollo y prueba de sus modelos fundacionales, la compañía proporciona su indemnización contractual estándar de propiedad intelectual para los modelos desarrollados por IBM, similar a la que ofrece para el hardware y los productos de software de IBM.
Además, a diferencia de otros proveedores de modelos de lenguajes de gran tamaño y en sintonía con el enfoque estándar de IBM sobre la indemnización, IBM no exige a sus clientes que indemnicen a IBM por el uso que hacen los clientes de los modelos desarrollados por IBM. Además, de acuerdo con el enfoque de IBM respecto de su obligación de indemnización, IBM no limita su responsabilidad de indemnización para los modelos desarrollados por IBM.
Los modelos actuales watsonx que ahora están amparados por estas protecciones incluyen:
(1) Familia Slate de modelos de solo codificador.
(2) Familia Granite de modelo de solo decodificador.
Obtenga más información sobre las licencias para los modelos Granite
Los precios de inferencia son por 1000 tokens (1 unidad de recursos). Los tokens de entrada y finalización se cobran a la misma tarifa. 1000 tokens equivalen generalmente a alrededor de 750 palabras.
No todos los modelos están disponibles en todas las regiones; consulte nuestra documentación para obtener más detalles.
La longitud del contexto se expresa en tokens.
Las declaraciones de IBM con respecto a sus planes, instrucciones e intenciones están sujetas a cambios o retiros sin previo aviso según el criterio exclusivo. Consulte los Precios para obtener más detalles. A menos que se especifique lo contrario en los precios del software, todas las características, capacidades y actualizaciones potenciales se refieren exclusivamente a SaaS. IBM no garantiza que las características y capacidades de SaaS del software sean las mismas.