安装 Red Hat OpenShift AI

多个 "IBM® Software Hub服务需要 "Red Hat OpenShift AI。 如果计划安装使用 "Inference foundation models的服务,则必须安装 "Red Hat OpenShift AI来启动和服务模型。

安装阶段
  • 你不在这里设置客户工作站
  • 你不在这里 设置集群
  • 你不在这里收集所需信息
  • 你不在这里准备在受限网络中运行安装程序
  • 你不在这里准备从专用容器注册表运行安装程序
  • 您在这里的图标。为 "IBM Software Hub准备群集
  • 你不在这里准备安装 "IBM Software Hub实例
  • 你不在这里安装 "IBM Software Hub的实例
  • 你不在这里设置 "control plane
  • 你不在这里安装解决方案和服务
谁需要完成这项任务?

群集管理员群集管理员必须完成此任务。

您需要何时完成这项任务?
一次性设置如果计划安装一个或多个以下服务,请完成此任务:
  • IBM Knowledge Catalog Premium
  • IBM Knowledge Catalog Standard
  • watsonx.ai™
  • watsonx Assistant(需要使用 GPU 可选功能)
  • watsonx Code Assistant™
  • watsonx Code Assistant for Red Hat Ansible® Lightspeed
  • watsonx Code Assistant for Z
  • watsonx Code Assistant for Z Code Explanation
  • watsonx™ Orchestrate

关于本任务

该任务中的命令为 "Red Hat OpenShift AI安装了支持 "IBM Software Hub服务所需的最少组件。

服务 Red Hat OpenShift AI
IBM Knowledge Catalog Premium
IBM Knowledge Catalog Standard
watsonx.ai
watsonx Assistant 需要使用 GPU 可选功能。
watsonx Code Assistant
watsonx Code Assistant for Red Hat Ansible Lightspeed
watsonx Code Assistant for Z
watsonx Code Assistant for Z Code Explanation
watsonx Orchestrate

使用下表确定需要安装的 Red Hat OpenShift AI 版本:

解除 Red Hat OpenShift AI
5.1.3 ( 2025 年 4 月) 版本 2.16
5.1.2 ( 2025 年 3 月) 版本 2.16
5.1.1 ( 2025 年 2 月) 版本 2.16
5.1.0 ( 2024 年 12 月) 版本 2.13

过程

  1. 以群集管理员身份登录 "Red Hat OpenShift Container Platform
    ${OC_LOGIN}
    记住:"OC_LOGIN是 "oc login命令的别名。
  2. 创建 "redhat-ods-operator项目:
    oc new-project redhat-ods-operator

    命令返回以下响应:

    namespace/redhat-ods-operator created
  3. redhat-ods-operator 项目中创建 rhods-operator 操作员组:
    cat <<EOF |oc apply -f -
    apiVersion: operators.coreos.com/v1
    kind: OperatorGroup
    metadata:
      name: rhods-operator
      namespace: redhat-ods-operator
    EOF

    命令返回以下响应:

    operatorgroup.operators.coreos.com/rhods-operator created
  4. 根据安装的 Red Hat OpenShift AI 版本设置 CHANNEL_VERSION 环境变量:

    版本 2.13
    export CHANNEL_VERSION=stable-2.13

    版本 2.16
    export CHANNEL_VERSION=stable-2.16

  5. redhat-ods-operator 项目中创建 rhods-operator 操作员订阅:
    cat <<EOF |oc apply -f -
    apiVersion: operators.coreos.com/v1alpha1
    kind: Subscription
    metadata:
      name: rhods-operator
      namespace: redhat-ods-operator
    spec:
      name: rhods-operator
      channel: ${CHANNEL_VERSION}
      source: redhat-operators
      sourceNamespace: openshift-marketplace
      config:
         env:
            - name: "DISABLE_DSC_CONFIG"
    EOF

    命令返回以下响应:

    subscription.operators.coreos.com/rhods-operator created
  6. 检查 redhat-ods-operator 项目中 rhods-operator-* pod 的状态:
    oc get pods -n redhat-ods-operator

    确认 pod 为 "Running。 命令返回的响应格式如下:

    NAME                              READY   STATUS    RESTARTS   AGE
    rhods-operator-56c85d44c9-vtk74   1/1     Running   0          3h57m
  7. 在 "redhat-ods-monitoring项目中创建名为 "default-dsci的 DSC 初始化(DSCInitialization)对象:
    cat <<EOF |oc apply -f -
    apiVersion: dscinitialization.opendatahub.io/v1
    kind: DSCInitialization
    metadata:
      name: default-dsci
    spec:
      applicationsNamespace: redhat-ods-applications
      monitoring:
        managementState: Managed
        namespace: redhat-ods-monitoring
      serviceMesh:
        managementState: Removed
      trustedCABundle:
        managementState: Managed
        customCABundle: ""
    EOF
  8. 检查 DSC 初始化(DSCInitialization)对象的阶段:
    oc get dscinitialization

    确认对象为 "Ready。 命令返回的响应格式如下:

    NAME           AGE     PHASE
    default-dsci   4d18h   Ready
  9. 创建名为 default-dsc 的数据科学群集 (DataScienceCluster) 对象:
    cat <<EOF |oc apply -f -
    apiVersion: datasciencecluster.opendatahub.io/v1
    kind: DataScienceCluster
    metadata:
      name: default-dsc
    spec:
      components:
        codeflare:
          managementState: Removed
        dashboard:
          managementState: Removed
        datasciencepipelines:
          managementState: Removed
        kserve:
          managementState: Managed
          defaultDeploymentMode: RawDeployment
          serving:
            managementState: Removed
            name: knative-serving
        kueue:
          managementState: Removed
        modelmeshserving:
          managementState: Removed
        ray:
          managementState: Removed
        trainingoperator:
          managementState: Managed
        trustyai:
          managementState: Removed
        workbenches:
          managementState: Removed
    EOF

    Red Hat OpenShift AI Operator安装并管理 "Managed所列的服务。 未安装 "Removed的服务。

  10. 等待数据科学集群对象为 "Ready
    要检查对象的状态,请运行
    oc get datasciencecluster default-dsc -o jsonpath='"{.status.phase}" {"\n"}'
  11. 确认 "redhat-ods-applications项目中以下 pod 的状态为 "Running
    • kserve-controller-manager-* 荚果
    • kubeflow-training-operator-* 荚果
    • odh-model-controller-* 荚果
    oc get pods -n redhat-ods-applications

    命令返回的响应格式如下:

    NAME                                         READY   STATUS      RESTARTS   AGE
    kserve-controller-manager-57796d5b44-sh9n5   1/1     Running     0          4m57s
    kubeflow-training-operator-7b99d5584c-rh5hb  1/1     Running     0          4m57s
  12. 编辑 "redhat-ods-applications项目中的 "inferenceservice-config配置映射:
    1. 以群集管理员身份登录 "Red Hat OpenShift Container Platform网络控制台。
    2. 从导航菜单中选择工作负载 > 配置图
    3. 项目列表中选择 "redhat-ods-applications
    4. 点击 "inferenceservice-config资源。 然后,打开YAML选项卡。
    5. 在文件的 "metadata.annotations部分,添加 "opendatahub.io/managed: 'false'
      metadata:
        annotations:
          internal.config.kubernetes.io/previousKinds: ConfigMap
          internal.config.kubernetes.io/previousNames: inferenceservice-config
          internal.config.kubernetes.io/previousNamespaces: opendatahub
          opendatahub.io/managed: 'false'
    6. 在文件中找到以下条目:
      "domainTemplate": "{{ .Name }}-{{ .Namespace }}.{{ .IngressDomain }}",
    7. 将 "domainTemplate字段的值更新为 ""example.com"
      "domainTemplate": "example.com",
    8. 单击保存

下一步操作

现在您已经安装了 Red Hat OpenShift AI ,准备完成安装和设置 IBM 的多云对象网关 Software Hub