Analizar datos de Apache Hadoop (Execution Engine for Apache Hadoop)

Puede crear y entrenar modelos en un clúster Hadoop. Si tiene datos en un sistema de almacenamiento Hive o HDFS en un clúster Hadoop, puede trabajar con dichos datos directamente en el clúster de Hadoop.

Servicio El servicio Execution Engine for Apache Hadoop no está disponible de forma predeterminada. Un administrador debe instalar este servicio en la plataforma IBM Cloud Pak for Data. Para determinar si un servicio está instalado, abra el Catálogo de servicios y compruebe si el servicio está habilitado.

Dentro de un proyecto de análisis con Watson Studio, puede encontrar plantillas de entorno de Hadoop en la página Entornos . Consulte Entornos de Hadoop.

Puede utilizar entornos de Hadoop de estas formas:

En este diagrama se muestra cómo los expertos de datos que trabajan en un proyecto de análisis en un clúster de Cloud Pak for Data pueden entrenar un cuaderno en un clúster de Hadoop con datos del clúster de Hadoop.

Arquitectura de Hadoop

Fuera de Cloud Pak for Data, puede gestionar modelos y datos en clústeres de Hadoop de este modo:

Más información

Tema principal: Análisis de datos y modelos de construcción