Połączenie Apache HDFS

Aby uzyskać dostęp do danych w systemie Apache HDFS, utwórz dla niego zasób połączenia.

Apache Hadoop Distributed File System (HDFS) to rozproszony system plików, który został zaprojektowany do uruchamiania na sprzęcie towarowym. Apache HDFS to poprzednio Hortonworks HDFS.

Utwórz połączenie z serwerem Apache HDFS

Aby utworzyć zasób połączenia, należy podać te szczegóły połączenia. Adres URL WebHDFS jest wymagany.
Dostępne właściwości w formularzu połączenia zależą od tego, czy wybrano opcję Połącz z serwerem Apache Hive , aby można było zapisywać tabele w źródle danych Hive .

  • Adres URL WebHDFS do uzyskania dostępu do HDFS.
  • Host Hive : nazwa hosta lub adres IP serwera Apache Hive .
  • Baza danych Hive : baza danych w Apache Hive.
  • Numer portu Hive : numer portu serwera Apache Hive . Wartością domyślną jest 10000.
  • Hive Ścieżka HTTP: Ścieżka punktu końcowego, taka jak gateway/default/hive, gdy serwer jest skonfigurowany dla trybu transportu HTTP.
  • Certyfikat SSL (jeśli jest wymagany przez serwer Apache Hive ).

W przypadku opcji Połączenia prywatnew celu nawiązania połączenia z bazą danych, która nie jest eksternalizowana do Internetu (na przykład za firewallem), należy skonfigurować bezpieczne połączenie.

Wybierz metodę tworzenia połączenia na podstawie miejsca, w którym użytkownik znajduje się na platformie

W projekcie
Kliknij opcję Zasoby > Nowe zadanie > Połącz ze źródłem danych. Więcej informacji na ten temat zawiera sekcja Dodawanie połączenia z projektem.
W obszarze wdrażania
Kliknij opcję Dodaj do obszaru > Połączenie. Więcej informacji na ten temat zawiera sekcja Dodawanie połączeń do miejsca wdrażania.
W Platform assets catalog
Kliknij opcję Nowe połączenie.

Następny krok: dodawanie zasobów danych z połączenia

Miejsce, w którym można korzystać z tego połączenia

Połączeń Apache HDFS można używać w następujących obszarach roboczych i narzędziach:

Projekty

  • Data Refinery
  • SPSS Modeler

Katalogi

  • Platform assets catalog

Konfiguracja Apache HDFS

Zainstaluj i skonfiguruj klaster Hadoop

Obsługiwane typy plików:

Połączenie Apache HDFS obsługuje następujące typy plików: Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP i XML.

Więcej inform.

Apache HDFS -Podręcznik użytkownika

Temat nadrzędny: Obsługiwane połączenia