Połączenie Apache HDFS
Aby uzyskać dostęp do danych w systemie Apache HDFS, utwórz dla niego zasób połączenia.
Apache Hadoop Distributed File System (HDFS) to rozproszony system plików, który został zaprojektowany do uruchamiania na sprzęcie towarowym. Apache HDFS to poprzednio Hortonworks HDFS.
Utwórz połączenie z serwerem Apache HDFS
Aby utworzyć zasób połączenia, należy podać te szczegóły połączenia. Adres URL WebHDFS jest wymagany.
Dostępne właściwości w formularzu połączenia zależą od tego, czy wybrano opcję Połącz z serwerem Apache Hive , aby można było zapisywać tabele w źródle danych Hive .
- Adres URL WebHDFS do uzyskania dostępu do HDFS.
- Host Hive : nazwa hosta lub adres IP serwera Apache Hive .
- Baza danych Hive : baza danych w Apache Hive.
- Numer portu Hive : numer portu serwera Apache Hive . Wartością domyślną jest
10000. - Hive Ścieżka HTTP: Ścieżka punktu końcowego, taka jak gateway/default/hive, gdy serwer jest skonfigurowany dla trybu transportu HTTP.
- Certyfikat SSL (jeśli jest wymagany przez serwer Apache Hive ).
W przypadku opcji Połączenia prywatnew celu nawiązania połączenia z bazą danych, która nie jest eksternalizowana do Internetu (na przykład za firewallem), należy skonfigurować bezpieczne połączenie.
Wybierz metodę tworzenia połączenia na podstawie miejsca, w którym użytkownik znajduje się na platformie
- W projekcie
- Kliknij opcję Zasoby > Nowe zadanie > Połącz ze źródłem danych. Więcej informacji na ten temat zawiera sekcja Dodawanie połączenia z projektem.
- W obszarze wdrażania
- Kliknij opcję Dodaj do obszaru > Połączenie. Więcej informacji na ten temat zawiera sekcja Dodawanie połączeń do miejsca wdrażania.
- W Platform assets catalog
- Kliknij opcję Nowe połączenie.
Następny krok: dodawanie zasobów danych z połączenia
- Więcej informacji na ten temat zawiera sekcja Dodawanie danych z połączenia w projekcie.
Miejsce, w którym można korzystać z tego połączenia
Połączeń Apache HDFS można używać w następujących obszarach roboczych i narzędziach:
Projekty
- Data Refinery
- SPSS Modeler
Katalogi
- Platform assets catalog
Konfiguracja Apache HDFS
Obsługiwane typy plików:
Połączenie Apache HDFS obsługuje następujące typy plików: Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP i XML.
Więcej inform.
Apache HDFS -Podręcznik użytkownika
Temat nadrzędny: Obsługiwane połączenia