Automatyczne przygotowywanie danych (Automated Data Preparation — ADP)
Przygotowanie danych do analizy jest jednym z najważniejszych kroków każdego projektu eksploracji danych i tradycyjnie zajmuje najwięcej czasu. Węzeł Automatyczne przygotowanie danych (ADP) obsługuje to zadania za użytkownika przez analizę danych i identyfikację poprawek, klasyfikację zmiennych, które są problematyczne lub mają małe prawdopodobieństwo bycia użytecznymi, w razie potrzeby obliczanie nowych atrybutów i zwiększanie wydajności poprzez wykorzystywanie inteligentnych technik klasyfikowania. Tego węzła można używać w sposób w pełni automatyczny, pozwalając mu na wybór i zastosowanie poprawek, lub przeglądać zmiany przed ich dokonaniem i akceptować je lub odrzucać.
Używanie węzła ADP pozwala na szybkie przygotowanie do eksploracji danych bez potrzeby wcześniejszej znajomości stosowanych koncepcji statystycznych. Jeśli uruchamiasz węzeł z ustawieniami domyślnymi, modele będą budowane i oceniane szybciej.
Ten przykład używa strumienia o nazwie ADP_basic_demo.str, który odwołuje się do pliku danych o nazwie telco.sav, aby zademonstrować zwiększoną dokładność, którą można uzyskać, używając domyślnych ustawień węzła ADP podczas budowania modeli. Te pliki są dostępne w folderze Demos w katalogu instalacji programu IBM® SPSS Modeler. Można do niego uzyskać dostęp za pomocą grupy programów IBM SPSS Modeler w menu Start systemu Windows. Plik ADP_basic_demo.str znajduje się w katalogu streams.