데이터 집합 구성
분석할 데이터 집합을 구성하는 방법을 알아보세요.
샘플 데이터 집합
표준 데이터 마이닝 데이터 세트는 Netezza Performance Server 분석 문서 세트에서 다양한 함수와 저장 프로시저가 정상 작동 시 어떻게 작동하는지에 대한 예제를 제공하는 데 사용됩니다. 데이터 세트는 제품의 다양한 구성 요소가 실제 시나리오에서 어떻게 사용될 수 있는지에 대한 인사이트로도 사용됩니다.
| 데이터 세트 이름 | 다운로드할 URL 및 파일 |
|---|---|
| 유통 | URL: fimi.ua.ac.be/data/ 파일: ' |
| CensusIncome | URL: archive.ics.uci.edu/ml/databases/census-income/ 파일: |
| WineQuality | URL: archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/ 파일: |
| 성인 | URL: archive.ics.uci.edu/ml/machine-learning-databases/adult 파일: |
| 대두 | URL: archive.ics.uci.edu/ml/machine-learning-databases/soybean 파일: |
| 아이리스색 | URL: archive.ics.uci.edu/ml/machine-learning-databases/iris/ 파일: |
샘플 데이터 집합 설치
- 각 데이터 세트 파일을 로컬 컴퓨터에 다운로드합니다. 파일이 압축되어 있는 경우(예: 확장자가 ' .gz '인 파일이 압축되어 있는 경우) 압축을 풀지 마세요.
- '
nz' 사용자로 호스트에 로그인합니다. - 예를 들어 다운로드한 데이터 집합을 저장할 디렉터리를 만듭니다:
/nz/export/ae/utilities/bin/testData - 데이터 세트 파일을 새로 만든 디렉터리로 전송합니다. 파일 이름을 변경하지 마세요.
- 다음 디렉터리로 이동합니다:
/nz/export/ae/utilities/bin - 다음 명령 중 하나를 입력하여 설치 스크립트를 실행합니다:
- 샘플 데이터 세트 파일이 ' /nz/export/ae/utilities/bin/testData 디렉터리에 있는 경우 :
./loadTestTables.sh - 샘플 데이터 세트 파일이 다른 디렉터리에 있는 경우:
파일에 포함된 데이터의 양이 많기 때문에 스크립트가 몇 분 동안 실행될 수 있습니다. 이는 정상 작동입니다../loadTestTables.sh path_to_directory - 스크립트가 완료되면 스크립트에 의해 생성된 임시 파일은 자동으로 삭제됩니다. 그러나 다운로드한 데이터 파일과 로그 파일은 삭제되지 않고 호스트에 남아 있습니다. 보관하지 않으려면 수동으로 삭제하세요.
- 샘플 데이터 세트 파일이 ' /nz/export/ae/utilities/bin/testData 디렉터리에 있는 경우 :
스크립트를 다시 실행하면 모든 샘플 데이터가 데이터베이스에서 삭제되고 해당 테이블이 삭제됩니다. 그런 다음 테이블이 다시 생성되고 원본 샘플 데이터가 다시 삽입됩니다.
Netezza Performance Server 카트리지 관리자(nzcm)
Netezza Performance Server 분석용 카트리지 관리는 Netezza Performance Server 카트리지 관리자(nzcm) 유틸리티를 사용하여 수행됩니다. Nzcm을 사용하여 카트리지를 설치, 제거, 등록, 등록 취소 및 기타 관리할 수 있습니다.
Nzcm 설치
Netezza Performance Server 분석은.nzc 파일 형식의 카트리지 모음으로 배포됩니다. 이러한 파일은 전체 Netezza Performance Server 분석 패키지에서 추출해야 합니다. ' Netezza Performance Server 애널리틱스 설치 유틸리티를 통해 카트리지와 ' Netezza Performance Server 카트리지 관리자(nzcm)를 추출하고 액세스할 수 있습니다.
- '
nz' 사용자로 호스트에 로그인합니다. - 다음 파일이 들어 있는 디렉토리로 이동합니다:
nz-analytics-vversion.zip - 다음 명령을 실행하십시오.
파일을 추출하려면 ' unzip 유틸리티를 사용해야 하며, ' gunzip 사용할 수 없습니다. 이 명령은 파일을 추출한 디렉터리 아래에 ' nzcmrepo '이라는 이름의 디렉터리를 만듭니다.unzip nz-analytics-vversion.zip - Nzcmrepo 하위 디렉터리(일반적으로 /nz/var/inza/nzcmrepo)로/var/inza/nzcmrepo.
- '
nzcm' 파일을 찾아 릴리스 번호를 확인합니다. 파일 이름은 'nzcm-<version>형식으로 지정됩니다. - 파일의 압축을 풉니다.
tar -xf nzcm-<version> - 압축이 풀리면 '
nzcm' 디렉토리로 이동합니다:cd /nz/var/inza/nzcmrepo/nzcm-<<version> - '
nzcm'을 설치합니다:./install.sh스크립트가 '
nzcm'을 ' /nz/var/nzcm ' 디렉터리에 설치하면 리포지토리가 자동으로 구성됩니다. - ' install.sh ' 스크립트 출력의 지시에 따라 실행합니다:
source ~/.bashrc - 다음 명령을 실행하여 대상 디렉터리로 변경합니다:
cd /nz/var/inza/nzcmrepo - 대상 디렉터리가 비어 있는지 확인합니다.
- 카트리지의 압축을 풀고 파일을 그룹화합니다:
이렇게 하면 'cp -f *.nzc /nz/var/nzcm/nzcmrepo/ cp -f *.grp /nz/var/nzcm/nzcmrepo/nzcm'이 설치됩니다.