Wenn Ihre Daten gleichmäßig verteilt sind, sollte auf Ihrem Host eine Ladeleistungsspitze von mindestens 75 Prozent CPU-Auslastung angezeigt werden. Sie können die Auslastung überwachen, indem Sie während des Ladevorgangs den Linux-Befehl top ausführen. Wenn die angezeigte CPU-Auslastung geringer ist, bedeutet dies entweder, dass die Daten ungleich verteilt werden, sodass die Workload nicht auf alle SPUs verteilt ist, oder dass der Parser auf die Daten wartet.
Wenn Ihre Eingabedaten ungleich verteilt werden, sodass alle Datensätze an einige wenige SPUs gesendet werden, werden die betreffenden SPUs zu einem Leistungsengpass.
Prüfen Sie, ob andere Datenbankaktivitäten gleichzeitig ausgeführt werden, die z. B. umfangreiche Ressourcen im SPU-zu-SPU-Broadcastbetrieb oder bei der SPU-Platten-E/A beanspruchen.
Die Leistung des IBM® Netezza-Appliance-Systems hängt von der Anzahl der SPUs ab. Wenn Daten jedoch über ein externes Netz hinweg in einem Datenstrom übertragen werden, wird die Leistung durch die Geschwindigkeit des Netzes begrenzt.
Testen Sie das Netz mithilfe des FTP-Befehls zum Senden einer Datei zwischen der Quelle und dem lokalen Host und messen Sie die Übertragungsrate. Unter optimalen Bedingungen liegt die Übertragungsrate in einem Gigabit Ethernet Netz bei ~1000 Mb/s oder ~125 MB/s oder ~450 GB/h.