設定串流的最佳化選項

您可以使用「最佳化」設定來最佳化串流效能。請注意,IBM® SPSS® Modeler Server(如果使用的話)上的效能和最佳化設定會置換用戶端上的任何相應設定。如果在伺服器中停用了這些設定,那麼用戶端無法將其啟用。但是,如果在伺服器中啟用它們,則用戶端可以選擇將其停用。

註: 資料庫建模和 SQL 最佳化需要在 IBM SPSS Modeler 電腦上啟用 IBM SPSS Modeler Server 連接。通過啟用此設定,您可以存取資料庫演算法,直接從 IBM SPSS Modeler 回送 SQL 以及存取 IBM SPSS Modeler Server。要驗證目前授權的狀態,請從 IBM SPSS Modeler 功能表中選擇下列項目。

說明 > 關於 > 其他詳細資訊

如果啟用了連接,您可以在「授權狀態」標籤中看到選項伺服器啟用

如需相關資訊,請參閱連接至

註: 是否受支援 SQL 回送和最佳化,取決於使用的資料庫類型。有關支援和測試可用於 IBM SPSS Modeler 的資料庫和 ODBC 驅動程式的最新資訊,請參閱公司支援網站 http://www.ibm.com/support

啟用串流重新寫入。選取此選項可啟用 IBM SPSS Modeler 中的串流重寫。提供了四種重寫類型,您可以選取其中的一種或多種類型。串流重寫會對串流中的節點在背景進行重新排序,使其在不更改串流語義的情況下更高效的作業。

  • 最佳化 SQL 產生。利用此選項可對串流中的節點進行重新排序,以便可以使用 SQL 產生回送更多的作業,使其在資料庫中執行。在發現某個節點無法以 SQL 表達時,最佳化工具將會向前檢查,確定是否有任何下游節點能夠以 SQL 表達並可以在不影響串流語義的情況下安全地移到問題節點前面。資料庫執行作業不但可以比 IBM SPSS Modeler 效率更高,而且這樣的回送作業可以減小傳回到 IBM SPSS Modeler 進行處理的資料集的大小。而這又可以進一步減小網路資料流量,加快串流作業的速度。請注意,必須已選取產生 SQL 勾選框後 SQL 最佳化才能生效。
  • 最佳化 CLEM 表示式。 此選項啟用最佳化工具來搜尋能夠在串流執行之前被預處理的 CLEM 表示式,從而增加處理速度。舉個簡單的範例,如果您有一個像 log(salary) 這樣的表示式,最佳化工具將計算實際工資值並通過傳送來對其進行處理。這可以用來提高 SQL 後推和 IBM SPSS Modeler Server 效能。
  • 最適語法執行。這種串流重寫方法會增加合併多個包含 IBM SPSS Statistics 語法節點的作業的效率。通過將語法指令合併到單個作業中,而不是作為個別的作業分別執行,從而實現最佳化。
  • 最佳化其他執行。這種串流重寫方法會增加無法委派給資料庫的作業的效率。最佳化是通過盡可能早地減少串流中的資料數量來獲得的。在保持資料完整性的同時,該串流會進行重寫,以使作業距離資料來源更接近,因而減少了具有較高消耗的作業(如結合)的下游資料。

啟用平行處理。當在一台帶有多處理器的電腦上執行時期,此選項使得系統能夠平衡這些處理器之間的負載,從而可能產生更佳的效能。使用多個節點或者使用下列單個節點可能會由於平行處理而受益:C5.0、合併(按鍵進行)、排序、分組(秩法和分位法)以及聚合(使用一個或多個索引鍵欄位)。

產生 SQL。選取此選項可啟用 SQL 產生,透過使用 SQL 代碼產生執行程序讓串流作業推回到資料庫,這可以改善效能。為了進一步改善效能,還可以選取最佳化 SQL 產生,從而實現將回送到資料庫的作業數最大化。節點的作業回送到資料庫之後,該節點將在串流執行時期以紫色強調顯示。

  • 資料庫快取。對於產生了要在資料庫中執行的 SQL 的串流,可以在中遊將資料快取到資料庫中的暫時表格,而不是快取到檔案系統。結合 SQL 最佳化使用時,這可能會造成效能顯著提升。例如,合併多個表格以建立資料採礦視圖的串流中的輸出在必要時可能會加以快取並重複使用。如果已啟用資料庫快取,則只需用用滑鼠右鍵按一下任意非終端節點就可以快取該點上的資料,並且在下次執行串流時,可以直接在資料庫中自動建立快取。如此一來,為下游節點產生 SQL 將成為可能,從而可進一步提高效能。此外,必要時可停用該選項,例如當原則或權限阻止資料寫入資料庫時。如果未啟用資料庫快取或 SQL 最佳化,則快取將會改為寫入檔案系統。如需相關資訊,請參閱主題節點的快取選項
  • 使用寬鬆轉換。利用此選項可以將資料從字串轉換為數字,或從數字轉換為字串(如果以適當的格式儲存)。例如,如果資料作為字串儲存在資料庫中,但實際包含有意義的數字,那麼可以轉換資料以便在回送時使用。
註: 由於 SQL 實作的微小差別,在資料庫中執行的串流傳回的結果可能會與在 IBM SPSS Modeler 中執行時期傳回的結果有著輕微的不同。也是因為上述原因,這些差別還可能根據資料庫供應商的不同而有所區別。

儲存為預設值。 指定的選項僅套用至現行串流。按一下此按鈕以將這些選項設為所有串流的預設值。