設定「變數檔案」節點的選項

請在「變數檔案」節點」對話框的「檔案」標籤上設定選項。

檔案 指定檔案名。可以輸入檔名或按一下省略按鈕 (...) 來選取檔案。您一旦選取了檔案,檔案路徑就會顯示,並且檔案內容將與分隔符號一起顯示在下方的畫面中。

您可以複製所顯示的來自資料來源的樣本文字,並將其貼上到下列控制項中:EOL 備註字元和使用者指定的分隔符號。使用 Ctrl-C 和 Ctrl-V 進行複製和貼上。

從檔案中讀取欄位名 此選項依預設處於已選取狀態,用於將資料檔案中的第一列作為欄的標籤進行處理。如果第一列不是標題,則取消選中此選項,針對資料集中的欄位數為每個欄位自動分配一個一般名稱,例如 Field1, Field2

指定欄位個數。指定每個記錄中的欄位個數。只要記錄以新行結束,就可以自動偵測欄位個數。也可以手動設定字段數。

跳過標題字元。指定要忽略第一個記錄的開頭處的多少個字元。

EOL 註解字元。指定字元(例如 # 或 !)表示資料中的註解。無論這些字元之一出現在資料檔案的何處,從該字元起直到下一個新行字元(不包括)之前的所有字元都將被忽略。

刪除前導及尾端空格。選中選項可廢棄匯入字串中開頭和結尾的空格。

註: 在使用與不使用 SQL 回送的字串之間的對比可能產生存在尾部空格的不同結果。

無效字元。選取捨棄以刪除資料來源中的無效字元。選取取代為以將無效字元取代為指定的符號(僅限一個字元)。無效字元為無效字元或指定的編碼方法中不存在的任何字元。

編碼。指定使用的文字編碼方法。您可以選擇系統預設、串流預設值或 UTF-8。

  • 系統預設值是在 Windows 控制台中指定,如果是以分散式模式執行,則是在伺服器電腦上指定。
  • 串流預設值在「串流內容」對話框中指定。

小數符號 請選取資料來源中使用的小數點類型。串流預設值是從串流內容對話框的「選項」標籤中選取的字元。否則,在此對話框中選取句號 (.)逗點 (,) 作為小數點讀取所有的資料。

行分隔符號是換行字元 要將換行字元用作行分隔符號,而非用作欄位定界字元,請選中此選項。例如,如果由於列中的定界字元數為奇數而導致換行,那麼此選項非常有用。請注意,選取此選項表示您將無法選取「定界字元」清單中的換行

註: 如果選中此選項,那麼將去除資料列末尾的所有空白值。

分隔符號。通過使用針對此控制項列出的勾選框,可以指定哪些字元(例如逗點 (,))定義檔案中的欄位範圍。也可以為使用多個分隔符號的記錄指定一個以上的分隔符號,例如「, |」。預設的分隔符號是逗點。

註: 如果逗點還定義為小數點符號,則此處的預設值將不起作用。如果逗點既是欄位定界字元又是小數點符號,請在欄位定界字元清單中選取其他。然後在輸入欄位中手動指定逗點。

選取允許多個空白分隔符號可將多個相鄰的空白分隔符號字元看作一個分隔符號。例如,如果在一個資料值之後隔四個空格又有一個資料值,則這群組資料將被看作是兩個而不是五個欄位。

要在其中掃描欄和類型的行數 請指定要在其中掃描所指定資料類型的行數和欄數。

自動辨識日期與時間 要使 IBM® SPSS® Modeler 能夠自動試圖將資料項目識別為日期或時間,請選中此勾選框。例如,這意味著 07-11-1965 之類的項目將被識別為日期,而 02:35:58 之類的項目將被識別為時間;然而,不明確的項目(例如 07111965 或 023558)由於數字之間沒有定界字元而將顯示為整數。

註: 為了避免使用來自先前 IBM SPSS Modeler 版本的資料檔案時出現潛在的資料問題,依預設,對於在第 13 版以前的版本中儲存的資訊,未勾選此方框。

將方括弧視為清單 如果選中此勾選框,那麼會將括在左右方括弧之間的資料視為單一值,即使該內容包含逗點和雙引號之類的定界字元也是如此。例如,這可能包含兩個或三個維度地理空間資料,在這些資料中,括在方括弧內的座標作為單個清單項目進行處理。如需相關資訊,請參閱將地理空間資料匯入到「變數檔案」節點中

引號。 通過使用下拉清單,可以指定匯入時如何處理單個和雙。可以選擇捨棄所有引號,選擇併入為文字將這些引號包含在欄位值內,或選擇配對並捨棄,為引號配對然後移除它們。如果引號未成對,則將收到錯誤訊息。選擇捨棄配對並捨棄都會將欄位值(不帶引號)按一個字串儲存。
註: 使用配對並捨棄時,將保留空格。使用捨棄時,將移除參照內外結尾的空格(例如:'" ab c" , "d ef " , " gh i " ' 將變成 'ab c, d ef, gh i')。使用納入為文字時,參照將視為常態符號,因此將自然去除開頭和結尾的空格。

在此對話框中操作的任何時刻,都可按一下重新整理以從資料來源重新載入欄位。在更改到來源節點的資料連線時,或在對話框的標籤之間進行操作時,此操作都非常有用。