讀取 CSV 檔案

若要讀取 CSV 檔案,請從功能表中選擇:檔案 > 匯入...,或將現有的 CSV 檔案直接拖放到開啟的 IBM® SPSS® Statistics 實例中。

註: 「匯入資料」功能不支援在引用文字中包括內嵌換行的 CSV 資料。可能的暫行解決方法是將包括引用內嵌換行的 CSV 檔案另存為 .xls/.xlsx 檔,然後使用「匯入 Excel」功能。

匯入 CSV 資料」對話框會讀取使用逗點、分號或 Tab 空格作為值之間定界字元的 CSV 格式文字資料檔案。在選取適當的匯入設定之後,按一下匯入

變數設定對話框

定界字元
定界字元是用來區隔變數的字元。值可以是定位點、逗點、空格、分號或您定義的字元。每個觀察值的變數都會依相同的順序記錄,但未必會記錄在相同的位置。
文字限定元
限定元是用來將包含定界字元的值括住的字元。出現在值開頭與結尾的限定元。限定元可以是雙引號、單引號或無。
變數名稱位於檔案區段的最上層
指定變數名稱是否位於 CSV 檔案的最上層。指定行號上的值用來建立變數名稱。不符合變數命名規則的變數,會轉換成有效的變數名稱。
前導和尾端空格
指定是否要移除字串值開頭及/或尾端的空格字元。
註: 尾端空格會影響字串變數已定義寬度的計算。選取空格字元作為定界字元時,不會將多個連續空格視為多個定界字元。

觀察值設定對話框

第一個觀察值
指出包含資料值的資料檔的第一行。如果資料檔的最上行包括描述性標籤或是其他不代表資料值的文字,則這就不會是第一行。
觀察值表示法
控制匯入如何判定每一個觀察值在何處結束以及下一個在何處開始。
每一行代表一個觀察值
每一行只包含一個觀察值。單一行 (列) 包含一觀察值是很普遍的,即使這樣對於有大量變數的資料檔來說會是非常長的行。如果並非所有的行都包括資料值的同樣數字,那麼每一觀察值的變數的數料會由最大資料值來決定。有較小資料值的觀察值會被指定其他變數的遺漏值。
多個變數代表一個觀察值
每一觀察值指定的變數個數會告訴匯入要在何處停止讀取觀察值,以及在何處開始讀取下一個。同一行可以包含多個觀察值,同時觀察值可以在一行的中間開始,然後在下一行中繼續。匯入功能判定每一個觀察值結尾的根據是讀取的值數,而不是行數。每一觀察值必須包含所有變數的資料值(或是由定界字元指定的遺漏值),否則資料檔會被不正確地讀取。
要匯入的觀察值
你可以匯入在資料檔中所有的觀察值,最初 n 個觀察值 (n 是你指定的數字),或是指定百分比的隨機樣本。由於這個隨機樣本程式,會對各觀察值做不同的虛擬隨機決定,因此所選擇的觀察值百分比,只能近似指定的百分比。資料檔中的觀察值越多,則所選觀察值的百分比,就越能接近指定的百分比。

資料格式對話框

資料選項
在預覽區段中選取變數
你可以將預設變數名稱重複寫在自己的變數名稱上面。如果您從資料檔中讀取變數名稱,則會自動修改不符合變數命名規則的名稱。在之前的視窗中選取變數,然後輸入變數名稱。
判定自動資料格式的值百分比
每一個變數的資料類型由符合相同格式的值百分比判斷。
  • 值必須大於 50。
  • 用來判斷百分比的分母是每一個變數的非空白值數目。
  • 如果沒有任何一致格式是由指定的值百分比使用,則會為該變數指派字串資料類型。
  • 對於已基於百分比值指派數值格式(其中包括日期與時間格式)的變數,會為不符合該格式的值指派系統遺漏的值。
局部快取資料
資料快取是暫存磁碟空間中儲存之資料檔案的完整副本。快取資料檔可增進效能。
資料格式
從下拉清單中選取資料格式。如需相關資訊,請參閱格式化選項