從文字檔讀取資料
文字檔代表另一個一般資料來源。許多試算表程式和資料庫可以將其內容存成多種文字檔格式。以逗點或 Tab 鍵分隔的檔案,參考使用逗點或 Tab 鍵的資料列來表示每個變數。在此範例中,資料由 Tab 鍵區隔。
- 在功能表上,選擇:
- 跳至 Samples\English 資料夾,並選取 demo.txt。
「文字匯入」精靈會引導您完成如何解譯指定文字檔的定義程序。
- 在步驟 1 中,您可以在精靈中選擇預先定義的格式,或者建立新的格式。選取否。
- 按一下「下一步」以繼續進行。
如稍早所言,此檔案使用以 Tab 鍵分隔的格式。並且此檔案的第一行也已定義變數名稱。
- 在精靈的第 2 步中,選取分隔指示檔案使用分隔格式化結構。
- 選取是指示檔案頂端包含變數名稱。
- 按一下「下一步」以繼續進行。
- 在第 3 步中,輸入 2 表示第一個資料觀察值的起始行號(因為變數名稱位於第一行)。
- 保留此步驟其餘的預設值,並按一下「下一步」以繼續進行。
步驟 4 中的「資料」預覽為您提供確保正確讀取檔案的便捷方式。
- 選取「標籤」,然後取消選取其他定界字元。依預設,選取空格,因為檔案包含空格。對於此檔案,空格是資料值的一部分,而不是定界字元。您需要取消選取空格來正確讀取檔案。
- 選取移除字串值的前導空格。字串值開頭的空格會影響表示式中字串值的求值方法。在此檔案中,性別的部分值含有非值部分的前導空格。如果您不移除這些空格,則值 " f" 會被看作與值 "f" 不同。
- 按一下「下一步」以繼續進行。
因為變數名稱已修改為符合命名規則,第 5 步允許您編輯任何不需要的名稱。
您也可以在這裡定義資料類型。例如,您可以將 Income 變更為元貨幣格式。
若要變更資料類型:
- 在資料預覽中,選取 Income。
- 從「資料格式」下拉清單中選取「金額」。
變數 MaritalStatus 同時包含字串和數值。小於 5% 的值為字串。根據判定自動資料格式的值百分比的預設值 95%,變數將被看作的數值,而字串值會設定為系統遺漏值。如果沒有任何資料格式符合百分比值,則變數會被看作字串變數。如果將此設定變更為 100,則保留所有值,但所有數值都會被看作字串。
- 按一下「下一步」以繼續進行。
- 在最後一個步驟中保留預設選擇,並按一下「完成」匯入資料。