從文字檔讀取資料

文字檔代表另一個一般資料來源。許多試算表程式和資料庫可以將其內容存成多種文字檔格式。以逗點或 Tab 鍵分隔的檔案,參考使用逗點或 Tab 鍵的資料列來表示每個變數。在此範例中,資料由 Tab 鍵區隔。

  1. 在功能表上,選擇:

    檔案 > 匯入資料 > 文字資料

  2. 跳至 Samples\English 資料夾,並選取 demo.txt

    「文字匯入」精靈會引導您完成如何解譯指定文字檔的定義程序。

    圖 1. 文字匯入精靈:第 1 步(共 6 步)
    文字匯入精靈:第 1 步(共 6 步)
  3. 在步驟 1 中,您可以在精靈中選擇預先定義的格式,或者建立新的格式。選取
  4. 按一下「下一步」以繼續進行。

    如稍早所言,此檔案使用以 Tab 鍵分隔的格式。並且此檔案的第一行也已定義變數名稱。

  5. 在精靈的第 2 步中,選取分隔指示檔案使用分隔格式化結構。
  6. 選取指示檔案頂端包含變數名稱。
  7. 按一下「下一步」以繼續進行。
  8. 在第 3 步中,輸入 2 表示第一個資料觀察值的起始行號(因為變數名稱位於第一行)。
  9. 保留此步驟其餘的預設值,並按一下「下一步」以繼續進行。

    步驟 4 中的「資料」預覽為您提供確保正確讀取檔案的便捷方式。

  10. 選取「標籤」,然後取消選取其他定界字元。依預設,選取空格,因為檔案包含空格。對於此檔案,空格是資料值的一部分,而不是定界字元。您需要取消選取空格來正確讀取檔案。
  11. 選取移除字串值的前導空格。字串值開頭的空格會影響表示式中字串值的求值方法。在此檔案中,性別的部分值含有非值部分的前導空格。如果您不移除這些空格,則值 " f" 會被看作與值 "f" 不同。
    圖 2. 文字匯入精靈:第 4 步(共 6 步)
    文字匯入精靈:第 4 步(共 6 步),選取定界字元及移除前導空格
  12. 按一下「下一步」以繼續進行。

    因為變數名稱已修改為符合命名規則,第 5 步允許您編輯任何不需要的名稱。

    您也可以在這裡定義資料類型。例如,您可以將 Income 變更為元貨幣格式。

    若要變更資料類型:

  13. 資料預覽中,選取 Income
  14. 從「資料格式」下拉清單中選取「金額」。
    圖 3. 變更資料類型
    「文字匯入精靈」的第 5 步,已選取「收入」變數。針對變數的「資料」格式,選取元。

    變數 MaritalStatus 同時包含字串和數值。小於 5% 的值為字串。根據判定自動資料格式的值百分比的預設值 95%,變數將被看作的數值,而字串值會設定為系統遺漏值。如果沒有任何資料格式符合百分比值,則變數會被看作字串變數。如果將此設定變更為 100,則保留所有值,但所有數值都會被看作字串。

  15. 按一下「下一步」以繼續進行。
  16. 在最後一個步驟中保留預設選擇,並按一下「完成」匯入資料。