IBM Support

カンマ区切りCSVファイルのデータ値にカンマを含むデータがある場合について

Question & Answer


Question

Modelerの可変長ファイル入力ノードでCSVファイルを読み込みます。 文字列フィールドの中に「年会費30,000円」と、本文中に「,」が入っているため、カンマ区切りCSVファイルが正しく区切られません。どのように設定をすればいいでしょうか。

Answer

Microsoft Officeの各種ソフトウェアで作成されますCSVファイルは、カンマ区切りの文字列を二重引用符「"」または単一引用符「'」で囲むことで、区切りのカンマと本文中のカンマを識別させております。これを Modelerでも利用できます。

可変長ファイル入力ノードを開き、ダイアログの[ファイル]タブでデータを設定し、プレビュー画面で文字列を囲むのに二重引用符が使用されているのか、単一引用符が使用されているのかを確認します。

そのうえで[引用符]枠の[二重引用符]または[単一引用符]で、[ペアで破棄]を設定してください。引用符は破棄されますので、「年会費30,000円」という文字列で区切られず読み込みます。

[{"Business Unit":{"code":"BU059","label":"IBM Software w\/o TPS"},"Product":{"code":"SS3RA7","label":"IBM SPSS Modeler"},"Component":"--","Platform":[{"code":"PF025","label":"Platform Independent"}],"Version":"Not Applicable","Edition":"","Line of Business":{"code":"LOB10","label":"Data and AI"}}]

Document Information

Modified date:
08 October 2019

UID

swg21634033