CCSID 5026 および CCSID 1390 の代替 Unicode 変換表

日本語コード・ページには、いくつかの IBM® コード化文字セット ID (CCSID) があります。 CCSID 5026 または CCSID 1390 が日本語 EBCDIC コード・ページとして登録されています。 Microsoft ODBC アプリケーションを使用して CCSID 5026 および CCSID 1390 の Db2® ホスト・データベースに接続する場合、CCSID 5026 および CCSID 1390 のデータを Unicode に変換する際に潜在的な問題が発生する可能性があります。 この問題は、IBM のコード・ページ変換表と Microsoft のコード・ページ変換表の違いによるものです。 以下の文字リストは、CCSID 5026 および CCSID 1390 から Unicode に変換される場合、使用される変換テーブル (IBM または Microsoft) に応じて異なるコード・ポイントになります。 これらの文字については、 IBM 変換表は、日本工業規格 (JIS) JISX0208、 JISX0212、および JISX0221で規定されている文字名に準拠しています。

表 1. CCSID 5026 および CCSID 1390 から Unicode へのコード・ポイント変換
EBCDIC コード・ポイント (文字名) IBM 1 次コード・ポイント (Unicode 名) Microsoft 基本コード・ポイント (Unicode 名)
X'444A' (全角ダッシュ) U+2014 (全角ダッシュ) U+2015 (横線)
X'43A1' (波形ダッシュ) U+301C (波形ダッシュ) U+FF5E (全角の波形記号)
X'447C' (二重縦線) U+2016 (二重縦線) U+2225 (並行標)
X'4260' (負符号) U+2212 (負符号) U+FF0D (全角のハイフン/負符号)
X'426A' (破線) U+00A6 (破線) U+FFE4 (全角の破線)
例えば、CCSID 5026 コード・ポイント X'444A' の文字 EM ダッシュは、 IBM 変換表を使用する場合は Unicode コード・ポイント U+2014 に変換されますが、Microsoft 変換表を使用する場合は U+2015 に変換されます。 これにより、Microsoft ODBC アプリケーションでは U+2014 が無効なコード・ポイントとして扱われるため、潜在的な問題が発生する可能性があります。 このような潜在的な問題を回避するには、CCSID 5026 から Unicode へのデフォルトの IBM 変換表を、 Db2 データベース・マネージャーによって提供される代替の Microsoft 変換表に置き換える必要があります。
注: Microsoft カスタマイズ・テーブルを使用する場合、2 つの異なる EBCDIC コード・ポイントが同じ Unicode コード・ポイントを指すことができます。
表 2. CCSID 1390 から Unicode コード・ポイントへの変換
EBCDIC コード・ポイント (文字名) IBM 1 次コード・ポイント (Unicode 名) Microsoft 基本コード・ポイント (Unicode 名)
X'444A' (全角ダッシュ) X'DDB7' (横線) U+2015 (横線)
X'43A1' (波形ダッシュ) X'E9F4' (全角の波形記号) U+FF5E (全角の波形記号)
X'447C' (二重縦線) X'DFE5' (並行標) U+2225 (並行標)
X'4260' (負符号) X'E9F3'(全角のハイフン/負符号) U+FF0D (全角のハイフン/負符号)
X'426A' (破線) X'E9F5' (全角の破線) U+FFE4 (全角の破線)