UCS-2 および UCS-2 とユニコード (UTF-16) の関係

ユニコードの初期バージョンである UCS-2 規格は、65,535 文字に制限されています。ただし、データ処理業界では 94,000 文字以上が必要とされるため、UCS-2 規格はユニコード UTF-16 規格に置き換えられています。

IBM® i オペレーティング・システムは、CCSID 13488 (UCS-2 として定義) および CCSID 1200 (UTF-16 として定義) をサポートします。システムでは、CCSID 13488 と CCSID 1200 の両方を UTF-16 エンコード方式として処理します。

どちらの方式を使用しても、ほとんどすべてのシステム操作で同じ結果が得られます。ただし、SQL 規格で定義されている文字境界上で動作する特定の SQL 関数では、異なる結果が生成される場合があります。例えば、CHARACTER、LENGTH、POSITION、および SUBSTRING の SQL 関数は、UTF-16 と UCS-2 を区別するため、異なる結果が得られます。これらの関数について詳しくは、SQL の解説書を参照してください。

UCS、UCS-2 (汎用複数オクテット・コード化文字セット)

ISO 10646 規格は、コンピューター・ファイルとしてテキストをエンコードするための文字コードです。ISO 10646 規格は、今日の主流の文字コードとなっている ASCII (および ASCII コードの拡張バージョンである ISO 8859-1) に基づいて作成されています。 ASCII でエンコードできるのはローマ字のアルファベットに限られているので、ISO 10646 は能力ははるかに優れています。ISO 10646 のエンコード方式では、世界中の文語として使用されている言語のすべての文字をエンコードできます。