Juegos de caracteres y páginas de código

Incluso con el mismo esquema de codificación, existen diferentes CCSIDs y el mismo punto de código puede representar un carácter diferente en CCSIDs diferentes. Además, un byte de una serie de caracteres no representa necesariamente un carácter de un conjunto de caracteres de un solo byte (SBCS).

La figura siguiente muestra cómo un juego de caracteres típico puede correlacionarse con diferentes elementos de código de dos páginas de códigos distintas.

Figura 1. Correlaciones de páginas de códigos para el juego de caracteres ss1 en ASCII y EBCDIC
Comenzar descripción de figura. Una tabla muestra una página de códigos ASCII y otra tabla muestra una página de códigos EBCDIC. El juego de caracteres ss1 se correlaciona con puntos de código diferente para cada página de códigos. Finalizar descripción de figura.
En Unicode, solo hay un CCSID para UTF-8 y solo un CCSID para UTF-16. La figura siguiente muestra cómo los primeros 127 puntos de código único para UTF-8 son los mismos que ASCII con un CCSID de 367. Por ejemplo, tanto en el CCSID 367 de UTF-8 como de ASCII, una A es X'41' y un 1 es X'31'.
Figura 2. Correlación de puntos de código para los primeros 127 puntos de código para caracteres UTF-8 de un solo byte (CCSID 1208)
Comenzar descripción de figura. Una tabla que muestra la correlación de puntos de código para los primeros
127 puntos de código para UTF-8. Finalizar descripción de figura.
Esta imagen muestra una comparación de cómo se correlacionan algunos puntos de código UTF-16 y UTF-8 con algunos caracteres de ejemplo. El carácter del símbolo de la corchea tiene dos puntos de código de 2 bytes porque es un carácter suplementario.
Figura 3. Comparación de cómo algunos puntos de códigos UTF-8 y UTF-16 se correlacionan con algunos caracteres de ejemplo
Comenzar descripción de figura. Una tabla que muestra los puntos de código UTF-8 y UTF-16 para cuatro caracteres de ejemplo. La descripción adicional contiene una descripción literal de la tabla.