Representación de datos de código de caracteres de varios bytes

Un código de caracteres de varios bytes es una representación externa de datos, independientemente de si se trata de la entrada de caracteres de un teclado o de un archivo en un disco. Dentro del mismo conjunto de códigos, el número de bytes que representan el código de varios bytes de un carácter puede variar. Debe utilizar funciones de soporte multicultural para el procesamiento de caracteres para garantizar la independencia del conjunto de códigos.

Por ejemplo, un conjunto de códigos puede especificar las siguientes codificaciones de caracteres:
C  = 0x43
*  = 0x81 0x43
*C = 0x81 0x43& 0x43

Un programa que busca C, que no representa caracteres de varios bytes, encuentra el segundo byte de la serie *C y presupone que ha encontrado C cuando, de hecho, ha encontrado el segundo byte del carácter * (asterisco).