Une définition de classification affecte une valeur à une classe. La définition peut inclure des informations supplémentaires sur la valeur et affecter d'autres valeurs similaires.
La valeur standard peut être une abréviation ou une variante développée du mot. Par exemple, la valeur standard pour WEST peut être W, et la valeur standard pour POB peut être "PO BOX".
Dans la table des classifications (précédemment appelé fichier .CLS), la longueur maximale d'une valeur standard est égale à 25 caractères.
Dans la définition de classification pour une valeur dans la classe NULL, la valeur standard n'est pas obligatoire.
Le degré de variation qui peut exister dans l'orthographe ou la représentation de la valeur. Si vous voulez que la définition de classification affecte des valeurs différentes de la valeur de la définition, vous pouvez définir le seuil de similitude au-dessous de la valeur par défaut 900.
Lorsque le jeu de règles qui contient une définition de classification est appliqué aux données, les valeurs présentes dans les données sont comparées et un score est attribué. Ce score indique le degré de similitude entre deux valeurs. La méthode de comparaison de chaînes utilisée peut prendre en compte les erreurs phonétiques, les insertions, suppressions et remplacements de caractères aléatoires, ainsi que les transpositions de caractères.
Le score est pondéré par la longueur de la valeur car des erreurs mineures dans des valeurs longues sont moins graves que des erreurs détectées dans des valeurs courtes. Etant donné que les erreurs dans les valeurs courtes ne sont généralement pas tolérées, n'indiquez pas de seuil de similitude pour les valeurs courtes.