テキスト・ファイルの基本形式

テキスト・ファイルに既存の照合規則を調整する新規規則を指定すると、プロジェクト・レベル、ジョブ・レベル、またはステージ・レベルでそれらを参照できます。

テキスト・ファイルは、一連の規則が一行ずつ個別の行に書かれたものです。 それぞれの規則は、他の文字の順番を決める絶対ポイントであるアンカー・ポイントから 始まる整列済み文字のストリングを含みます。 規則の形式は &character です。 例えば、&a は、文字「a」がアンカー・ポイントであって、その行の他の規則はすべて、 その文字に関連付けられることを意味します。 次の表に、ユーザーが使用できる他の記号を示します。

記号 説明
< a < b 「a」と「b」の 1 次 (基本文字) 相違を表します。
<< a<<ä 「a」と「ä」の 2 次 (アクセント) 相違を表します。
<<< a<<<A 「a」と「A」の 3 次相違を表します。
= x =y 「x」と「y」に相違がないことを意味します。

例えば、規則 &a < g を適用したソート結果は次のようになります。

規則なし 規則あり
apple apple
Abernathy Abernathy
bird green
Boston bird
green Boston
Graham Graham

規則 &A<<<G を追加すると、ソートは次のようになり ます。

追加規則あり
apple
Abernathy
green
Graham
bird
Boston

このファイルに 指定できるオプションもあります。また、より高度な構文上のエレメントも使用できます。 これらについては、次のサイトで詳しく説明しています。

http://oss.software.ibm.com/icu/userguide/Collate_Customization.html

UCA 規則について詳しくは、次のサイトを参照してください。

http://www.unicode.org/unicode/reports/tr10/