手動でのクラスの編集
クラスは、完全に手動で作成するか、サンプリングに基づいて検索コレクションから派生させるか、またはインポートしたタクソノミーから作成することができます。どの方法で初期クラスを作成する場合も、結果の適切さを確認し、必要に応じて手動で調整する必要があります。
検索コレクションから派生した初期クラスをリストする画面を最初に表示すると (特に検索コレクションをサンプリングしてクラスを自動的に作成する場合は)、図 1 のような画面になることがあります。サンプリング・プロセスと大きなタクソノミーのインポートを同時に行うと、非常に時間がかかります。「Root Node」は、クラス階層の最上位として使用される内部ノードです。このノードは自動的に作成され、分類プロセスの完了後に保管および使用されることはありません。 また、どのクラスターにも該当しない文書のコンテナーとなる「Not Classified」クラスターも自動的に作成されます (「Not Classified」クラスター内にある文書の割合から、作成するクラスターがどの程度データを網羅しているかが分かります)。手動でクラスを作成すると、「Root Node」が表示され、そこからクラスを追加できます (図 1 の画面と同様)。

「Crawling」セクションの「Pending」と「Unprocessed URLs」の数が 0 になると、サンプリングまたはタクソノミー・インポートのプロセスが完了し、アイドル状態になります。「Indexing」セクションの「Uncommitted URLs」の数が 0 になると、索引付けが完了し、インデクサーもアイドル状態になります。この時点でクラス作成プロセスは完了であり、「Sample Results」ページに戻ることができます。
クラスを自動作成する方法を使用する場合は、クラス作成プロセスが完了すると図 2 のような画面が表示されます。
図 2 に示すように、「Root Node」および生成されたクラスには、クラスの名前の右側にメニューが表示されます。このメニューから、そのクラスに対して実行できる一連の操作にアクセスできます。実行可能なすべての操作を以下に示します。
- add - 現在選択しているクラスの下に新しいクラスを追加します。表示されるダイアログで、新しいクラスの名前、およびそのクラスに属する文書を特定するために使用される照会を指定できます。注: 選択したクラスの下に add コマンドまたは auto-classify コマンドでクラスを追加すると、クラス名の左側のアイコンが正符号に変わり、そのクラス内にクラスがあることが通知されます。正符号をクリックするとサブクラスが表示され、正符号が負符号に変わります。負符号をクリックすると、展開されたクラスが省略されます。
- auto-classify - 関連するクラス内に現在ある文書をサンプリングして、そのクラスの下にサブクラスを生成します (ルート・ノードまたは既にサブクラスを含んでいる他のノードにはサブクラスを生成できません)。
- redefine - 当該クラスに関連付けられた照会を変更するためのダイアログを表示します (ルート・ノードに関連付けられている照会はヌル照会であるため、再定義できません)。
- remove - クラスを削除することができます (ルート・ノードは削除できません)。
- rename - クラスの名前を変更するためのダイアログを表示します (ルート・ノードの名前は変更できません)。
- tag - 現在のクラスとそのクラスに含まれているすべてのサブクラスのタグ付けプロセスを開始します。タグ付けによって、現在のクラス名および関連する照会がタグとして各文書に保存されます。注: ルート・ノードでは、他のクラスが存在する場合にのみ「tag」オプションを使用できます。
このウィンドウの左側に表示された分類内でクラスターを選択すると、そのクラスターから 10 個のサンプル文書が表示されます。クラスターを選択すると、ディスプレイの右上隅に示される文書の総数が、選択したクラスター内の文書の数になります。
結果をサンプリングする際に一般に必要となる作業は、クラスの削除、クラス名の変更、クラス内の文書を特定するために使用される照会の拡張、手動による特定のクラスの作成、既存のクラスを自動分類することによるサブクラスの作成などです。作業が完了したら、「Auto-classification」画面の情報ヘッダーにある「Configuration」リンクをクリックして、自動分類の構成画面に戻ります。
自動分類ツールのサンプルの結果のページに 1 つ以上のクラスが表示されていれば、ステップ 3: 高速タグ付けに進むことができます。
