手動でのクラスの編集

クラスは、完全に手動で作成するか、サンプリングに基づいて検索コレクションから派生させるか、またはインポートしたタクソノミーから作成することができます。どの方法で初期クラスを作成する場合も、結果の適切さを確認し、必要に応じて手動で調整する必要があります。

検索コレクションから派生した初期クラスをリストする画面を最初に表示すると (特に検索コレクションをサンプリングしてクラスを自動的に作成する場合は)、図 1 のような画面になることがあります。サンプリング・プロセスと大きなタクソノミーのインポートを同時に行うと、非常に時間がかかります。「Root Node」は、クラス階層の最上位として使用される内部ノードです。このノードは自動的に作成され、分類プロセスの完了後に保管および使用されることはありません。 また、どのクラスターにも該当しない文書のコンテナーとなる「Not Classified」クラスターも自動的に作成されます (「Not Classified」クラスター内にある文書の割合から、作成するクラスターがどの程度データを網羅しているかが分かります)。手動でクラスを作成すると、「Root Node」が表示され、そこからクラスを追加できます (図 1 の画面と同様)。

図 1. 最初の自動分類の結果
ヒント: 自動分類がまだ進行中かどうかが分からない場合は、サンプリングとタクソノミー適用のプロセスで内部的に使用される auto-classify 検索コレクションの状況を調べることで、自動分類の進行状況をモニターできます。このコレクションの状態を調べるには、Watson™ Explorer Engine 管理ツールで auto-classify コレクションを開き、その「Overview」タブをモニターします。この画面は 5 秒ごとに自動更新されます。

「Crawling」セクションの「Pending」と「Unprocessed URLs」の数が 0 になると、サンプリングまたはタクソノミー・インポートのプロセスが完了し、アイドル状態になります。「Indexing」セクションの「Uncommitted URLs」の数が 0 になると、索引付けが完了し、インデクサーもアイドル状態になります。この時点でクラス作成プロセスは完了であり、「Sample Results」ページに戻ることができます。

クラスを自動作成する方法を使用する場合は、クラス作成プロセスが完了すると図 2 のような画面が表示されます。

図 2. 完了した自動分類の結果 (最初のパス)

図 2 に示すように、「Root Node」および生成されたクラスには、クラスの名前の右側にメニューが表示されます。このメニューから、そのクラスに対して実行できる一連の操作にアクセスできます。実行可能なすべての操作を以下に示します。

このウィンドウの左側に表示された分類内でクラスターを選択すると、そのクラスターから 10 個のサンプル文書が表示されます。クラスターを選択すると、ディスプレイの右上隅に示される文書の総数が、選択したクラスター内の文書の数になります。

結果をサンプリングする際に一般に必要となる作業は、クラスの削除、クラス名の変更、クラス内の文書を特定するために使用される照会の拡張、手動による特定のクラスの作成、既存のクラスを自動分類することによるサブクラスの作成などです。作業が完了したら、「Auto-classification」画面の情報ヘッダーにある「Configuration」リンクをクリックして、自動分類の構成画面に戻ります。

自動分類ツールのサンプルの結果のページに 1 つ以上のクラスが表示されていれば、ステップ 3: 高速タグ付けに進むことができます。