出現頻度に基づく手法の詳細設定

単純で機械的な出現頻度に基づく手法に基づいて、カテゴリーを作成できます。この手法を使用して、指定されたレコードまたはドキュメントの数を超えて見つかった項目 (タイプ、コンセプト、またはパターン) ごとに 1 つずつカテゴリーを作成できます。また、あまり頻繁に出現しない項目すべてに 1 つカテゴリーを作成できます。度数ごとに、テキスト全体の出現数の合計に対し、対象の抽出されたコンセプト (およびその類義語)、タイプ、またはパターンを含むレコードまたはドキュメントの数を参照します。

一般的または重要な回答を示すため、頻繁に出現する項目をグループ化すると、関心のある結果を生成できます。他の手法が適用されると、この手法が未使用の抽出結果に非常に役立ちます。他にカテゴリーが存在しない場合、別のアプリケーションが抽出直後にこの手法を実行し、結果を編集して、関心のないカテゴリーを削除し、これらのカテゴリーを拡張して、より多くのレコードまたはドキュメントに一致するようにします。 詳しくは、カテゴリーの拡張のトピックを参照してください。

この手法を使用する代わりに、抽出結果ペインのレコードまたはドキュメント数の多い順にコンセプトまたはコンセプト・パターンを並べ替え。上位のコンセプトまたはコンセプト・パターンをカテゴリー・ペインにドラッグ・アンド・ドロップして、対応するカテゴリーを作成することができます。

以下は、「詳細設定: 出現頻度」ダイアログ・ボックスにあるフィールドです。

カテゴリーの記述子を生成: 記述子の入力の種類を選択します。 詳しくは、カテゴリーの作成のトピックを参照してください。

独自のカテゴリーを持つ項目の 最小ドキュメント 数。 このオプションを使用すると、頻繁に出現する項目からカテゴリーを作成できます。このオプションは、出力をレコード またはドキュメントの少なくとも X 数に含まれる記述子を含むカテゴリーに制限します。ここで、X はこのオプションに入力する値です。

すべての残りの項目を次のカテゴリーにグループ化: このオプションを使用すると、あまり頻繁に出現しないすべてのコンセプトまたはタイプを、選択した名前の付いた「キャッチオール」カテゴリーにグループ化します。デフォルトでは、カテゴリー名はその他です。

カテゴリー入力: 手法を適用するグループを選択します。

次の方法で重複するカテゴリー名を解決: 名前が既存のカテゴリーと同じ新規カテゴリーまたはサブカテゴリーの処理方法を選択します。新規カテゴリー (およびその記述子) と同じ名前を持つ既存カテゴリーとを結合できます。あるいは、既存のカテゴリーに重複する名前があった場合、カテゴリーの作成をスキップすることもできます。