データ・サンプリング

このタスクについて

デフォルトの自動分類方法では、検索コレクション内の文書をサンプリングし、サンプルからクラスを派生させることで文書を自動分類します。この方法を使用するには、以下の手順を実行します。

手順

  1. 「Create from Data Sampling」ラジオ・ボタンを選択したままにします。
  2. 必要に応じて以下のフィールドを変更します。
    • Number of Levels - 最初のサンプリング実行時に計算する分類/クラスタリング・ツリーのレベルの数。この値を大きくすると、クラスターの初期セットを作成するのに要する時間が長くなります。
    • Number of Classes - クラスを作成する処理では、データのランダムなサンプルが収集され、サンプルからクラスターが取得され、一部のクラスターがクラスとして使用されます。この処理は各種の設定に従って行われます。クラスの数を少なくしたり多くしたりするには、このスライダーで設定を変更します。

      特定のデータ・セットを初めてサンプリングするときは、スライダーを中央に合わせてサンプリングを行い、作成されたクラスの数を基に、そのベースラインに対する望ましい数に応じた位置にスライダーを移動してもう一度サンプリングを行います。

    分類方法を選択し、その方法に必要な値を指定したら、以下の手順を実行します。

  3. 「Create from Data Sampling」方法を使用する場合は、「Start Sampling」をクリックします。
  4. 既存のタクソノミーをインポートする場合は、「Import」をクリックします。

    図 1 のようなダイアログが表示されます。

    図 1. クラス作成後に表示されるダイアログ
  5. 「See the progress here」リンクをクリックして、このチュートリアルの次のステップに進みます。

    このステップでは、コレクション内の文書に対して生成されたクラスを表示して編集することができます。

タスクの結果

次のセクションに進むには、手動でのクラスの編集をクリックしてください。