データ・サンプリング

データ・サンプリングは、 IBM® Cognos® Analytics 人工知能 (AI) が基礎となるデータ・サーバー内のデータについて学習するための手段です。 このデータは、自動化を向上させ、視覚化の提案を向上させるために AI によって使用されます。

サンプル・データがないと、一部の Cognos Analytics 機能が機能しません。 例えば、 「探索」 の関係図は、サンプル・データが使用可能な場合にのみ表示されます。 それ以外の場合は、表示されません。

スキーマ・メタデータのロード または パッケージのエンリッチ時に、基礎となるデータ・サーバーから統計データのサンプルを取得できます。 この機能を有効にするには、関連するダイアログ・ボックスの 「サンプル・データの取得」 チェック・ボックスを選択します。

デフォルトでは、表ごとのデータの統計サンプル (パッケージのクエリー・サブジェクト) の 1000 行が、基礎となるデータ・サーバーから取得されます。 このサンプル・データは、 Cognos Analytics AI が特性 (「拡張メタデータ」) を推測するために使用します。これは、自動化の選択および視覚化の提案において AI を支援します。

サンプル・データから推測できる特性の例として、各フィールドの固有値の概数が挙げられます。 この情報は、AI が視覚化タイプの推奨を行う際に役立ちます。 例えば、棒グラフは、棒として表示する固有値が多すぎない場合にのみ推奨されます。 バブル・チャートは、何百もの固有値を持つデータ・フィールドにより適しています。

データ・サンプルで取得されるデータのタイプと量は必ずしも同じではなく、以下の要因の影響を受けます。
  • 表内の特定の表または列を照会するためのユーザーの許可。
  • ユーザーが表示できる行を制約するデータ・セキュリティー。
  • ユーザーが表示できるデータを変更する可能性があるデータ・マスキング。
  • マクロのために式が動的である可能性があります。
  • データ・サーバー接続は、マクロまたは接続上のセキュリティーのために動的である可能性があります。

データ・サンプリングの無効化

データ・サーバー内のすべての表のデータ・サンプリングを無効にするには、メタデータ・ロード・ユーザー・インターフェースまたはパッケージ・エンリッチ・ユーザー・インターフェースの 「サンプル・データの取得」 チェック・ボックスをクリアします。

データ・サンプリングが無効になっている場合、 Cognos Analytics AI はデータに関する多くの特性を認識しません。 データ・サーバー・メタデータを見ることによって、いくつかの特性を認識していますが、サンプル・データにアクセスした場合に認識されるほど多くはありません。 上の例を使用すると、サンプリングを行わない場合、固有値が多すぎてこの視覚化タイプに適していないデータ・フィールドに対しても、棒グラフが推奨される可能性があります。 要約すると、視覚化の推奨機能は、サンプル・データから推測される特性なしで動作しますが、機能しません。

データ・サンプリングの無効化は、以下の状況では正当化されます。
  • サンプル・データの取得時にエラーが発生します。
  • システムに対するパフォーマンスの低下の影響が大きすぎます。

データ・サンプリングを完全に無効にする代わりに、 「サンプル・データの取得 (Retrieve sample data)」 チェック・ボックスを選択したままにして、一部の表をプロセスから除外することができます。 メタデータ・ロードとパッケージ・エンリッチの両方のユーザー・インターフェースに、表を選択解除するオプションが含まれています。 例えば、エラーを生成する表を除外することができます。 取得されるサンプル行の数を減らすこともできます。