Snowflakeの継続的な可観測性と監視を実現するため、IBM DatabandはSnowflakeをシームレスに統合
ユーザーによる質の低いデータの使用を防ぐためには、データ・エンジニアがSnowflake環境内のボトルネックや異常の発生場所と原因を特定できる必要があります。
IBM Databandは、Snowflakeウェアハウス内での継続的な可観測性を提供するため。データ・チームは、データ品質や鮮度、データ量に関連するSnowflakeテーブルのデータ・インシデントを検出し、迅速に解決できます。
カスタム・クエリーとセミ・カスタム・クエリーを使用して、列の問題を検出します。
データの欠落やデータ量の急増など、予期せぬ異常を検知します。
Snowflakeのアップデートが所定のデータSLAの範囲内で行われ、最新のデータが反映されていることを確認します。
Databandは現在、お客様のSnowflakeデータウェアハウス内の、Data at Rest(保存されたデータ)のインシデントの監視をサポートしています。このプロセスには以下が含まれます。
1. サービス・アカウントを作成し、必要な権限をDatabandに付与します。
2. DatabandでSnowflake用の新しいモニターを作成し、接続の詳細を指定します。
Snowflakeでの認証が完了すると、Databandで監視するテーブルを選択できます。データベース全体、スキーマ全体、または個別のテーブルを選択します。データベース全体やスキーマ全体を監視する場合は、そのデータベースやスキーマに後から追加するテーブルも、Databandの監視対象テーブルに自動で追加されます。
次の機能を使用して、Snowflakeテーブルの可観測性を簡素化し、一元化します。
Databandの強力なデータ品質アラートを活用して、コンシューマーに影響が及ぶ前に、SnowflakeテーブルのNULLや重複を検出します。またDatabandは、ボリューム・アラートを生成し、データ量の予期せぬ急増を検知します。さらに、データの鮮度に関するレポートにより、テーブルが時間通りに更新されたことを確認できます。
集中型コンソールからSnowflakeのデータ品質に関するすべてのインシデントとその根本原因を確認できるため、Databandはデバッグ時間を節約できます。データの過去の傾向を分析して、問題の重大度を把握し、根本原因を自動で検出できます。また、SnowflakeテーブルとDAGのリネージュと影響分析を確認できます。