ダーク・データのコストとデータ品質の問題すべてに、良い面があります。Splunk社が言うように、「ダーク・データは組織にとって最大の未開拓リソースの1つかもしれない」のです。3
ダークデータ管理にプロアクティブなアプローチを取る組織は、ダーク・データに光を当てることができます。そうすれば、負債とコストが削減されるだけでなく、チームは隠れたデータから洞察を見つけ出すのに必要なリソースも得られます。
ダーク・データを扱い、それを利用してデータに基づいたより良い意思決定を行う可能性があるとなれば、次のようなベスト・プラクティスに従うとよいです。
サイロを解消する
ダーク・データはしばしば、組織内のサイロが原因で発生します。あるチームが別のチームにとって有用になりうるデータを作成しても、他のチームはそのことを知りません。そうしたサイロを解消すると、そのデータを必要とするチームが利用できるようになります。ただ座っているだけのものから、絶大な価値をもたらすものになるのです。
データ管理を改善する
どのようなデータが組織内に存在するのかを把握することが重要です。この取り組みは、組織内のすべてのデータを分類し、正確なビューを完成させることから始まります。チームはそこから、チームの誰もが必要なものを容易に見つけて使えるようにすることを目標に、データをきちんと整理し始めるのです。
データ・ガバナンス・ポリシーを設定する
データ・ガバナンス・ポリシーの導入は、長期的に課題を改善するのに役立ちます。このポリシーでは、入ってくるすべてのデータがどのようにレビューされるかをカバーして、また何を保持(して整理することでデータ管理の明確さを維持)し、アーカイブし、または破棄するのかについてのガイドラインを明確にするべきです。このポリシーで重要な部分は、どのデータをいつ破棄するのかを厳密に規定することです。データ・ガバナンスを実施し、プラクティスを定期的にレビューすることで、利用されることのないダーク・データの量を最小限に抑えることができます。
MLツールとAIツールを使用してデータを解析する
ダーク・データの発見を支援する機械学習(ML)と人工知能(AI)に、貴重な洞察を含む可能性のあるデータの分析を実行させると、ダーク・データをカテゴリー化するという面倒な作業も実行できます。さらに、機械学習の自動化によって、保管されているデータの機密情報が自動的に編集されるので、データ・プライバシーのコンプライアンス規制を遵守する助けともなります。