IBM Storage

個人情報との戦い

記事をシェアする:

コンプラ対策、機密情報管理、GDPR…データ検索に苦悩するエンジニア

「個人情報を含んだ画像と動画って、どうやって探せばいいのォォォォ〜!」

出典:エドヴァルド・ムンク「叫び」

#名画で学ぶストレージ

#情シスあるある

今回解説するのは私、「たけだ」です。

料理とロボットガジェットが大好きなストレージ名画ギャラリーのオーナー。Myダッチオーブンで作った本格料理の味は芸術の域。

一言:「芸術を理解するAIロボットを創りたいわ」

大切なのに、どこにあるのかわからない個人情報

コンプライアンス的に重要なデータやGDPRにかかわる個人情報、そして企業の機密情報など、セキュアな情報が増え続けているにも関わらず、実はどこにどの情報があるのか把握しきれていない…?しーっ!そんなこと言っちゃ、監査で引っかかっちゃいますよー!

「データが増えすぎて、何がどこにあるのかわからない」のは、データサイエンティストや情シス部のみなさんの隠された共通の悩み。このエドヴァルド・ムンクの名画「叫び」は、まさしく「機密情報を守り、監査対策に追われ、GDPR対応まで求められるエンジニアの叫び」を描いたものです。深刻だけど、日々増え続ける大量のデータや非構造化データをきちんと管理するのなんて無理ゲーと感じている方は多いのではないでしょうか。

 

データが大量すぎて、必要なデータが見つからない…

あふれかえるデータの中から個人情報やセキュア情報が含まれているもの、そして本来の業務である分析に必要なデータを探し出す方法としては、ファイルの作成日や最終更新日時、ファイルの保管場所などを条件に検索するのが一般的。ただ、データのシステム属性だけに頼った検索では、「欲しいと思うデータの検索条件」をピンポイントで設定できるとは限りません。非構造化データをOCRでテキスト化して検索をかける手段もありますが、今ひとつ正確性に欠けます。あぁ、こうして瞬く間に帰社の時間。最終的には精度の低いデータ結果を「えいや!」で出すしかなさそうです。

専用ツールでデータ管理すれば、安心♪

IBMの「IBM Spectrum Discover」は、データにタグを付けてカタログ化できる製品です。タグにはメタデータを利用できるので、大量かつ分散してしまいがちなセキュアデータや個人情報、コンプライアンス上重要なデータなどの効率的な管理を実現します。

IBMのストレージはもちろん 業界シェアトップのAmazon Web Services (AWS)をはじめとして主流ストレージシステムに対応しているため、幅広く活用できるのが嬉しいポイント。さらに仮想ストレージとしてシンプルにデプロイできて、データの自動インデックスなど、システム運用やデータ最適化も可能です。また、わかりやすいダッシュボードによる操作、見やすいレポートの提供などで、大量のデータと格闘する毎日をサポートします。

監査に必要なデータやGDPR対応のための個人情報、自社の機密情報など「重要なのに分散してしまいがちなデータ」には、タグを付与してラクラク管理。AIで画像を分析・抽出したデータにタグを付けることもできますよ。タグの使い方は無限大、あなた次第♪ビックデータを扱うデータサイエンティストや情シス部のみなさん、簡単データ管理で本来のデータ分析業務に集中できる環境を手に入れてくださいな♪


Chie Takeda

More IBM Storage stories

Qiskit SDKの設計理念

Qiskit SDKの開発を方向づけてきた理念や設計上の意思決定を明らかにしている新しい論文が公開されました。これは研究者が論文でQiskitを参照する際にちょうどよい引用可能な資料にもなっています。 Qiskitは最初 […]

さらに読む

Qiskit向けの新しい推奨ノートブック環境

OVHcloudやqBraidが提供するJupyterベースの環境は、クラウド上でQiskitを扱うプロセスを簡略化します。 IBM®は、量子回路に初めて取り掛かろうとしている初心者に対しても、既に100量子ビットを持っ […]

さらに読む

ユーティリティー・スケールの計算タスクを効率化する実行モード

Qiskit v1.xで改善された新しい実行モード(execution mode)は、量子ワークロードの信頼性、予測可能性、そして効率を大幅に向上させています。 ユーティリティー・スケールの研究を行うためには、ユーティリ […]

さらに読む