CDC Replication について

IBM® IBM Data Replication - CDC Replication は、データベースの変更を発生時にキャプチャーし、ターゲット・データベース、メッセージ・キュー、 または、 IBM Data Replication 管理コンソール GUI アプリケーションで構成された表マッピングに基づく IBM DataStage® などの ETL ソリューション。

CDC Replication は、動的なデータウェアハウジング、マスター・データ管理、アプリケーションの統合またはマイグレーション、オペレーショナル BI、SOA プロジェクトの有効化など、主要な情報管理イニシアチブのデータ変更のキャプチャーと迅速なデリバリーを提供します。 CDC Replication は、変更されたデータのみを送信することで、処理のオーバーヘッドとネットワーク・トラフィックを削減するのにも役立ちます。 レプリケーションは、継続的に実施することも、定期的に実施することもできます。 ソース・サーバーからデータが転送されると、ターゲット環境で、そのデータの再マップやトランスフォームを行うことができます。

以下の図は、 CDC Replicationのキー・コンポーネントを示しています。

IBM Data Replicationの主要なアーキテクチャー・コンポーネントの表現。

IBM Data Replication アーキテクチャーのキー・コンポーネントについて、以下のリストで説明します。
  • Access Server-レプリケーション環境へのすべての非コマンド・ライン・アクセスを制御します。 管理コンソールにログインすると、 Access Serverに接続されます。 Access Server は、ソース・サーバーとターゲット・サーバーの間のアクティブ・データ複製アクティビティーに影響を与えずに、クライアント・ワークステーション上で閉じることができます。
  • 管理 API-操作構成または対話をスクリプト化するために使用できる、オプションの Java™ベースのプログラミング・インターフェースとして機能します。
  • アプライ・エージェント - ソースから送信される変更をターゲットで処理するエージェントです。
  • コマンド・ライン・インターフェース — CDC Replication Engine を、エンジンのコマンド・ライン・ツールを使用して開始、停止、および制御できます。
  • 通信層 (TCP/IP) - ソースターゲット の間の専用ネットワーク接続として機能します。
  • ソース・データ・ストアとターゲット・データ・ストア-データ複製に必要なデータ・ファイルと CDC Replication インスタンスを表します。 各データ・ストアは、接続先のデータベースに相当し、表のコンテナーとしての役割を果たします。 レプリケーションで使用できる表をデータ・ストアに格納します。
  • 管理コンソール-さまざまなサーバーでのレプリケーションの構成、モニター、管理、レプリケーション・パラメーターの指定、およびクライアント・ワークステーションからのリフレッシュ操作とミラーリング操作の開始を行うことができます。 管理コンソール では、ソース・データ・ストアまたはターゲット・データ・ストアによってサポートされるレプリケーション操作、待ち時間、イベント・メッセージ、およびその他の統計をモニターすることもできます。 管理コンソール のモニターは、データ移動の継続的な分析を必要とするタイム・クリティカルな作業環境を対象としています。 CHCCLP (コマンド・ライン・プロセッサー) および API ベースのアプリケーションも、Access Server 経由でレプリケーションを構成、モニター、および管理するために使用できます。 レプリケーションをセットアップした後、ソース・サーバーとターゲット・サーバーの間のアクティブ・データ・レプリケーション・アクティビティーに影響を与えずに、クライアント・ワークステーションで Management Console を閉じることができます。
  • メタデータ - セットアップするデータ・レプリケーション・インスタンスに関連する表、マッピング、サブスクリプション、通知、イベントなどの項目に関する情報を記述したデータです。
  • ミラーリング - ターゲット表の変更を複製したり、ソース表の変更を累積して後でターゲット表に複製したりする操作。 双方向レプリケーション を実装した環境では、ソース表とターゲット表の間でどちらの方向にもミラーリングを実行できます。
  • リフレッシュ - ソース・データベースからターゲット・データベースに対して表の初期の同期処理を実行する操作。 その処理を読み取るのが、リフレッシュ・リーダーです。
  • レプリケーション・エンジン - データの送受信を担当します。 複製されたデータを送信するプロセスがソース・キャプチャー・エンジン で、複製されたデータを受信するプロセスがターゲット・エンジン です。 CDC Replication インスタンスは、ソース・キャプチャー・エンジンとターゲット・エンジンとして同時に動作できます。
  • 単一収集 - ソース専用のログ・リーダーとログ・パーサー・コンポーネントとしての役割を果たします。 選択されたデータ・ストアですべてのサブスクリプションのソース・データベース・ログを検査し、分析します。

    すべての CDC Replication エンジンが単一収集を使用するわけではありません。 CDC Replication Engine for Db2® for iの場合、(ログ・リーダーとして機能する) スクレイパー・ジョブと、ミラーリングの機能を実行するミラー・ジョブがあります。

  • ソース変換エンジン - ターゲット・データ・ストア・エンジンに伝搬する行フィルター、重要な列、列フィルター、エンコード変換などのデータを処理します。
  • ソース・データベース・ログ - ソース・データベースが自身のリカバリーを目的として維持するログです。 CDC Replication ログ・リーダーは、ミラーリング・プロセスでこれらを検査しますが、レプリケーションのスコープ内にない表をフィルターで除外します。
  • ターゲット変換エンジン - データ変換、値変換、エンコード変換、ユーザー出口、競合検出などのデータをターゲット・データ・ストア・エンジンで処理します。
レプリケーションのターゲット専用宛先としては、データベース以外に以下の 2 つのタイプがあります。
  • JMS メッセージ - XML 文書として作成する行レベル操作の JMS メッセージ宛先 (キューまたはトピック) としての役割を果たします。
  • IBM DataStage - IBM DataStage ジョブで使用できる CDC レプリケーションから配信された変更を処理します。