IBM Support

InfoSphere Information Server: kafka サービスが自動起動に失敗することがある

Question & Answer


Question

InfoSphere Information Server 11.7.1 にサービスパックを適用したところ、自動起動に登録していた kafka のサービスが、起動直後に異常終了し、毎回、手動起動する作業が発生します。原因と対策を教えてください。
なお、/opt/IBM/InformationServer/shared-open-source/kafka/logs にある kafka-server.log* に次のようなエラーメッセージが記録されていました。
ERROR [main] Error while creating ephemeral at ..., node already exists and owner '...' does not match current session '...'

Cause

kafka サービスは zookeeper サービスが起動していることが前提になります。環境によっては zookeeper サービス の初期化に時間がかかり、kafka サービスが zookeeper サービスの初期化を待たずに異常終了します。これは環境依存であり、すべての環境で発生するわけではありません。

Answer

/opt/IBM/InformationServer/shared-open-source/kafka にある start-kafka.sh の sleep 値を 5 から 30 に増やしてください。
修正前
  # wait for zookeeper to start first
  ZKPI=`echo $ZOOKEEPER_CLIENT_PORT+$i-1 | bc -l`
  "$ROOTDIR/bin/wait-port-start.sh" "zookeeper $i" $ZKPI 30
  sleep 5   # add additional time to zookeeper to update its list of brokers
  # start kafka
修正後
  # wait for zookeeper to start first
  ZKPI=`echo $ZOOKEEPER_CLIENT_PORT+$i-1 | bc -l`
  "$ROOTDIR/bin/wait-port-start.sh" "zookeeper $i" $ZKPI 30
  sleep 30   # add additional time to zookeeper to update its list of brokers
  # start kafka

[{"Type":"MASTER","Line of Business":{"code":"LOB10","label":"Data and AI"},"Business Unit":{"code":"BU059","label":"IBM Software w\/o TPS"},"Product":{"code":"SSZJPZ","label":"IBM InfoSphere Information Server"},"ARM Category":[{"code":"a8m0z000000bqp5AAA","label":"Zookeeper - Kafka - Solr - Shared Open Source Services"}],"ARM Case Number":"","Platform":[{"code":"PF016","label":"Linux"}],"Version":"11.7.1"}]

Document Information

Modified date:
16 November 2022

UID

ibm16840025