Google Cloud Speech API の音声認識の構成
Google Cloud Speech API では、RecognitionConfig API のデフォルト構成を変更できます。 例えば、不適切表現フィルターの切り替え、言語の変更、音声コンテキストの追加などを行うことができます。
サービスのデフォルトの動作を変更する場合、Cloud Speech API の構成を指定するだけで済みます。
デフォルト構成を変更するために、以下を定義できます。
- デプロイメント構成で Docker 環境変数を直接定義できます。
- 個別の JSON ファイルで JSON プロパティーを定義できます。
個別の JSON ファイルを作成すると、追加のフィールド (特に音声コンテキスト用のフィールド) を定義できます。 両方の場所でフィールドが定義されている場合、JSON ファイルで指定されている値が優先されます。
デプロイメント構成での Google Cloud Speech API の構成
Speech to Text Adapter デプロイメントの一部として Google Cloud Speech API を構成するには、GOOGLE_SPEECH 環境変数を定義します。 構成環境変数の全リストについては、Speech to Text Adapter の環境変数 (Speech to Text Adapter environment variables)を参照してください。
JSON ファイルでの Google Cloud Speech API の構成
-
recognitionConfig.jsonファイルを作成し、RecognitionConfigAPI のフィールドを JSON フォーマットで定義します。 sample.voice.gateway GitHub リポジトリーのstt-adapterフォルダーにサンプルのrecognitionConfig.jsonファイルが含まれており、このファイルを基にして作成を開始できます。重要:
recognitionConfig.jsonファイルでは、RecognitionConfigAPI のフィールドは、キャメル・ケース・フォーマットで指定する必要があります。 例えば、language_codeフィールドの場合、代わりにlanguageCodeと指定します。{ "languageCode": "es-ES" }注: Cloud Speech API の
RecognitionConfigの以下のフィールドには、Speech To Text Adapter が使用する固定値が含まれるため、これらのフィールドは変更できません。encodingsample_rate_hertz
-
stt.adapterコンテナーの構成で、recognitionConfig.jsonファイルをボリュームにマウントし、GOOGLE_SPEECH_RECOGNITION_CONFIG環境変数でそのファイルの場所を参照します。例えば、Docker で以下のようにします。
stt.adapter: ... environment: - GOOGLE_APPLICATION_CREDENTIALS=/stt-adapter/credentials/google-service-account.json - GOOGLE_SPEECH_RECOGNITION_CONFIG=/stt-adapter/recognitionConfig.json volumes: - "/path/to/credentials/google-service-account.json:/stt-adapter/credentials/google-service-account.json" - "./recognitionConfig.json:/stt-adapter/recognitionConfig.json"
次の作業
構成を変更した後、変更を有効にするために、Voice Gateway と Speech to Text Adapter を再デプロイします。