Google Cloud Speech API の音声認識の構成

Google Cloud Speech API では、RecognitionConfig API のデフォルト構成を変更できます。例えば、不適切表現フィルターの切り替え、言語の変更、音声コンテキストの追加などを行うことができます。サービスのデフォルトの動作を変更する場合、Cloud Speech API の構成を指定するだけで済みます。

デフォルト構成を変更するために、以下を定義できます。

デプロイメント構成で Docker 環境変数を直接定義できます。
個別の JSON ファイルで JSON プロパティーを定義できます。

個別の JSON ファイルを作成すると、追加のフィールド (特に音声コンテキスト用のフィールド) を定義できます。両方の場所でフィールドが定義されている場合、JSON ファイルで指定されている値が優先されます。

デプロイメント構成での Google Cloud Speech API の構成

Speech to Text Adapter デプロイメントの一部として Google Cloud Speech API を構成するには、GOOGLE_SPEECH 環境変数を定義します。構成環境変数の全リストについては、Speech to Text Adapter の環境変数 (Speech to Text Adapter environment variables)を参照してください。

JSON ファイルでの Google Cloud Speech API の構成

recognitionConfig.json ファイルを作成し、RecognitionConfig API のフィールドを JSON フォーマットで定義します。 sample.voice.gateway GitHub リポジトリーの stt-adapter フォルダーにサンプルの recognitionConfig.json ファイルが含まれており、このファイルを基にして作成を開始できます。

重要: recognitionConfig.json ファイルでは、RecognitionConfig API のフィールドは、キャメル・ケース・フォーマットで指定する必要があります。例えば、language_code フィールドの場合、代わりに languageCode と指定します。
```
{
 "languageCode": "es-ES"
}
```
注: Cloud Speech API の RecognitionConfig の以下のフィールドには、Speech To Text Adapter が使用する固定値が含まれるため、これらのフィールドは変更できません。
- encoding
- sample_rate_hertz

stt.adapter コンテナーの構成で、recognitionConfig.json ファイルをボリュームにマウントし、GOOGLE_SPEECH_RECOGNITION_CONFIG 環境変数でそのファイルの場所を参照します。

例えば、Docker で以下のようにします。

stt.adapter:
 ...
 environment:
   - GOOGLE_APPLICATION_CREDENTIALS=/stt-adapter/credentials/google-service-account.json
   - GOOGLE_SPEECH_RECOGNITION_CONFIG=/stt-adapter/recognitionConfig.json
 volumes:
   - "/path/to/credentials/google-service-account.json:/stt-adapter/credentials/google-service-account.json"
   - "./recognitionConfig.json:/stt-adapter/recognitionConfig.json"

次の作業

構成を変更した後、変更を有効にするために、Voice Gateway と Speech to Text Adapter を再デプロイします。