Spracherkennung für die Google Cloud Speech-API konfigurieren

Bei der Google Cloud Speech-API können Sie die Standardkonfiguration der API RecognitionConfig ändern. Sie können beispielsweise den Filter für vulgäre Ausdrück ein- und ausschalten, die Sprache ändern oder Sprachkontext hinzufügen. Wenn Sie das Servicestandardverhalten ändern möchten, müssen Sie nur eine beliebige Cloud Speech-API-Konfiguration angeben.

Zum Ändern der Standardkonfiguration können Sie Folgendes definieren:

Wenn Sie eine separate JSON-Datei erstellen, können Sie weitere Felder, insbesondere den Sprachkontext definieren. Wenn ein Feld an zwei Stellen definiert ist, hat der in der JSON-Datei angegebene Wert Vorrang.

Google Cloud Speech-API in der Bereitstellungskonfiguration konfigurieren

Wenn Sie die Google Cloud Speech-API im Rahmen der Bereitstellung von Speech to Text Adapter konfigurieren möchten, definieren Sie Umgebungsvariablen GOOGLE_SPEECH. Eine vollständige Liste der Konfigurationsumgebungsvariablen finden Sie unter Umgebungsvariablen für Speech to Text Adapter.

Google Cloud Speech-API in einer JSON-Datei konfigurieren

  1. Erstellen Sie eine recognitionConfig.json-Datei und definieren Sie über die API RecognitionConfig Felder im JSON-Format. Der Ordner stt-adapter im sample.voice.gateway-GitHub-Repository enthält eine recognitionConfig.json-Beispieldatei, mit der Sie beginnen können.

    Wichtig: Die Felder für die RecognitionConfig-API müssen in Kamelschreibweise in der Datei recognitionConfig.json angegeben werden. Geben Sie beispielsweise für das Feld language_code stattdessen languageCode an.

    {
     "languageCode": "es-ES"
    }
    

    Anmerkung: Die folgenden Felder für RecognitionConfig in der Cloud Speech-API können nicht geändert werden, weil sie feste Werte enthalten, die von Speech To Text Adapter verwendet werden.

    • encoding
    • sample_rate_hertz
  2. Hängen Sie in der Konfiguration für den Container stt.adapter die Datei recognitionConfig.json an einem Datenträger an und referenzieren Sie die Dateiposition über die Umgebungsvariable GOOGLE_SPEECH_RECOGNITION_CONFIG.

    Beispiel für Docker:

    stt.adapter:
     ...
     environment:
       - GOOGLE_APPLICATION_CREDENTIALS=/stt-adapter/credentials/google-service-account.json
       - GOOGLE_SPEECH_RECOGNITION_CONFIG=/stt-adapter/recognitionConfig.json
     volumes:
       - "/path/to/credentials/google-service-account.json:/stt-adapter/credentials/google-service-account.json"
       - "./recognitionConfig.json:/stt-adapter/recognitionConfig.json"
    

Nächste Schritte

Nachdem Sie die Konfiguration geändert haben, stellen Sie Voice Gateway mit Speech to Text Adapter erneut bereit, damit Ihre Änderungen wirksam werden.