web-dev-qa-db-ja.com

Google Speech-to-text API、InvalidArgument:400シングルチャネルを使用する必要があります(モノ)

このエラーが発生しますInvalidArgument: 400 google Speech-to-textで問題が発生しているようです。2チャネルオーディオ(ステレオ)を使用していて、APIが(モノラル)でwavを待機しています。

オーディオエディターでファイルを変換すると機能する場合がありますが、オーディオエディターを使用してファイルのバッチを変換することはできません。 PythonまたはGoogle Cloudのいずれかでオーディオタイプを変更する方法はありますか?.

注:すでに「waveモジュール」で試しましたが、認識されないファイルタイプのエラー#7が発生し続けました(Pythonからモジュールwaveでwavファイルを読み取ることができませんでした)

-ERROR- InvalidArgument:400シングルチャネル(モノ)オーディオを使用する必要がありますが、WAVヘッダーは2チャネルを示しています。

以下の関数を使用して、オーディオシャネルとframe_rateを動的に返す必要があります。これは、オーディオファイルパスを取得し、フレームレートとシャネルの数を返します。

def frame_rate_channel(audio_file_name): print(audio_file_name) with wave.open(audio_file_name, "rb") as wave_file: frame_rate = wave_file.getframerate() channels = wave_file.getnchannels() return frame_rate,channels

1
syed irfan