我正在使用 google API 进行语音转文本。下面是我的python代码:from google.cloud import speech_v1p1beta1 as speechimport osos.environ["GOOGLE_APPLICATION_CREDENTIALS"]="C:\\Users\\chetan.patil\\Speech Recognition-db71b5de7c80.json" #Specified keyclient=speech.SpeechClient()speech_file="Chetan_Recording_20Secflac.flac" #import filewith open(speech_file,'rb') as audio_file: content=audio_file.read() audio=speech.types.RecognitionAudio(content=content)config=speech.types.RecognitionConfig(encoding=speech.enums.RecognitionConfig.AudioEncoding.LINEAR16, language_code='en_US',enable_speaker_diarization=True,audio_channel_count=1, sample_rate_hertz=44100)response = client.recognize(config, audio)当我运行最后一行代码时。它给出错误为“400 指定 FLAC 编码以匹配文件头”即使我尝试使用 .wav 文件,但它给出的错误是“400 必须使用单声道(单声道)音频,但 WAV 标头指示 2 个声道”谁能帮我解决这个问题?
2 回答
GCT1015
TA贡献1827条经验 获得超4个赞
删除整个编码配置似乎也有效。我的意思是encoding=speech.enums.RecognitionConfig.AudioEncoding.LINEAR16
从配置设置中删除,因为这可以从音频文件的标题中推断出来。
犯罪嫌疑人X
TA贡献2080条经验 获得超4个赞
当我运行最后一行代码时。它给出错误为“400 指定 FLAC 编码以匹配文件头”
您需要speech.enums.RecognitionConfig.AudioEncoding.FLAC
处理 FLAC 文件
即使我尝试使用 .wav 文件,但它给出的错误是“400 必须使用单声道(单声道)音频,但 WAV 标头指示 2 个声道”
wav 文件确实应该是单声道的,看起来你尝试了立体声文件。
添加回答
举报
0/150
提交
取消