首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >读取wav文件时“wav的坏音频格式”

读取wav文件时“wav的坏音频格式”
EN

Stack Overflow用户
提问于 2021-04-29 09:07:14
回答 1查看 757关注 0票数 0

我有一套wav文件,我想生成一个光谱图。但是,当我使用tf.audio.decode_wav函数时,我会得到以下错误:

InvalidArgumentError: WAV的坏音频格式:预期1 (PCM),但got7操作:DecodeWav

如何避免这一错误?有没有其他方法可以使用tensorflow为wav文件生成日志mel谱图?

我知道librosa包,但我更喜欢tensorflow。

守则是:

代码语言:javascript
复制
def decode_audio(audio_binary):
  audio, _ = tf.audio.decode_wav(audio_binary)
  return tf.squeeze(audio, axis=-1)

def get_waveform_and_label(file_path):
  audio_binary = tf.io.read_file(file_path)
  waveform = decode_audio(audio_binary)
  return waveform
EN

回答 1

Stack Overflow用户

发布于 2021-04-30 10:57:12

错误告诉您,您的文件表明它们的样本被编码为8位的mulaw。

正如TensorFlow文档中所描述的那样,这种方法只支持16位PCM。

在将波形文件传递给tensorflow之前,您需要重新编码它们。像ffmpeg这样的东西能帮上忙。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67314288

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档