我正在对客户关怀数据进行语音情感分析。我有一个音频文件,其中客户服务官员提出了问题,客户给了他的评论。
我需要拆分这段音频,并且只从客户那里获得评论部分,以便进行情绪分析,无论客户是高兴、悲伤还是中立。
请让我知道,如何分割音频文件,只得到客户的音频。音频格式为".aac“
到目前为止,我所做的是:
from os import path
AUDIO_FILE = path.join(path.dirname(path.realpath('C:\\Users\\anagha\\Documents\\Python Scripts')),"Python Scripts\\audioa.aac")
halfway_point = len(AUDIO_FILE) / 2发布于 2017-04-06 10:31:20
既然您使用了pydub标记,下面将介绍如何使用pydub完成此操作
from pydub import AudioSegment
sound = AudioSegment.from_file(AUDIO_FILE)
halfway_point = len(sound) // 2
first_half = sound[:halfway_point]
# create a new file "first_half.mp3":
first_half.export("/path/to/first_half.mp3", format="mp3")发布于 2018-01-15 17:53:05
我认为回答最初的问题已经太晚了,但是偶然发现这个问题的人可能会发现这个过程很有用
->使用一个工具来记录数据。我使用过LIUM (http://www-lium.univ-lemans.fr/diarization/doku.php)
基于这个非常简单的SO post (Parsing LIUM Speaker Diarization Output),->解释输出
然后最后使用从上面获得的定时来拼接音频文件!然而,将语音转换为文本是一个完全不同的挑战,要么需要深入的方法(具有大量数据),要么需要依赖API提供商(如google)
https://stackoverflow.com/questions/43204441
复制相似问题