首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >语音聚类的聚类算法

语音聚类的聚类算法
EN

Stack Overflow用户
提问于 2020-03-06 15:10:36
回答 1查看 66关注 0票数 2

我们在语音域中可以使用的最佳聚类方法是什么?

例如,如果我们有来自多个说话者的语音发声,并且我们需要将它们聚类到特定的篮子中,其中每个篮子对应一个speaker.For,那么我们可以使用的最佳聚类算法是什么?

EN

回答 1

Stack Overflow用户

发布于 2021-08-03 13:34:10

我建议使用RNN-LSTM。有一个很好的教程解释了如何使用这个神经网络来进行音乐流派分类。我看过了,很难理解:

首先,你必须理解你的音频数据(ahere)。在这个链接中,他解释了MFCC (Mel频率倒谱系数),它允许您将音频数据的特征提取到谱图中。在下图中,MFCC的每个振幅代表音频的一个特征(例如,扬声器语音的特征)。

然后,你必须对分类样本的数据进行预处理(practical example

  1. ),然后训练你的神经网络来预测音频属于哪个扬声器。他展示了here,但我建议你看整个系列。我认为这是我见过的关于这个主题的最好的,给出了解决这种说话人分类问题所需的所有背景,代码和数据集。

希望你喜欢这些链接,它们对我真的很有帮助,而且肯定会解决你的问题。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60559163

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档