文章/答案/技术大牛

发布

社区首页 >问答首页 >语音聚类的聚类算法

问语音聚类的聚类算法
EN

Stack Overflow用户

提问于 2020-03-06 15:10:36

回答 1查看 66关注 0票数 2

我们在语音域中可以使用的最佳聚类方法是什么？

例如，如果我们有来自多个说话者的语音发声，并且我们需要将它们聚类到特定的篮子中，其中每个篮子对应一个speaker.For，那么我们可以使用的最佳聚类算法是什么？

deep-learning

data-science

python

algorithm

machine-learning

回答 1

Stack Overflow用户

发布于 2021-08-03 13:34:10

我建议使用RNN-LSTM。有一个很好的教程解释了如何使用这个神经网络来进行音乐流派分类。我看过了，很难理解：

首先，你必须理解你的音频数据(ahere)。在这个链接中，他解释了MFCC (Mel频率倒谱系数)，它允许您将音频数据的特征提取到谱图中。在下图中，MFCC的每个振幅代表音频的一个特征(例如，扬声器语音的特征)。

然后，你必须对分类样本的数据进行预处理(practical example

)，然后训练你的神经网络来预测音频属于哪个扬声器。他展示了here，但我建议你看整个系列。我认为这是我见过的关于这个主题的最好的，给出了解决这种说话人分类问题所需的所有背景，代码和数据集。

希望你喜欢这些链接，它们对我真的很有帮助，而且肯定会解决你的问题。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60559163

复制

相似问题

问语音聚类的聚类算法
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问语音聚类的聚类算法EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问语音聚类的聚类算法
EN