首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >确定狮身人面像-4中说话人自适应的聚类大小

确定狮身人面像-4中说话人自适应的聚类大小
EN

Stack Overflow用户
提问于 2016-08-31 14:30:06
回答 1查看 96关注 0票数 0

在用于扬声器适配技术的CMU Sphinx(Sphinx-4)中,我使用了以下代码片段

代码语言:javascript
复制
Stats stats = recognizer.createStats(nrOfClusters);
recognizer.startRecognition(stream);
while ((result = recognizer.getResult()) != null) {
    stats.collect(result);
}
recognizer.stopRecognition();

// Transform represents the speech profile
Transform transform = stats.createTransform();
recognizer.setTransform(transform);

为了取得好的结果,nrOfClusters参数值应该是多少?我们如何使用这个片段来适应音频中的多个扬声器?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-08-31 15:48:58

为了取得好的结果,nrOfClusters参数值应该是多少?

集群的数量取决于适应数据的数量。数据越多,可以使用的集群就越多。例如,如果您有30秒的演讲时间,那么一个集群就足够了。如果你有10分钟的演讲时间,你最多可以使用32组。

我们如何使用这个片段来适应音频中的多个扬声器?

如果你知道每一位发言者的发言时间,你可以分别对每一位发言者进行调整。为不同的发言者创造一个共同的转变没有多大意义。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39252399

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档