问Sidekit。sidekit.EM_split()中的feature_list是什么？
EN

Stack Overflow用户

提问于 2019-01-04 17:08:06

回答 1查看 110关注 0票数 0

我刚开始使用sidekit进行说话人识别，我遇到了一个问题，我需要使用"feature_list".feature_list=ubm_list，但是特征列表中有什么?它说它包含用于训练GMM的特征文件列表。但是应该在特征文件中的内容。

ubm=sk.Mixture()
ubm_list="/home/david/Documents/development_set/anthonyschaller-20071221-/list"
ubm.EM_split(features_server=server,feature_list=ubm_list,
            distrib_nb=1024,iterations=(1,2,2,4,4,4,4,8,8,8,8,8,8),
            num_thread=10,llk_gain=0.01,save_partial=False,ceil_cov=10,
            floor_cov=1e-2)

gmm

sidekit

回答 1

Stack Overflow用户

发布于 2019-02-18 19:50:04

是的，你是对的..。ubm_list是可能具有.h5扩展名的功能文件的列表。所以，你的ubm_list应该是：

import os

feat_dir = "/home/david/Documents/development_set/anthonyschaller-20071221-/list"
ubm_list = os.listdir(feat_dir)

根据您的第二个问题，feat_dir应该包含HDF5-format的功能文件(具有.h5扩展名的文件)。YOu可以使用h5py模块打开其中一个文件进行浏览。我用我的一个这样做了，这是我发现的：

>>> import h5py
>>>
>>> hf = h5py.File('/media/anwar/SIDEKIT-1.3/feat/S01.h5', 'r')
>>> hf.keys()
<KeysViewHDF5 ['S01.wav', 'compression']>

>>> # explore the second key 'compression'
>>> k2 = hf.get('compression')
>>> type(k2)
<class 'h5py._hl.dataset.Dataset'>

>>> #explore the first key 'S01.wav'
>>> k1 = hf.get('S01.wav')
>>> k1.keys()
<KeysViewHDF5 ['cep', 'cep_header', 'cep_mean', 'cep_min_range', 'cep_std',
 'energy', 'energy_header', 'energy_mean', 'energy_min_range', 'energy_std',
 'fb', 'fb_header', 'fb_mean', 'fb_min_range', 'fb_std', 'vad']>

下图来自documentation of a former-version，您可以在其中找到我上面提到的所有信息，只需稍作更改：

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/54035875

复制

相似问题

问Sidekit。sidekit.EM_split()中的feature_list是什么？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Sidekit。sidekit.EM_split()中的feature_list是什么？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Sidekit。sidekit.EM_split()中的feature_list是什么？
EN