首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何获取ASR VOSK的详细信息

如何获取ASR VOSK的详细信息
EN

Stack Overflow用户
提问于 2022-11-16 05:54:45
回答 1查看 21关注 0票数 0

我与Vosk一起工作,我需要获取中每个单词的时间--这是我的代码

代码语言:javascript
复制
def voice_recognition(filename):
    model = Model(model_name="vosk-model-fa-0.5")
    rec = KaldiRecognizer(model, FRAME_RATE)
    rec.SetWords(True)

    mp3 = AudioSegment.from_mp3(filename)
    mp3 = mp3.set_channels(CHANNELS)
    mp3 = mp3.set_frame_rate(FRAME_RATE)

    step = 45000
    transcript = ""
    for i in range(0, len(mp3), step):
        segment = mp3[i:i+step]
        rec.AcceptWaveform(segment.raw_data)
        result = rec.Result()
        text = json.loads(result)["text"]
        transcript += text
    return transcript

我需要这样的东西

代码语言:javascript
复制
time               word
-----------------------
(0.0.01, 0.0.2)    hi
(0.0.03, 0.0.4)    how
(0.0.04, 0.0.5)    are
(0.0.05, 0.0.6)    you

有办法得到这样的数据吗?

EN

回答 1

Stack Overflow用户

发布于 2022-11-16 07:09:01

当您设置rec.SetWords(True)时,我刚刚发现我所需要的所有细节都在result = rec.Result()

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/74455769

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档