文章/答案/技术大牛

发布

社区首页 >问答首页 >如何获取ASR VOSK的详细信息

问如何获取ASR VOSK的详细信息
EN

Stack Overflow用户

提问于 2022-11-16 05:54:45

回答 1查看 21关注 0票数 0

我与Vosk一起工作，我需要获取中每个单词的时间--这是我的代码

def voice_recognition(filename):
    model = Model(model_name="vosk-model-fa-0.5")
    rec = KaldiRecognizer(model, FRAME_RATE)
    rec.SetWords(True)

    mp3 = AudioSegment.from_mp3(filename)
    mp3 = mp3.set_channels(CHANNELS)
    mp3 = mp3.set_frame_rate(FRAME_RATE)

    step = 45000
    transcript = ""
    for i in range(0, len(mp3), step):
        segment = mp3[i:i+step]
        rec.AcceptWaveform(segment.raw_data)
        result = rec.Result()
        text = json.loads(result)["text"]
        transcript += text
    return transcript

我需要这样的东西

time               word
-----------------------
(0.0.01, 0.0.2)    hi
(0.0.03, 0.0.4)    how
(0.0.04, 0.0.5)    are
(0.0.05, 0.0.6)    you

有办法得到这样的数据吗？

tensorflow

nlp

speech-recognition

vosk

回答 1

Stack Overflow用户

发布于 2022-11-16 07:09:01

当您设置rec.SetWords(True)时，我刚刚发现我所需要的所有细节都在result = rec.Result()中

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/74455769

复制

相似问题

问如何获取ASR VOSK的详细信息
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何获取ASR VOSK的详细信息EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何获取ASR VOSK的详细信息
EN