我想要创建一个应用程序,记录你对麦克风所说的话,并提取所有的文字。
我知道这是许多公司和个人都在努力解决的问题,但我不太确定我们离开发擅长这方面的工具还有多远。
此外,是否有任何可公开使用的工具来实现这一目标?我希望有一个API提供谷歌助理,苹果Siri,或一些东西,我只需上传一个音频剪辑,然后获得说的话。
发布于 2017-05-31 10:52:22
虽然谷歌确实有一个Google助手SDK,但它的主要目标是从你的软件或设备发送音频,并从助手那里接收音频响应--就像你在谷歌主页上看到的那样。类似地,谷歌的行动的目的是处理所有的自然语言处理(NLP),并给出一个响应--而不是确切地给出所说的内容(尽管这是一个副作用)。
它听起来更像是你想要的云语音API,它是一个语音到文本(STT)系统。您可能希望将其与类似于云自然语言API的内容结合起来,后者可以解析产生的文本的含义。
https://stackoverflow.com/questions/44280599
复制相似问题