这是将Google语音转换为文本API:
我想开发应用程序:
重要的是,字幕要有最好的准确性和显示标题的速度,因为人是在说话。
能否做到这一点?如果不可能使用Google,那么替代API是什么呢?
发布于 2022-04-22 01:30:03
如果我没听错的话,我会把它分成两部分
为您的移动语音覆盖
https://github.com/algolia/voice-overlay-android
用于WebHTML5 覆盖
<video id="video" controls preload="metadata">
<source src="video/sintel-short.mp4" type="video/mp4">
<source src="video/sintel-short.webm" type="video/webm">
<track label="English" kind="subtitles" srclang="en" src="captions/vtt/sintel-en.vtt" default>
<track label="Deutsch" kind="subtitles" srclang="de" src="captions/vtt/sintel-de.vtt">
<track label="Español" kind="subtitles" srclang="es" src="captions/vtt/sintel-es.vtt">
</video>
// per the sample linked above you can feed the / append the captions
var subtitlesMenu;
if (video.textTracks) {
var df = document.createDocumentFragment();
var subtitlesMenu = df.appendChild(document.createElement('ul'));
subtitlesMenu.className = 'subtitles-menu';
subtitlesMenu.appendChild(createMenuItem('subtitles-off', '', 'Off'));
for (var i = 0; i < video.textTracks.length; i++) {
subtitlesMenu.appendChild(createMenuItem('subtitles-' + video.textTracks[i].language, video.textTracks[i].language, video.textTracks[i].label));
}
videoContainer.appendChild(subtitlesMenu);
}发布于 2022-04-15 06:50:35
将语音转换为文本的最快、最有效的方法之一是Java (https://www.oracle.com/java/technologies/speech-api-frequently-asked-questions.html的文档)。
在文本转换的过程中,你需要把它分解成几个部分,正因为如此,意思可能略有变化,因为有些表达可能有一个不同的意思,但这将有助于减少最后翻译的时间。然后通过API发送已经接收到的片段(单词、短语)进行翻译。
您可以选择几个您喜欢的选项(例如https://rapidapi.com/blog/best-translation-api/),并检查哪个选项工作得更快。根据我的经验,“微软翻译文本”和“谷歌翻译”是最快的。我也认为你不可能得到即时翻译,但如果你测试了几个API选项,并围绕着是否同时处理所有句子、短语或单个单词,你可以将翻译时间缩短到最低限度。
https://stackoverflow.com/questions/71841850
复制相似问题