搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏深度学习之tensorflow实战篇
关于kenlm工具训练统计语言模型
概述统计语言模型工具有比较多的选择，目前使用比较好的有srilm及kenlm，其中kenlm比srilm晚出来，训练速度也更快，而且支持单机大数据的训练。现在介绍一下kenlm的使用方法。比SRILM和IRSTLM 更快，更低的内存。使用用户指定的RAM 进行磁盘估计。用于时空权衡的两种数据结构。 mmap的二进制格式。或直接加载ARPA文件。许可许可证意味着您可以分发它而不像SRILM。在下载之前没有要填写的表单。
2.9K30发布于 2019-01-25
来自专栏云时之间
机器学习资料合计（一）
pan.baidu.com/s/1kUZ0OK3密码: 8y6f 49:Tagging.pdf 链接: https://pan.baidu.com/s/1eSm2rsu密码: 8b4s 50:icslp2002-srilm
1.6K80发布于 2018-04-11
来自专栏新智元
自然语言处理顶级会议 EMNLP 最佳论文出炉，聚焦神经网络 (下载)
受邀讲者及主旨演讲介绍本届大会邀请了 3 位讲者：斯坦福大学计算机科学语言学教授、斯坦福语言与信息研究中心（CSLI）主任 Christopher Potts，开源工具包 SRILM 作者、微软研究院的他是著名的开源工具包 SRILM 的作者，IEEE 和 ISCA 院士。【演讲介绍】随着对话系统变得越来越普遍，我们必须学会如何探测是谁在对系统说话，避免人和人之间的对话被机器误录入。
1.3K170发布于 2018-03-26
来自专栏机器之心
从经典结构到改进方法，神经网络语言模型综述
工具包传统的 LM 工具包主要包括「CMU-Cambridge SLM」、「SRILM」、「IRSTLM」、「MITLM」以及「BerkeleyLM」，它们只支持带有各种平滑技术的 N 元语言模型的训练和评估
1.7K50发布于 2019-07-29
来自专栏Urlteam
机器学习各语言领域工具库中文版汇总
机器翻译埃及（GIZA ++）摩西法老 SRILM NiuTrans 简 SAMT 语音识别 Kaldi – Kaldi是一个C ++工具，以Apache许可证V2.0发布.Kaldi适用于语音识别的研究
3K11发布于 2019-11-27
来自专栏腾讯高校合作
10小时训练数据打造多语种语音识别新高度
Stolcke, “SRILM - an extensible language modeling toolkit,” in proc.ICSLP - interspeech, Denver, Colorado
2K10发布于 2021-01-07
来自专栏信数据得永生
NumPyML 源码解析（四）
industry-scale NGram models are handled, see the SRLIM-format: http://www.speech.sri.com/projects/srilm
61310编辑于 2024-02-17

关于kenlm工具训练统计语言模型

机器学习资料合计（一）

自然语言处理顶级会议 EMNLP 最佳论文出炉，聚焦神经网络 (下载)

从经典结构到改进方法，神经网络语言模型综述

机器学习各语言领域工具库中文版汇总

10小时训练数据打造多语种语音识别新高度

NumPyML 源码解析（四）

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐