首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏深度应用

    ·主流声学模型对比

    主流声学模型对比 目录 概述 基础概念 语音帧 语音识别系统 主流声学建模技术 HMM DNN-HMM FFDNN CNN RNN及LSTM CTC 其他建模技术 语言建模技术 语音唤醒技术 关于未来 本文由搜狗语音交互中心语音技术部负责人陈伟来为大家分享伴随着本轮人工智能浪潮下语音识别建模技术的演进,希望能够帮大家理清主流的识别建模脉络以及背后的思考。 主流声学建模技术 近年来,随着深度学习的兴起,使用了接近30年的语音识别声学模型HMM(隐马尔科夫模型)逐渐被DNN(泛指深度神经网络)所替代,模型精度也有了突飞猛进的变化,整体来看声学建模技术从建模单元 图13 CTC尖峰效果演示 可以预期,基于CTC或者引用CTC概念(如LFMMI)的端到端识别技术将逐渐成为主流,HMM框架将逐渐被替代。 同时语音识别尽管现在可以达到很高的准确率,但是准确率从95%到99%甚至100%的这个跨越是由量变到质变的过程,也是决定语音交互能否成为主流交互方式的重要一环,但是目前语音识别的一些老问题仍然存在,技术上仍然没有能力完全解决

    3.9K22发布于 2019-06-27
  • 来自专栏xiaosen

    LLM主流开源代表模型

    LLM主流开源大模型介绍 1 LLM主流模型类别 随着ChatGPT迅速火爆,引发了大模型的时代变革,国内外各大公司也快速跟进生成式AI市场,近百款大模型发布及应用。 目前,市面上已经开源了各种类型的大语言模型,本章节我们主要介绍其中的三大类: ChatGLM-6B:衍生的大模型(wenda、ChatSQL等) LLaMA:衍生的大模型(Alpaca、Vicuna 人类类意图对齐训练 缺点: 模型容量小,相对较弱的模型记忆和语言能力。 较弱的多轮对话能力。 4 BLOOM模型 BLOOM系列模型是由 Hugging Face公司的BigScience 团队训练的大语言模型。 小结 主要介绍了LLM主流的开源大模型,对不同模型架构、训练目标、优缺点进行了分析和总结。

    67610编辑于 2024-06-04
  • 来自专栏机器学习入门

    【AI大模型】LLM主流开源大模型介绍

    学习目标 了解LLM主流开源大模型. 掌握ChatGLM、LLaMA、Bloom等基础大模型的原理 LLM主流模型类别 随着ChatGPT迅速火爆,引发了大模型的时代变革,国内外各大公司也快速跟进生成式AI市场,近百款大模型发布及应用 目前,市面上已经开源了各种类型的大语言模型,本章节我们主要介绍其中的三大类: ChatGLM-6B:衍生的大模型(wenda、ChatSQL等) LLaMA:衍生的大模型(Alpaca、Vicuna BLOOM模型 BLOOM系列模型是由 Hugging Face公司的BigScience 团队训练的大语言模型。 小结 本小节主要介绍了LLM主流的开源大模型,对不同模型架构、训练目标、优缺点进行了分析和总结。

    1.3K10编辑于 2024-09-24
  • 来自专栏猫头虎博客专区

    LeetCode 6-10 题 详解 Java版 ( 万字 图文详解 LeetCode 算法题6-10 =====>>> <建议收藏>)

    今天我们一起学习了LeetCode 6-10 题的算法分析,感谢大家阅读,觉得不错记得收藏哦! 喜欢 请点个 + 关注

    24310编辑于 2024-04-07
  • 来自专栏python、mysql、go知识点积累

    07-02 django 6-10

    字段查询 all():返回模型类对应表格中的所有数据。 条件格式: 模型类属性名__条件名=值 注意:此处是模型类属性名,不是表中的字段名 关于 filter 具体案例如下: 判等 exact。 BookInfo.objects.filter(id__gt = 3).count() 模型类关系 一对多关系 例:图书类-英雄类 models.ForeignKey() 定义在多的类中。

    93940发布于 2020-04-14
  • 来自专栏C语言例题100题

    C语言经典例题100(6-10

    思路: 使用循环嵌套来写这个代码,我们首先要让i=1的时候,做一遍1的乘法运算,也就是说我们的j<=i,所以我们第二个for循环就可以写成是让j也从1开始遍历,范围要小于等于i,以此递增。

    28610编辑于 2025-06-04
  • 来自专栏大数据成长之路

    Hadoop源代码分析【6-10

    小结 Hadoop源代码分析【6-10】主要为大家科普了RPC实现通信的流程,以及 DataNode在升级 / 回滚/ 提交时底层的变化。

    66120发布于 2021-01-27
  • 来自专栏量子位

    主流的深度学习模型有哪些?

    这个问题的机会,我也想介绍一下主流的神经网络模型。因为格式问题和传播原因,我把原回答内容在这篇文章中再次向大家介绍。 同理,另一个循环网络的变种 - 双向循环网络(Bi-directional RNN)也是现阶段自然语言处理和语音分析中的重要模型。 深度生成模型(Deep Generative Models) 说到生成模型,大家一般想到的无监督学习中的很多建模方法,比如拟合一个高斯混合模型或者使用贝叶斯模型。 深度学习中的生成模型主要还是集中于想使用无监督学习来帮助监督学习,毕竟监督学习所需的标签代价往往很高…所以请大家不要较真我把这些方法放在了无监督学习中。 2.1.1. 另一个常常被放在GAN一起讨论的模型叫做变分自编码器(Variational Auto-encoder),有兴趣的读者可以自己搜索。

    3.1K40发布于 2018-03-26
  • 来自专栏全栈开发那些事

    6-10 二分查找 (20分)

    L是用户传入的一个线性表,其中ElementType元素可以通过>、==、<进行比较,并且题目保证传入的数据是递增有序的。函数BinarySearch要查找X在Data中的位置,即数组下标(注意:元素从下标1开始存储)。找到则返回下标,否则返回一个特殊的失败标记NotFound。

    28620编辑于 2023-02-27
  • 来自专栏IT从业者张某某

    大语言模型-2.23-主流模型架构与新型架构

    简介 本博客内容是《大语言模型》一书的读书笔记,该书是中国人民大学高瓴人工智能学院赵鑫教授团队出品,覆盖大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助学员全面掌握大语言模型的核心技术 transformer架构 2.2 主流模型架构 三种主流架构 在预训练语言模型时代,自然语言处理领域广泛采用了预训练 + 微调的范式,并诞生了如下三种主流架构。 随着 GPT 系列模型的成功发展,当前自然语言处理领域走向了生成式大语言模型的道路,解码器架构已经成为了目前大语言模型主流架构。 在本节中,我们将首先对于参数化状态空间模型展开讨论,然后针对状态空间模型的各种变种模型进行介绍。为了帮助读者更好地理解这些模型之间的区别,我们在表 5.2 中对于它们进行了比较。 参数化状态空间模型 状态空间模型变种 尽管状态空间模型计算效率较高,但是在文本任务上的表现相比 Transformer模型仍有一定的差距。

    87810编辑于 2025-03-24
  • 来自专栏福大大架构师每日一题

    ⽬前 主流的开源模型体系 有哪些?

    ⽬前 主流的开源模型体系 有哪些? 答案: ⽬前主流的开源LLM(语⾔模型模型体系包括以下⼏个: 1. 总结: 当前主流的开源模型体系,以 LLaMA 为代表的国际模型和以 DeepSeek、Qwen、GLM 为代表的中国模型构成了核心力量。 以上分类与格局构成了当前主流的开源大模型体系。 腾讯元宝: 腾讯元宝 目前主流的开源模型体系主要分为以下几大类别: 国际主流开源模型体系 1. 国内主流开源模型体系 1. 百度ds: 百度ds 目前主流的开源大模型(LLM)体系主要包括以下几个代表性系列: 主流开源模型体系 1.

    1.8K10编辑于 2025-12-19
  • 来自专栏全栈程序员必看

    主流量化交易的几种策略模型

    二者所用模型一样,但后者少了期货的对冲。缺少对冲有坏处也有好处,坏处是这种策略的收益曲线是会有较大的回撤。 简单地做一些计算,比如说你的策略一共覆盖了10个主流的品种,而策略类型则大致分为相关性较低的三类,并且这三类策略中每一个你都可以在5分钟、半小时和日线三个周期上去运行。

    3K20编辑于 2022-09-07
  • 来自专栏腾讯技术工程官方号的专栏

    主流大语言模型的技术原理细节

    作者:spring 1.比较 LLaMA、ChatGLM、Falcon 等大语言模型的细节:tokenizer、位置编码、Layer Normalization、激活函数等。2. 大语言模型的分布式训练技术:数据并行、张量模型并行、流水线并行、3D 并行、零冗余优化器 ZeRO、CPU 卸载技术 ZeRo-offload、混合精度训练、激活重计算技术、Flash Attention 大语言模型的参数高效微调技术:prompt tuning、prefix tuning、adapter、LLaMA-adapter、 LoRA。 0. 大纲 1. 大语言模型的细节 1.0 transformer 与 LLM 1.1 模型结构 1.2 训练目标 1.3 tokenizer 1.4 位置编码 1.5 层归一化 1.6 激活函数 1.7 参考文献 分析 transformer 模型的参数量、计算量、中间激活、KV cache 【万字长文】LLaMA, ChatGLM, BLOOM 的高效参数微调实践 FlashAttention:加速计算

    2.5K64编辑于 2023-09-13
  • 来自专栏数说工作室

    主流CTR预估模型的演化及对比

    常用模型 1. LR LR模型是广义线性模型,从其函数形式来看,LR模型可以看做是一个没有隐层的神经网络模型(感知机模型)。 ? ? 思路很简单,特征工程分为两部分,一部分特征用于训练一个GBDT模型,把GBDT模型每颗树的叶子节点编号作为新的特征,加入到原始特征集中,再用LR模型训练最终的模型。 ? 最终模型的预测值为所有分片对应的子模型的预测值的期望。 PNN和FNN与其他已有的深度学习模型类似,都很难有效地提取出低阶特征组合。WDL模型混合了宽度模型与深度模型,但是宽度模型的输入依旧依赖于特征工程。 总结 主流的CTR预估模型已经从传统的宽度模型向深度模型转变,与之相应的人工特征工程的工作量也逐渐减少。

    1.4K40发布于 2019-07-17
  • 来自专栏Gorit 带你学全栈系列

    编程入门、进阶100例(6-10题)

    本期用先用java去实现代码,后面我会慢慢补全c语言和python的代码 题目索引 六、温度转换问题 6.1 问题描述 6.2 示例 6.3 代码实现 七、求阶乘之和 7.1 问题描述 7.2 示例 7.3 代码实现 八、打印水仙花数 8.1 打印100~1000之间的水仙花数 8.2 示例 8.3 代码实现 九、求100~200以内的素数 9.1 问题描述 9.2 示例 9.3 代码实现 十、实现冒泡排序 10.1 问题描述 10.2 示例 10.3 代码实现 六、温度转换问题 6.1 问题描述 输

    60910编辑于 2021-12-09
  • 来自专栏全栈程序员必看

    五大主流数据库模型有哪些_五大主流品牌

    访问数据库中的数据取决于数据库实现的数据模型。数据模型会影响客户端通过API对数据的操作。不同的数据模型可能会提供或多或少的功能。 迄今为止,主导的数据模型仍然是关系模型。在这里,我们主要想为大家介绍一下非关系模型,作为对比,本文也会简要介绍一下关系模型。 数据模型概述 1.关系模型 关系模型使用记录(由元组组成)进行存储,记录存储在表中,表由架构界定。表中的每个列都有名称和类型,表中的所有记录都要符合表的定义。 与关系模型不同的是,文档存储模型支持嵌套结构。例如,文档存储模型支持XML和JSON文档,字段的“值”又可以嵌套存储其它文档。文档存储模型也支持数组和列值键。 选择哪一种数据模型? 数据模型有着各自的优缺点,它们适用于不同的领域。不管是选择关系模型,还是非关系模型,都要根据实际应用的场景做出选择。

    2.3K10编辑于 2022-09-20
  • 来自专栏机器学习/数据可视化

    MySQL50-4-第6-10

    MySQL50-4-第6-10题 本文中介绍的是第6-10题,涉及到的主要知识点: 模糊匹配和通配符使用 表的自连接 in/not in 连接查询的条件筛选 ?

    25410发布于 2021-03-01
  • 来自专栏小鹏的专栏

    PyTorch图像分类框架(支持多种主流分类模型)

    | 模型方面 | (efficientnet/resnest/seresnext等) | 1 | | 数据增强 | (旋转/镜像/对比度等、mixup/cutmix) | 2 | | 损失函数 | (交叉熵 /focal_loss等) | 3| | 模型部署 | (flask/grpc/BentoML等) | [4] (https://github.com/MachineLP/PyTorch_image_classifier /tree/master/serving)| | onnx/trt | () | 5 | 支持的全部模型: RESNEST_LIST = [“resnest50”, “resnest101”, “resnest200 /data/train.csv" --random_state 2020 1、修改配置文件,选择需要的模型 以及 模型参数:vim conf/test.yaml cp conf/test.yaml conf /effb3_ns.yaml vim conf/effb3_ns.yaml 2、训练模型: (根据需求选取合适的模型) python train.py --config_path "conf/effb3

    2.1K30发布于 2020-10-29
  • 来自专栏小义思

    无需魔法,国外主流AI大模型免费使用!

    在这个AI技术飞速发展的时代,各种大型AI模型如同雨后春笋般涌现,人们自然会产生比较和讨论。因此也就产生了不少整合各个AI大模型的网站,借助这些网址平台,自然可以实现免费使用。 在得到两个大模型的回复后,可以选择继续聊天,或者为认为回答得更好的模型投票,系统后台自会统计测评结果。 除了Arena(side-by-side),还有Arena(battle)匿名比较,Direct Chat单个模型聊天等方式,都可以免费使用各大AI模型。 OpenRouter OpenRouter是一个提供大型语言模型(LLMs)和其他AI模型统一接口的平台。 OpenRouter的目标是为用户提供最佳的模型选择和价格,简化了模型的测试和比价过程。

    24.3K20编辑于 2024-04-10
  • 来自专栏贾志刚-OpenCV学堂

    十种主流模型C++部署演示

    虽然小编本周一直是摸鱼工作状态,但是完成了最后一种模型推理支持,实现十种主流模型推理部署封装: YOLOv5 YOLOv5-Seg YOLOv6 YOLOv7 YOLOX Faster-RCNN Mask-RCNN 其中YOLO系列模型部署全部支持TensorRT!支持零代码一键集成部署到QT项目中,支持多线程推理,下面的截图只是集成小小的演示!

    1.2K20编辑于 2023-01-04
领券