搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏AI算法与图像处理
图解EfficientNet模型的完整细节
作者：Vardan Agarwal 编译：ronghuaiyang AI公园导读深入研究所有不同EfficientNet结构的细节。一般来说，模型设计得太宽，太深，或者分辨率太高。刚开始的时候，增加这些特性是有用的，但很快就会饱和，然后模型的参数会很多，因而效率不高。由于参数的数目相当少，这个模型族是非常高效的，也提供更好的结果。现在我们知道了为什么这些可能会成为标准的预训练模型，但是缺少了一些东西。要可视化模型层，代码如下： ! EfficientNet-B7的结构很容易看出各个模型之间的差异，他们逐渐增加了子block的数量。如果你理解了体系结构，我鼓励你将任意的模型打印出来，并仔细阅读它以更彻底地了解它。
7K40发布于 2020-09-17
来自专栏机器学习炼丹术
alphaFold2 | 模型细节之Evoformer
<<AlphaFold2专题>> alphaFold2 | 解决问题及背景(一) alphaFold2 | 模型框架搭建(二) alphaFold2 | 模型细节之特征提取（三）文章转自微信公众号：机器学习炼丹术 MsaAttentionBlock 1.4 gating 1.5 PairwiseAttentionBlock 上一篇文章谈了一下MSA和pair representation特征的构建，现在我们来看模型结构了最后就是把msa特征，对应的attn_bias特征放到attn这个模型类当中去。 x = self.triangle_attention_ingoing(x, edges = x, mask = mask) + x return x 这里面出现了一个新的模型类
1.7K20编辑于 2022-11-22
YashanDB数据模型设计及实现细节
YashanDB通过其独特的数据模型设计解决了这些问题，使其能够在瞬息万变的商业环境中保持数据管理的灵活性和可靠性。总结与展望总的来说，YashanDB凭借其高效的数据模型设计和分布式架构，在处理海量数据时展现了优异的性能与灵活性。随着企业对数据需求的不断提升，YashanDB将持续优化技术细节，提高数据库的可用性和扩展性，以成为用户首选的数据管理方案。
13700编辑于 2025-07-13
来自专栏GiantPandaCV
大模型部署框架 FastLLM 实现细节解析
std::string DecodeTokens(const std::vector <int> &tokens); // 解码 }; 我们从实现来看tokenizer的细节 %f s, gops = %f\n", n, m, k, spend, gops); } 在上面的实现中，MultiplyMultiThread完成了对量化输入的计算，我们看一下它的实现细节 # Llama模型引入了旋转位置编码，以改进长序列处理的性能。逆频率是一种用于位置编码的技巧， # 它可以帮助模型更好地捕捉位置信息。总结接着大模型部署框架 FastLLM 简要解析这篇文章首先梳理了一下FastLLM的调用链和关键的数据结构，然后解析了 FastLLM 的一些实现细节和CPU/GPU后端实现采用的优化技巧。
1.8K70编辑于 2023-08-22
来自专栏AI大模型备案
大模型备案，这些细节最易漏
随着人工智能技术的快速发展，大模型备案成为众多企业必须面对的重要环节。尽管备案流程看似明确，但实践中不少企业因忽略细节而导致备案延误甚至失败。本文梳理了最容易被忽视的备案细节，助您高效完成合规流程。细节上，需具体说明模型生成内容的过滤机制、安全风险分类标准及相应处置措施。例如，应详细描述针对违法信息的识别准确率、误判补救方案，以及人工审核机制的衔接流程。此外，模型迭代后的重评估要求常被忽视，必须明确版本更新时的评估触发条件和流程，避免后续运营违规。三、主体资质材料不匹配非申报主体独立研发模型时，常忽略知识产权权属证明。四、应急机制可操作性不足应急预案的制定往往缺乏细节支撑。按规定，需明确内容安全事件的响应时限、责任人及处置流程。例如，需标注“发现违规内容后1小时内启动屏蔽机制”，并附后台操作截图验证。结语大模型备案是系统性工程，细节决定成败。企业除关注技术参数外，更需重视数据溯源、应急响应等管理环节的闭环设计。
17210编辑于 2025-11-07
来自专栏腾讯技术工程官方号的专栏
主流大语言模型的技术原理细节
作者：spring 1.比较 LLaMA、ChatGLM、Falcon 等大语言模型的细节：tokenizer、位置编码、Layer Normalization、激活函数等。2. 大语言模型的分布式训练技术：数据并行、张量模型并行、流水线并行、3D 并行、零冗余优化器 ZeRO、CPU 卸载技术 ZeRo-offload、混合精度训练、激活重计算技术、Flash Attention 大语言模型的参数高效微调技术：prompt tuning、prefix tuning、adapter、LLaMA-adapter、 LoRA。 0. 大纲 1. 大语言模型的细节 1.0 transformer 与 LLM 1.1 模型结构 1.2 训练目标 1.3 tokenizer 1.4 位置编码 1.5 层归一化 1.6 激活函数 1.7 参考文献分析 transformer 模型的参数量、计算量、中间激活、KV cache 【万字长文】LLaMA, ChatGLM, BLOOM 的高效参数微调实践 FlashAttention:加速计算
2.5K64编辑于 2023-09-13
来自专栏NewBeeNLP
极致细节：OPPO搜索广告召回模型落地分享
1.3 样本、特征、训练细节我们先复习下Que2Search特征和样本的设计。 1.3.4 其他训练、评估部分细节 Embedding间的融合使用的Attention Fusion。 Bert的学习率是模型整体学习率的1/3。训练也是先easy后hard的两阶段课程学习模式。数据热门效应严重，观察模型召回的数据来看，模型很容易将不相关但热门的app排到前面。算法的详细细节原理、以及其代码实现笔者这里就不展开了，之前的文章里都有。对于这个优化点，其实笔者已经记录在了之前的一篇文章里，本文仅做思考点分享，详细细节大家可以移步下面这篇文章：Query改写模块的设计和上线部署优化[7] 2.7 减轻热门打压程度进一步提升ecpm 熟悉笔者的朋友知道
1.4K50编辑于 2023-09-01
来自专栏机器学习炼丹术
alphaFold2 | 模型细节之特征提取（三）
文章转自微信公众号：机器学习炼丹术作者：陈亦新（欢迎交流共同进步）调用 AlphaFold2 forward 总结上一篇文章谈了一下alphafold模型框架。现在来解决细节和实现问题。 AlphaFold2 先看全部模型代码： class Alphafold2(nn.Module): def __init__( self, *, 好在这个结构是经典pytorch模型类构建，看到这个类继了nn.Module和forward()的时候，我已经谢天谢地了。老规矩，和之前一样先从forward函数看起来。搞明白了数据流转，那么就搞明白了模型。 mlm.noise，我们先来看MLM类的构建，MLM也是一个集成了nn.Module的模型类： class MLM(nn.Module): def __init__( self,
1.4K20编辑于 2022-11-22
来自专栏机器之心
阿里云通义大模型新技术：MoE模型训练专家平衡的关键细节
混合专家模型（MoEs）通过路由机制动态并稀疏地激活模型参数，使得能高效地增大模型参数规模。我们在 3.4B 激活 0.6B 的模型训练 400B tokens 到设置上进一步对比了模型效果随着均衡范围的变化，可以看到 balance BSZ 从 2 到 128 模型的 PPL 在快速降低，在可以看到，添加局部均衡能提升模型的速度（每个更新步耗时从 1.64秒提升到1.59秒），同时模型的效果也几乎不受影响。提出在基于MoE的大语言模型训练中，负载均衡损失和语言模型损失如同杠杆一样需要权衡，因为两者的优化目标并不一致。我们认为这一进展解决了现有MoE训练中的一个关键问题，为MoE模型的优化提供了新的视角，并有助于构建更加可解释的模型。
54010编辑于 2025-02-03
常见大语言模型解析：技术细节、应用与挑战
常见大语言模型解析：技术细节、应用与挑战1. 微调：通过少量带标签的数据进行任务特定的监督学习，从而优化模型在特定任务上的表现。关键技术：自回归模型：模型每次生成一个词，然后用这个词作为下一个生成的条件输入。其他常见模型与应用除了上述主流模型，还有一些具有特色的语言模型：Claude：由Anthropic推出，强调生成安全性，防止有害内容的生成。大语言模型面临的挑战与未来发展计算资源的要求：随着模型规模的增加，计算成本不断上升，这成为普及大语言模型的一大障碍。总结常见的大语言模型在技术上各有千秋，针对不同应用场景的需求选择合适的模型至关重要。通过深入了解这些模型的架构、应用与局限性，可以更好地为各种AI任务提供解决方案。
52210编辑于 2024-11-21
来自专栏lonelydawn的前端猿区
oracle细节
01、SQL查询语句不区分大小写，但是数据区分 02、where从句中Name=null是查询不到结果的，必须用 is null 03、union去重，union all 不去重，intersect求交集 minu求差集（不必一直用select +条件来查询数据，有些关键字也非常好用） 04、sum、avg、variance（求方差）、stddev（求标准差）只用于数值 05、add_months（date,months）在当前日期上增加（months）个月，正数就是向后推移时间，负数你懂的、last_d
1.5K80发布于 2018-02-09
mcp细节
我可以给你详细讲解协议细节、架构原理、调用流程、常见故障，你要哪一块？还是要我先帮你分析你遇到的 MCP 错误？
50610编辑于 2025-07-13
来自专栏机器学习入门
【AI大模型】深入GPT-2模型细节：揭秘其卓越性能的秘密
学习目标掌握GPT2的架构掌握GPT2的训练任务和模型细节 GPT2的架构从模型架构上看, GPT2并没有特别新颖的架构, 它和只带有解码器模块的Transformer很像. GPT2模型的细节以机器人第一法则为例, 来具体看GPT2的工作细节. * 机器人第一法则: 机器人不得伤害人类, 或者目睹人类将遭受危险而袖手旁观. 2.1 模型过程首先明确一点: GPT2的工作流程很像传统语言模型关于输入编码: 当我们更加深入的了解模型的内部细节时, 最开始就要面对模型的输入, 和其他自然语言模型一样, GPT2同样从嵌入矩阵中查找单词对应的嵌入向量, 该矩阵(embedding matrix) GPT2是在GPT基础上发展处的更强大的语言预训练模型. 学习了GPT2的工作细节: GPT2可以处理最长1024个单词的序列. 每个单词都会和它的前序路径一起"流经"所有的解码器模块. 学习了GPT2自注意力机制的细节: 首先, GPT2的自注意力是Masked self-attention, 只能看见左侧的序列, 不能看见右侧的信息.
66810编辑于 2025-01-17
来自专栏唐成勇
PHP细节
var_dump($obj->j); //null var_dump(isset($obj->j));//由于$j没有赋值，为空null，所以返回false //var_dump($obj->properties); var_dump(isset($obj->name));//私有或者保护属性不能被调用，false //output:bool(false)，你的答案对了吗？为什么
1.1K30发布于 2019-05-26
来自专栏大模型应用
大模型应用：LlamaIndex、LangChain 与 LangGraph 细节深度、协同应用.24
一、引言在大模型应用开发中，如何高效地利用私有数据、编排复杂任务以及管理多轮对话状态是三个核心挑战。今天我们将深度解析这三个框架的架构设计、核心细节，并通过实战案例展示如何协同使用它们构建强大的LLM应用。对接本地大模型，实现全链路私有化部署，避免数据泄露；轻量级集成：提供简洁的 API 接口，一行代码即可完成索引构建与查询，适合快速原型开发。核心组件模型（Models）：封装各类 LLM，如主流的OpenAI、Qwen、Llama3、嵌入模型OpenAI Embeddings、BERT 等与输出解析器。支持本地模型集成，如通过 Ollama 调用 Llama3.1，适配私有化部署场景。
2.3K34编辑于 2026-02-21
来自专栏深度学习与数据挖掘实战
重磅|深度学习ResNet网络模型发明者解析结构细节
内容重点涵盖了他参与发明的ResNet的细节结构以及一系列重要模型（包括LeNet、AlexNet、GoogleNet）的回顾。
1.8K30发布于 2018-11-21
来自专栏用户10004205的专栏
Unity【Dynamic Bone】- 关于人物模型头发、衣物等细节的处理
DynamicBone模拟的物理结算不会导致骨骼距离发生变化，也就是说，DynamicBone并不适合模拟凝胶、橡胶等各方向形变明显的物体，这样的物理模型更加适用于模拟头发、绳子等这些不容易拉伸但容易形变的物体 https://assetstore.unity.com/packages/tools/animation/dynamic-bone-16743 本文以人物头发的处理为例，介绍插件的使用方法：首先要确保模型中包含头发的骨骼节点，单纯的一个头发模型是不能用的。，当物体运动时，其运动幅度越小具体可以调整属性值查看其运动效果，除了这些核心属性外，还要设置Dynamic Bone Collider，来防止头发运动穿模现象，如下图所示，头发在运动过程中会穿过肩膀模型：因此在肩膀处添加Dynamic Bone Collider节点，并根据模型适当调整Collider大小及位置：并将其添加给头发的Dynamic Bone组件中的Colliders：查看效果
2.3K20编辑于 2022-08-29
来自专栏深度学习与python
腾讯做大模型：要拼技术细节、用内部业务“磨刀”
做大模型要“拼细节” “混元”不是腾讯推出的第一个大模型。从 2018 年开始探索大模型相关技术，腾讯先后推出了多个千万 / 亿参数大模型：2021 年 -2022 年推出了多个千亿和万亿参数规模的大模型。但思维链必须在模型规模足够大时才能涌现。在蒋杰看来，业内做强化学习的方法大体相似，腾讯要做的就是“拼细节”。而大家投入的资源不一样、抠的细节不一样，大模型的差异才会最终显露出来。” 先做内部业务的“倍增器” 在通用大模型上，腾讯确实走得不急。在腾讯看来，提效是大模型更有商业价值的地方，腾讯希望混元大模型成为业务的“倍增器”。目前，腾讯内部所有的应用都会基于混元大模型做智能化研发，混元大模型将作为基础设施去支持腾讯的各种产品和应用能力。
45320编辑于 2023-09-18
来自专栏开源部署
Servlet细节
因为一个类型的Servlet只有一个实例对象，那么就有可能会现在某一时刻一个Servlet同时处理多个请求，那么Servlet是否为线程安全的呢？
31810编辑于 2022-09-14
来自专栏Duncan's Blog
面试细节
容光焕发 2.自我介绍时间: 30s - 1min (面试官手中已有你的简历,因此自我介绍不用过于详细) 内容: 主要学习,工作经历(没有工作经历就简短说一下做了什么项目) 3.项目介绍建议使用STAR模型描述自己经历过的每一个项目
50220发布于 2018-09-04

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

图解EfficientNet模型的完整细节

alphaFold2 | 模型细节之Evoformer

YashanDB数据模型设计及实现细节

大模型部署框架 FastLLM 实现细节解析

大模型备案，这些细节最易漏

主流大语言模型的技术原理细节

极致细节：OPPO搜索广告召回模型落地分享

alphaFold2 | 模型细节之特征提取（三）

阿里云通义大模型新技术：MoE模型训练专家平衡的关键细节

常见大语言模型解析：技术细节、应用与挑战

oracle细节

mcp细节

【AI大模型】深入GPT-2模型细节：揭秘其卓越性能的秘密

PHP细节

大模型应用：LlamaIndex、LangChain 与 LangGraph 细节深度、协同应用.24

重磅|深度学习ResNet网络模型发明者解析结构细节

Unity【Dynamic Bone】- 关于人物模型头发、衣物等细节的处理

腾讯做大模型：要拼技术细节、用内部业务“磨刀”

Servlet细节

面试细节

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐