搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏大模型应用
大模型应用：算力分层治理：基于大模型算力四层匹配体系的优化方案.72
今天我们一如既往对算力刨根问底，拆解算力三层核心构成与四层匹配体系，用通俗易懂的示例，和大家一起跳出加卡误区，掌握大模型算力分层治理的核心逻辑，让每一份硬件投入都转化为实实在在的落地效率。算力的四层匹配体系三层算力是核心骨架，而四层匹配是落地执行方案，是让三层算力发挥最大价值的全链路保障，也是解决加卡无效的核心路径。中间激活值容量：大模型训练时，每一层的输出（中间激活值）需要存储下来用于反向传播，其容量甚至可能超过模型参数（比如 GPT-3 训练时，中间激活值可达数 TB），需要采用“激活值检查点”技术，牺牲少量计算算力换取显存空间第四步：监控优化（闭环迭代）部署算力监控工具（如 Prometheus + Grafana），实时监控三层算力的利用率、四层匹配的效率；针对出现的瓶颈（如通信开销过大、显存利用率过低）进行迭代优化，形成四、总结结合大模型产业化落地的实操经验，算力焦虑的核心从不是硬件不够，而是认知和方法跑偏，加卡不是唯一的解决问题的途径，往往是忽视了算力的协同本质，与其盲目加卡，不如先梳理清楚计算、访存
21643编辑于 2026-04-10
来自专栏Michael阿明学习之路
05.序列模型 W3.序列模型和注意力机制
基础模型 2. 选择最可能的句子 3. 集束搜索（Beam Search） 4. 改进集束搜索 5. 集束搜索的误差分析 6. Bleu 得分 7. 注意力模型直观理解 8. 注意力模型 9. ） 3. 在集束宽为3时，集束搜索一次只考虑3个可能结果如果集束宽等于1，就变成了贪心搜索算法同时考虑多个可能的结果比如3个，10个或者其他的个数，集束搜索通常比贪婪搜索更好 4. 注意力模型直观理解 ? ? 注意力权重， a<t,t> 告诉你，当你尝试生成第 t 个英文词，它应该花多少注意力在第 t 个法语词上面。当生成一个特定的英文词时，这允许它在每个时间步去看周围词距内的法语词要花多少注意力。 8. 注意力模型注意力模型如何让一个神经网络只注意到一部分的输入句子。当它在生成句子的时候，更像人类翻译 ?
58810发布于 2021-02-19
来自专栏Triciaの小世界
力扣——四数之和
请你找出并返回满足下述全部条件且不重复的四元组 [nums[a], nums[b], nums[c], nums[d]] （若两个四元组元素一一对应，则认为两个四元组重复）： 0 <= a, b, c, 四数之和的双指针解法是两层for循环nums[j] + nums[i]为确定值，依然是循环内有left和right下表作为双指针，找出nums[j] + nums[i] + nums[left] + nums fourSum = function (nums, target) { if (nums.length < 4) return [] let n1, n2, n3, nums.sort((a, b) => (a - b)) let arr = [] for (let i = 0; i < nums.length - 3; j + 1, right = nums.length - 1 while (left < right) { n3
25720编辑于 2023-04-12
来自专栏代码编写世界
Cesium案例解析(四)——3DModels模型加载
代码 3. 解析 4. 参考 1. 概述 Cesium自带的3D Models示例，展示了如何加载glTF格式三维模型数据。glTF是为WebGL量身定制的数据格式，在网络环境下有自己的优点。 3. 解析 3D模型在Cesium中被描述为名为Cesium.Entity的实体类，可以通过这个类加载gltf的3D模型数据。参数minimumPixelSize表示模型缩小到多少像素后，不再能被缩小。模型的位置以及方位参数是有外部的Cesium.Entity来决定的。 position是其位置信息，orientation是方位信息，这里有点像给Camera设置参数的部分，只不过传入的方位参数通过headingPitchRollQuaternion进一步转换成了四元数。
5.7K10发布于 2020-02-24
来自专栏睡前机器学习
模型，奥力给！
也许机器学习的教材们也都这么认为，介绍任何模型，总是噼里啪啦，把算法原理和怎么训练风风火火过了一遍，然后就结尾了。 “那么......训练好的模型，要怎么用呢？” 偏差达到最小化，模型就训练好了。那回到最开始的问题，怎样使用训练好的模型呢？也很简单，上面看出来了，模型无非就是一个喂点什么进去，然后就会吐点什么出来的玩意。 datasets.load_boston(return_X_y=True) X_train, X_test, y_train, y_test = train_test_split(X, y) 现在我们有了四套数据记住，Y在机器学习里，都是代表有监督学习的参考答案，是要和模型的预测值比较的。选一套模型吧。波士顿房价数据集是明码实价的回归问题，就选择用最最最基础的线性回归模型烹调好了。首先是声明。现在，可以使用这个模型了。
32720编辑于 2022-04-11
来自专栏机器之心
蚂蚁集团开 “卷” 金融大模型，“四力和一” 解决产业真命题
近半年时间，素来以新技术最早采用者著称的金融机构以及科技公司纷纷下场： 3 月，美国彭博正式发布百亿级语言大模型 BloombergGPT； 5 月，度小满推出国内首个千亿级中文金融大模型「轩辕」； 6 一、金融大模型：屹立在万亿 Token 上的「知识力」通用大模型缺少金融领域的专业力、知识力、语言力以及安全力，金融大模型实现落地行业是一个复杂化的系统工程，需要将「四力」形成合力。蚂蚁金融大模型具有「四力」，知识力、语言力、专业力和安全力所谓知识力，主要是指金融大模型的底座能力，模型规模只有足够大（通常百亿以上），才会有「涌现」现象的出现。预训练大模型则需要海量数据。四、「四力合一」的上与下：底层支持与产业应用强大底层算力设施为蚂蚁金融大模型提供了一个好的基础和起点。蚂蚁探索出了一条路：以行业大模型为认知和交互的中枢，调用领域知识和专业服务，这是一个「大模型 + 知识 + 服务」驱动的架构，为消费者和产业应用，提供「四力」的支撑。
1.1K50编辑于 2023-09-19
来自专栏瓜大三哥
UVM模型（四）
UVM模型（四） 1.常用到的uvm_component uvm_driver:所有的driver都要派生自uvm_driver。
1.5K90发布于 2018-02-26
来自专栏石云升
波特五力模型
波特五力模型是分析企业竞争环境的一个分析模型。根据波特的观点，每家企业都受到“直接竞争对手、顾客、供应商、潜在新进公司和替代性产品”这五个“竞争作用力”的影响。我们用波特五力模型试着分析下实体书店竞争是否激励。直接竞争对手：如果直接对标卖书，那么其他书店是你的直接竞争对手，如果你定位是给一个线下的安静空间，享受书店的文化氛围。你看，在思考这个模型的时候，可以帮助我们制定相应的竞争战略，同时也帮助我们想清楚了很多细节问题。这就是工具的价值。
61510编辑于 2022-08-25
来自专栏红色石头的机器学习之路
完结篇 | 吴恩达《序列模型》精炼笔记（3）-- 序列模型和注意力机制
本例中，令B=3。按照beam search的搜索原理，首先，先从词汇表中找出翻译的第一个单词概率最大的B个预测单词。从中选择概率最大的3个作为第二个单词的预测值，得到：in september，jane is，jane visits。此时，得到的前两个单词的3种情况的概率为：接着，再预测第三个单词。根据这种“局部聚焦”的思想，建立相应的注意力模型（attention model）。 Attention model能有效处理很多机器翻译问题，例如下面的时间格式归一化：下图将注意力权重可视化：上图中，颜色越白表示注意力权重越大，颜色越深表示权重越小。语音识别的注意力模型（attention model）如下图所示：一般来说，语音识别的输入时间序列都比较长，例如是10s语音信号，采样率为100Hz，则语音长度为1000。
54520编辑于 2022-01-12
来自专栏null的专栏
注意力FM模型AFM
mathbb{R}^k ，则\hat{w}_{ij} 可以表示为：\hat{w}_{ij}=\mathbf{v}_i^T\mathbf{v}_j对于具体为甚么上述的这样的计算方式可以方便计算，可以参见参考[3] 如果将FM模型放入到神经网络的框架下，FM模型的结构可以由下图表示：图片对于每一个特征都赋予一个$k$维的向量，如上图中的第二个特征x_2 的k 维向量为\mathbf{v}_2 ，同理，第四个特征x_ AFM的网络结构在注意力FM模型AFM（Attentional Factorization Machines）中，是在FM的基础上引入了Attention机制，通过Attention网络学习到每个交叉特征的权重 = 3:raise ValueError("Unexpected inputs dimensions %d, expect to be 3 dimensions" % (K.ndim(inputs))) the weight of feature interactions via attention networks[J]. arXiv preprint arXiv:1708.04617, 2017.[3]
88330编辑于 2023-01-16
来自专栏人工智能与演化计算成长与进阶
序列模型3.7-3.8注意力模型
3.7 注意力模型直观理解 Attention model intuition 长序列问题 The problem of long sequences 对于给定的长序列的法语句子，在下图中的网络中，绿色的编码器读取整个句子而对于长句子，注意力模型会和人类翻译一样，每次翻译句子中的一部分，从而提高句子翻译长句子的能力。 ? 注意力模型 Attention model intuition “Bahdanau D, Cho K, Bengio Y. 与普通的 RNN 不同的是，注意力模型不会看每一个输入的单词，而是对输入的每个单词选择一定的注意力权重用于表示这个单词对于正在翻译的单词具有多大的影响下图中的分别表示前三个单词对第一个词语的翻译具有的影响力 ---- 3.8 注意力模型细节 Attention model 特征提取模型使用的双向循环神经网络，这样其对于前向传播和后向传播分别有激活值 $\overrightarrow{a^{ 对于一个时间步
66610发布于 2020-08-14
来自专栏null的专栏
注意力FM模型AFM
{R}^k ，则 \hat{w}_{ij} 可以表示为： \hat{w}_{ij}=\mathbf{v}_i^T\mathbf{v}_j 对于具体为甚么上述的这样的计算方式可以方便计算，可以参见参考[3] 如果将FM模型放入到神经网络的框架下，FM模型的结构可以由下图表示：对于每一个特征都赋予一个 k 维的向量，如上图中的第二个特征 x_2 的 k 维向量为 \mathbf{v}_2 ，同理，第四个特征 AFM的网络结构在注意力FM模型AFM（Attentional Factorization Machines）中，是在FM的基础上引入了Attention机制，通过Attention网络学习到每个交叉特征的权重 = 3: raise ValueError( "Unexpected inputs dimensions %d, expect to be 3 dimensions" % (K.ndim(inputs 防止过拟合 afm_out = self.tensordot([attention_output, self.projection_p]) # 乘以向量，做最终的输出 return afm_out 3.
68140编辑于 2023-02-02
四力PLUS商家增长平台产品介绍
三、应用框架和功能介绍功能框架四力经营看板：商品诊断力：新增商品分类（明星/话题/高潜/低潜商品，基于吸引力<浏览PV/UV、加车人数>和业务贡献）与爆款识别（追踪头部爆款转化详情，如曝光量- 深度洞察看板-人群画像：结合方略标签产品化，支持省份/性别/年龄/学历/城市分布等画像洞察，开通需联系四力助理@罗芸冰（数据接入达标后开通）。数据建模共创：人货匹配推荐、市场空间测算、异业合作匹配度等共创模型。会员产品与服务：3大合作服务（战略规划、运营服务、数字化升级），3大权益（流量支持、数据能力、市场声望），含四力360°经营看板、知识库、战略咨询。案例库分享（四力知识库）某茶饮私域案例+联名营销干货；某知名彩妆案例+干货推荐；某商场相关案例与干货（原文信息不足，按最大信息量呈现）。
9610编辑于 2026-03-31
来自专栏新智元
【谷歌大脑力作】RNN最新技术：注意力增强 RNN，四大模型
【新智元导读】谷歌大脑团队的Chris Olah & Shan Carter 整理了 2016 年递归神经网络（RNN）的发展，总结了神经图灵机、注意力界面、自适应计算时间和神经编程器这四个使用注意力对常规他们认为，这四大模型会对接下来 RNN 发展产生重大影响。新智元提供本文中文翻译，可访问原始页面查看更多。图片均来自原文。在 RNN 之间使用注意力的一大应用是翻译（Bahdanau, et al., 2014）。传统的序列到序列模型必须将整个输入全部转换为单一的一个向量后，再反向扩展。还有 Vinyals 和 Le 2015 年写的论文，让模型在生成回应时，关注之前的一部分对话，通过这种方式建立对话模型。 ? 注意力还能用于卷积神经网络和 RNN 之间的界面。我们通过让需要进行的步骤的数量进行注意力分布实现这一点。输出是每一步输出加权的和。上一幅图中省略了一些细节。下面这幅图是进行 3 个计算步骤的完整图示。 ?
1.3K50发布于 2018-03-23
来自专栏DrugOne
ICML 2024 | 通过力引导的SE(3)扩散模型生成蛋白质构象
为了解决这些问题，本文提出了一种用于蛋白质构象生成的力引导SE(3)扩散模型——CONFDIFF。通过将力引导网络与基于数据的评分模型混合，CONFDIFF可以生成具有丰富多样性且保持高保真的蛋白质构象。通过在扩散采样过程中引入额外的力引导网络，优先生成具有较低势能的构象，从而有效提高采样质量。模型部分图 1 作者的基线模型包括一个无条件评分模型和一个序列条件评分模型。此外，作者报告预测的残基间接触率的均方根误差（RMSEcontact），以反映模型在柔性区域的准确性。表 1 图 3 结果总结在表1中，并在图3和图S3中展示TIC投影中的样本分布。为了比较，作者报告5个簇的平均最佳RMSD（RMSDAVG）和簇3的RMSD（RMSDCLS3），后者是最难采样的簇。
78010编辑于 2024-07-05
来自专栏新智元
Magic3D新模型力压谷歌DreamFusion
大厂接连入局AIGC，怎能少了英伟达 9月，谷歌发布了基于文本提示生成3D模型的DreamFusion，声称不需要 3D 训练数据，也不需要修改图像扩散模型，证明了预训练图像扩散模型作为先验模型的有效性该公司研究人员发布了Magic3D，这是一个可以从文字描述中生成3D模型的AI模型。 Magic3D还可以对3D网格进行基于提示的实时编辑。想改变生成模型，只要改改文字提示，就能立即生成新的模型。对于每个3D模型，团队从两个视图渲染它，每个视图都有无纹理渲染，并删除背景以专注于实际的 3D 形状。可以发现，Magic3D生成的3D模型在整体和纹理上都更胜一筹。「我们希望通过Magic3D，可以使3D合成技术进一步普及，并激发每个人在3D内容上的创造力。」经过近十年的技术发展，人们对AIGC的探索已经进入了商业化、规模化的阶段。
1K20编辑于 2023-01-07
2021智慧零售私域增长指南：四力模型驱动私域增长新范式
2021智慧零售私域增长指南 •发布机构：腾讯智慧零售 •发布时间：2021年 •行业标签：零售,电商,餐饮,技术服务,生活服务,通用工具,通用SaaS •产品标签： #腾讯智慧零售四力增长模型报告旨在以四力增长模型为核心，为零售企业提供私域建设方法论与实战案例，推动全渠道数字化增长。 •核心分析模型：腾讯智慧零售四力增长模型（组织力、运营力、商品力、产品力），架构图关键要素包括四力协同、公私域联动、数据驱动。第五章：核心观点 •核心发现：私域是企业增长关键，四力增长模型是私域建设方法论。结论：腾讯云以“四力模型”为核心，通过技术赋能与生态协同，为企业提供可落地的私域增长路径，助力实现“有效私域”与GMV可持续增长。
10510编辑于 2026-05-07
2021腾讯智慧零售私域增长指南：四力模型驱动全域增长新范式
•报告标题：2021智慧零售私域增长指南 •发布机构：腾讯智慧零售 •发布时间：2021年 •行业标签：零售,电商,技术服务,生活服务,通用SaaS •产品标签： #腾讯智慧零售四力增长模型本报告旨在分享“四力增长模型”方法论及服饰、美妆、3C等7大行业实战案例，助力企业从私域基建到规模化增长。 •核心分析模型：“四力增长模型”（组织力、运营力、商品力、产品力），架构图关键要素包括“公域引流-私域沉淀-运营转化-数据复盘”全链路。 •唯一性：首个提出“四力增长模型”并落地多行业的云服务商，通过“千域计划”共建私域生态，获BCG联合认证为私域增长方法论标杆。权威背书：腾讯公司高级副总裁林璟骅、腾讯智慧零售副总裁陈菲领衔，联合BCG发布《抢滩私域新战场——2021中国私域营销白皮书》，验证四力模型有效性。
6610编辑于 2026-05-07
来自专栏jay_blog
【力扣刷题】18. 四数之和
一、题目描述来源:力扣（LeetCode）给你一个由 n 个整数组成的数组 nums ，和一个目标值 target 。请你找出并返回满足下述全部条件且不重复的四元组 [nums[a], nums[b], nums[c], nums[d]] （若两个四元组元素一一对应，则认为两个四元组重复）： 0 <= a, b, c, 右指针此时指向区间右侧第一个非重复元素 } } } } return res; } } 四、
23230编辑于 2022-11-02
来自专栏全栈程序员必看
TCPIP协议四层模型
TCP/IP协议族是一个四层协议系统： ####1. ####3. 传输层 3.1 作用传输层的作用是为应用程序提供端对端通讯的”错觉”，即为应用程序隐藏了数据包跳转的细节，负责数据包的收发、链路超时重连等。 (3) SCTP协议: SCTP(Stream Control Transmission Protocol, 流控制传输协议)是为了在因特网上传输电话信号而设计的。 ####4. 它使我们能在本地完成远程任务 (2) OSPF协议: OSPF协议(Open Shorttest Path First, 开放最短路径优先)是一种动态路由更新协议，用于路由器之间的通讯，以告知对方自身的路由信息 (3)
66810编辑于 2022-09-07

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

大模型应用：算力分层治理：基于大模型算力四层匹配体系的优化方案.72

05.序列模型 W3.序列模型和注意力机制

力扣——四数之和

Cesium案例解析(四)——3DModels模型加载

模型，奥力给！

蚂蚁集团开 “卷” 金融大模型，“四力和一” 解决产业真命题

UVM模型（四）

波特五力模型

完结篇 | 吴恩达《序列模型》精炼笔记（3）-- 序列模型和注意力机制

注意力FM模型AFM

序列模型3.7-3.8注意力模型

注意力FM模型AFM

四力PLUS商家增长平台产品介绍

【谷歌大脑力作】RNN最新技术：注意力增强 RNN，四大模型

ICML 2024 | 通过力引导的SE(3)扩散模型生成蛋白质构象

Magic3D新模型力压谷歌DreamFusion

2021智慧零售私域增长指南：四力模型驱动私域增长新范式

2021腾讯智慧零售私域增长指南：四力模型驱动全域增长新范式

【力扣刷题】18. 四数之和

TCPIP协议四层模型

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐