搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

腾讯云Agent Memory多场景实测攻克AI记忆挑战
腾讯云AgentMemory多场景实测攻克AI记忆挑战一、基础高频场景实测：从“翻文档半小时”到“3分钟开箱即用”痛点直击：做AI智能体开发的同学都知道，想让Agent记住用户偏好、跨会话延续任务，最先碰到的就是二、复杂深水区场景实测：从“单点救火”到“全局记忆不丢线”痛点直击：到了遗留系统重构或者长周期多任务场景，记忆问题直接升级成“拦路虎”。常规工具局限：传统方案在金融多轮推理与历史数据调用场景中，常因数据建模与跨系统分析能力有限，需大量人工衔接，导致分析效率受限、决策质量波动。可读性与细节优化：这些指标背后对应的是不同场景的核心优势——基础场景赢在快，复杂场景赢在稳，跨端场景赢在顺。每一步实测都能感受到它在记忆管理上的针对性设计，不是堆功能，而是解真问题。避坑建议：别碰需要手动搭向量库的开源方案，部署复杂度能把人劝退；别信只留最近N次对话的Rolling方案，长期关键信息说丢就丢；跨端场景一定要选底层打通多系统的，不然记忆断层能把用户体验搞崩。
10410编辑于 2026-05-07
来自专栏SIGAI学习与实践平台
户外场景4种典型3D相机成像精度实测
为了让3D视觉学术研究、产品研发人员对这一问题有基本的了解，本文给出以下4种典型3D相机的成像效果实测： 1.国外某知名品牌双目3D相机（以下简称双目相机A），是当前全球范围内知名度最高的双目3D相机， 4.张量无限Tensor Eye（以下简称Tensor Eye），官方标明可用于室外场景。本次测试了这4款3D相机在户外较强光照条件下对典型材质物体的成像效果，重点分析精度与成像稳定性。下表是4种型号相机的部分参数。在这个场景中，双目相机A对光滑的细金属电线杆有明显的扭曲变形，Z向和XY向的误差都超过了4cm。双目相机B对电线杆的Z向和XY向的误差>1cm，也有明显的变形。适用于室内场景的高精度应用，包括机械臂引导，精确测量，缺陷检测等。 4.Tensor Eye，户外场景精度最高，通常可以稳定地达到毫米级成像误差，成像速度慢，价格高。
1.3K20编辑于 2023-10-23
来自专栏程序人生小记
多场景学习
1 背景大型推荐系统存在多场景，而多场景的训练数据存在分布差异。比如：不同媒体的用户存在差异，不同资源位的用户存在差异。对于多场景建模，如果采用各场景独立的方式，会忽视场景共性，导致长尾小场景难以学好，同时每个场景维护一个模型极大地增加系统资源开销和人力成本；如果直接将样本混合，训练共享模型，整个模型会被数据丰富的场景主导和多场景建模很相似的任务是多任务学习，但这二者关注点不同。多任务学习解决相同场景/分布下的不同任务，而多场景建模解决不同场景/分布下的相同任务。例如：推荐场景下的多任务学习通常是单个样本对于 CTR，CVR 等目标同时预估，而多场景建模是对不同场景样本预估相同的 CTR 目标。直接采用多任务学习的方法解决多场景建模也会存在一些问题。? 元注意力模块位于较低位置以捕获不同的场景间相关性，元残差塔模块位于较高位置以增强捕获特定场景特征表征的能力，如图 4 所示。
1.8K30编辑于 2022-06-09
【AGI-Eval实测】Claude 4 网页生成、游戏开发场景深度实测：发布会宣传与真实效果相差几何？
AGI-Eval评测社区第一时间做了对比实测，下滑查看！目录：01. Claude4 模型简介02. Claude 4 实测核心结论03. 网页生成案例实测04. Claude Opus 4 和 Claude Sonnet 4 两个模型在编码、推理、多模态能力和 Agent 任务方面均表现出色。为验证其真实能力，我们选取了网页开发和游戏制作两个典型场景，对 Claude Opus 4 （调用API）和 Claude Sonnet 4 （调用API）进行深度实测，与 DeepSeek-v3 进行横向对比，但提示卡片区域与文案的视觉呈现效果良好，受限于上述问题暂不具备实际场景应用条件。 4. 游戏制作案例实测测试能力：游戏制作类实测通过跳跃游戏、贪吃蛇游戏案例，考察模型的响应速度、代码生成能力、交互与实用性，在游戏制作实测中，代码多需要二次调试。
84010编辑于 2025-06-11
来自专栏xiaosen
机器学习多场景实战
从智能推荐系统个性化推送你可能喜爱的电影和商品，到金融风控领域精准识别欺诈交易；每一个应用场景都是机器学习技术多维度、深层次实战的精彩演绎，我们通过一些小案例对业务进行了解~ 什么是数据指标数据指标概念转化率：计算方法与具体业务场景有关淘宝店铺，转化率=购买产品的人数／所有到达店铺的人数在广告业务中，广告转化率=点击广告进入推广网站的人数／看到广告的人数。当月与上月都有购买的用户数/上月购买的用户数应用Pandas合并数据集 - 组合数据的一种方法是使用“连接”（concatenation) - 连接是指把某行或某列追加到数据中 - 数据被分成了多份可以使用连接把数据拼接起来 b4 c4 d4 1 a5 b5 c5 d5 2 a6 b6 c6 d6 3 a7 b7 c7 d7 pd.concat([df1,df2], axis=1) A B C D A B C D 0 a0 b0 c0 d0 a4 b4 c4 d4 1 a1 b1 c1 d1 a5
50410编辑于 2024-06-06
来自专栏IT码农
定义多场景的表单
定义多场景的表单下面是一个带有添加/编辑的文章表单示例： namespace app\forms; use Yii; use app\models\Article; class ArticleForm extends \yii\base\Model{ const SCENE_ADD = 'add'; //添加场景 const SCENE_EDIT = 'edit'; //编辑场景 public return [ [['id', 'title', 'categoryId', 'content'], 'required'], ['title', 'string', 'length' => [4, 接收参数失败'; } if($form->edit()){ return '保存完毕'; }else{ return $form->firstError[0]; } } 如果表单定义了多场景，而不是盲目地全部validate，毕竟不同场景下有不同的校验字段深入应用其实不能仅仅把场景理解为使用在validate控制上的，自己在form里面写的逻辑代码都可以if($this->scenario
68141发布于 2019-09-02
来自专栏机器人课程与技术
4G网速实测与WIFI使用对比
5G即将普及，4G数据也基本能够满足需要，实测为日常使用地点（两处）和办公室WIFI，如果要求时延低，任何场合都推荐光钎，wifi和4g信号时延都要明显高于有线网络。在线测网速链接：http://www.speedtest.cn/report_mobile/4G 移动（wifi+4G1+4G2）： ~ ? ~ ? ~ ? ~ 联通（wifi+4g1+4g2）： ~ ? ~ ? ~ ? ~ 电信（wifi+4g1+4g2）： ~ ? ~ ? ~ ?
1.8K50发布于 2019-01-23
来自专栏JavaEdge
多主复制的适用场景(1)-多IDC
这就是多主节点（也称为主-主，或主动/主动）复制。此时，每个主节点还同时扮演其他主节点的从节点。 3.1 适用场景在一个IDC内部使用多个主节点没啥大意义，因复杂性远超带来的好处。但某些case，多活配置也合理： 3.1.1 多IDC 为容忍整个IDC级别故障或更接近用户，可将DB的副本横跨多个IDC。单主和多主：性能单活，每个写入须穿过互联网，进入主节点数据中心。采用异步复制功能的多活配置通常能更好地承受网络问题：临时的网络中断并不会妨碍正在处理的写入。有些数据库默认情况下支持多主配置，但使用外部工具实现也很常见，如MySQL的Tungsten Replicator。
67820编辑于 2022-08-01
开源模型新标杆：谷歌 Gemma 4 核心技术架构与多场景能力分析
模型变体与技术规格 Gemma 4 包含四个模型变体，覆盖从边缘设备到数据中心的全场景需求：在 AI Arena 排行榜上，Gemma 4 31B 在所有开源模型中排名第 3，性能可与10 倍规模的模型相媲美多模态处理能力全系模型支持文本、图像和视频（最长60秒，1fps），E2B 和 E4B 额外支持音频输入（最长30秒）。、原生多模态、原生工具调用）、生态系统优势（与Android、Google Workspace 等深度集成）。部分 iPhone 机型只需要 4GB 即可跑 Gemma 4。iPad 使用的是 M 芯片，较新的机型可以跑通 E4B 甚至 26B-A4B。应用前景 Gemma 4在软件开发与代码生成、智能体与自动化、多模态内容理解、边缘计算与物联网、移动应用开发等领域展现出广阔前景。其本地部署能力特别适合企业级开发场景，确保代码隐私和数据安全。
95310编辑于 2026-04-13
来自专栏程序猿DD
实测：文心一言 vs GPT-4
咱们就用百度发布会演示的预录制Demo，对比一下崭新出炉的GPT-4，先凭实力说话。文心一言 vs GPT-4 和GPT-4一样，文心一言是一个多模态大模型。李彦宏开场就展示了文心一言具备的5种能力，包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。文心一言甚至还现场秀了一口接地气的四川话，现场网友发出一片笑声：其他能力如何？到底有多贵？” 这是文心一言的效果展示：还解释了一下这个成语背后的经济学原理：那么，将这个问题抛给GPT-4呢？多模态生成最后，李彦宏还简单展示了一下文心一言多模态生成的能力。首先来看看，为即将到来的2023世界智能交通大会创作海报—— 而除了前文展示过的文字转四川话能力，文心一言还能文字转视频。百度基于对中国语言文化和中国应用场景的理解，筛选了特定的数据来训练模型。至于人类反馈的强化学习（RLHF）和提示构建，操作上也与ChatGPT大差不差。
77420编辑于 2023-04-04
从个人博客到电商中台：EdgeOne Pages的MCP Server弹性架构×DeepSeek多场景模板实测报告
其核心价值在于将边缘计算能力与现代 Web 开发范式深度融合，支持静态站点托管、动态应用开发、边缘函数部署等场景，尤其适合需要快速迭代、全球化加速或低成本运维的项目。以下从技术原理、核心功能、应用场景等维度展开详细解析。 background: white; padding: 2rem; border-radius: 10px; box-shadow: 0 4px 100px; line-height: 1.6; } #result h1, #result h2, #result h3, #result h4, width: 100%; height: 8px; background-color: #e0e0e0; border-radius: 4px
96800编辑于 2025-04-04
来自专栏爱可生开源社区
多场景 OceanBase 并发参数调整方案
租户线程相关概念 2.1 租户最大线程数为了维持租户活跃线程数恒定，同时考虑到大查询线程挂起的发生，租户就需要动态的从多租户线程池中申请线程。 4. 参数一览并发相关参数 5. ON t1.tenant_id = t4.tenant_id -> INNERJOIN OCEANBASE.DBA_OB_UNITS t2 ON t4.resource_pool_id 结论场景一&场景二：parallel_servers_target 等于 80，但在实际应用场景中，达到 80 并发并不一定会产生队列等待；未达到 80 并发也可能产生队列等待，与查询种类（大查询/小查询 back=kb 《工作线程》：https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002014039 《多租户线程常见问题
52310编辑于 2025-06-20
来自专栏yeedomliu
腾讯云微搭多场景使用
实践：快速搭建餐饮小程序步骤使用微搭快速完成表单的CRUD 制作一个搜索页面（通过手机号查询预约信息），需要两个页面（搜索页、显示页）数据源创建数据源添加字段『姓名』添加字段『手机』添加字段『日期』创建应用添加表单填写并提交表单查看数据创建搜索页面添加表单搜索字段添加搜索按钮修改输入框提示语添加信息展示页添加全局变量搜索处理显示页处理显示效果显示页面把全局参数赋值给表达式
4K30编辑于 2022-01-23
来自专栏架构驿站
【性能工具】LoadRunner多场景顺序执行
应用场景：假设有多个不同的测试场景，多个场景有先后执行顺序。或者都需要测试,但白天时间有限, 通过晚上批量执行,可以有两种方式实现。 3个脚本的运行顺序为“Start when Group xxx finished”，并在“Scenario Start Time”中设定场景在晚上的运行启动时间。设定完定时执行场景后，点击StartScenario按钮，会出现一个倒计时窗口，这样在固定的某个时间上，测试场景中的3个脚本将乖乖的按照设定的先后顺序进行测试。，假设其中每个场景一个测试脚本(实际上没有关系,在场景里边设置你需要的脚本和模式,时间等等)。首先创建并设置好不同测试场景，再创建一个一个批处理程序按先后顺序调用这些场景进行测试，最后通过Windows的定时任务设定批处理的执行时间。
75750编辑于 2022-03-25
来自专栏深度学习与python
实测对比！扣子空间播客功能完爆 NotebookLM，覆盖场景更大
实测对比！扣子空间播客功能完爆 NotebookLM，覆盖场景更大,InfoQ,4分钟本播客由扣子空间（coze.cn）一键生成作者 | 红羽多模态始终是大模型领域，想象空间最大的应用概念，从 Sora 的文生视频从场景来看，计划出游是个相对轻松的场景，用户很难这时去研究“提示词工程”，AI 的理解能力就成了保障交付的关键。扣子空间的播客功能最强大的地方，在于其可适配的场景非常多，完全不限于上传 word 生成播客的僵化形式，接近于随时随地，在任何主流场景下，提供播客服务。至于其他 AI 生成 PPT 的垂类工具，压力主要来自场景和产品。场景足够广、产品足够强，是当下 AI 应用抢占市场的不二原则。但是垂类工具天然场景狭窄，客户获取困难。
64800编辑于 2025-06-08
来自专栏编程
（4）Superset权限使用场景
本文先介绍这几个角色，然后结合实际的安全访问控制的场景，看在Superset中怎样实现。角色权限介绍 Admin：拥有所有权限。 /incubator-superset/issues/3938 https://github.com/apache/incubator-superset/issues/2326 本文列举了权限使用几种场景
9.6K120发布于 2018-01-30
来自专栏秋枫学习笔记
SATrans：多场景CTR预估，场景地适应的特征交互方式
然而大部分多场景模型都面临场景区分建模不充分、随着场景数量增加效果下降，缺乏可解释性等问题。并且现存的所有多场景模型在对各场景区分建模时，都没有考虑过显示特征交互问题，这限制模型的表达能力且影响到模型性能。本文针对多场景模型内的特征交互问题，提出场景自适应特征交互框架SATrans(Scenario-Adaptive Feature Interaction framework)。接着是多场景自适应交互层，在场景embedding的指导下通过自注意力机制组合高阶特征。通过堆叠L交互层，可以对(L + 1)阶的场景自适应特征交互进行建模。，文中提出下图三种方式 4 实验结果 Ali-CCP 和 Ali-Mama 数据集上的AUC表现 WeChat-MS 上的表现往期推荐 MemoNet：用codebook记住所有的交叉特征来做
2K50编辑于 2023-09-20
来自专栏算法一只狗
Llama 4发布即开源 | 实测效果如何？
Meta 终于发布了一个原生多模态大模型 Llama4。而且一经发布，在大模型LMSYS排行榜上，Llama 4 Maverick冲上第二。仅仅比 Gemini-2.5-pro 模型少 22 分。 应用场景：预计将用于需要极高计算能力和复杂推理的任务，如科学研究和高级数据分析。这三个模型共同特点：混合专家架构（MoE）：通过仅激活部分参数，提高计算效率，降低训练和推理成本。在专家混合架构（Mixture of Experts，MoE）中，采用了128 个路由专家和一个共享专家，同时为了高效训练，也采用 FP8 精度加快模型训练速度为了支持原生的多模态输入，Llama 4 写在最后Llama 4 的发布，标志着 Meta 正式加入原生多模态大模型竞赛的核心战场。、多模态通用性。
1K20编辑于 2025-04-25
来自专栏架构进阶
实测｜Mac本地Claude Code，4大热门模型（minimaxqwenkimiglm）对比
（基础编码、复杂代码调试、办公文档处理、多模态推理），每个场景设置相同的任务指令，对比模型的响应速度、输出质量、容错率、易用性测试环境：全程关闭其他后台应用，仅保留Ollama和Claude Code 四核心实测：4大模型全方位对比（相同案例，公平PK）本次测试选取了4类高频场景，覆盖编码、办公、推理等日常使用场景，每个场景设置相同的任务指令，从响应速度、输出质量、容错率、易用性4个维度进行评分（明显短板速度略逊于 minimax，使用成本更高适用人群：重度办公、长文章阅读、多轮深度对话、对输出品质要求极高的用户五、实测总结：4个模型怎么选？七、最后总结本次Mac本地基于Ollama安装Claude Code，以及4个热门模型的实测，到这里就全部结束了。最后，希望这篇实测推文，能够帮到大家，无论是Ollama安装Claude Code的实操，还是4个模型的选择，都能让大家少走弯路。
58931编辑于 2026-05-06
2026年4月 7款国产大模型能力实测
2026年4月7款国产大模型推理能力实测：谁能发现网站付费墙的漏洞？一次真实的代码安全分析任务，7款国产大模型同台竞技，最终只有1款完成了挑战。背景大模型的代码能力评测很多，但跑分和实战是两回事。 2个模型下载了错误的文件，4个模型完全没下载成功。网站的真实漏洞是什么？在分析模型表现之前，先说清楚这个网站到底有什么问题。 id=45c396367f59→拿到MP3的CDN直链下载成功，441KB，朗诵者"诵读客"深入分析s■■■■.js源码→发现前端检查Cookie但后端不验证→完整还原漏洞链关键决策点在第4步：当其他模型在猜测这次测试只是一个具体场景，不能代表模型的整体能力。本文基于2026年4月23日的实测数据，测试环境为Trae企业版IDE模式。所有模型使用相同的提示词和工具集。
28200编辑于 2026-04-23

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

腾讯云Agent Memory多场景实测攻克AI记忆挑战

户外场景4种典型3D相机成像精度实测

多场景学习

【AGI-Eval实测】Claude 4 网页生成、游戏开发场景深度实测：发布会宣传与真实效果相差几何？

机器学习多场景实战

定义多场景的表单

4G网速实测与WIFI使用对比

多主复制的适用场景(1)-多IDC

开源模型新标杆：谷歌 Gemma 4 核心技术架构与多场景能力分析

实测：文心一言 vs GPT-4

从个人博客到电商中台：EdgeOne Pages的MCP Server弹性架构×DeepSeek多场景模板实测报告

多场景 OceanBase 并发参数调整方案

腾讯云微搭多场景使用

【性能工具】LoadRunner多场景顺序执行

实测对比！扣子空间播客功能完爆 NotebookLM，覆盖场景更大

（4）Superset权限使用场景

SATrans：多场景CTR预估，场景地适应的特征交互方式

Llama 4发布即开源 | 实测效果如何？

实测｜Mac本地Claude Code，4大热门模型（minimaxqwenkimiglm）对比

2026年4月 7款国产大模型能力实测

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐