搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

基于Bedrock的自学习生成式AI系统构建
这种复杂性，加上每天数百万次的提交，使得目录信息丰富成为自学习AI的理想试验场。这促使我们设计了一个重新构想生成式AI如何扩展的自学习系统。多个较小模型通过共识处理常规案例，仅在出现分歧时调用较大模型。下图展示了这个自学习系统的架构。在自学习架构中，产品数据流经生成器-评估器工作节点，分歧被路由给监督者进行调查。推理后，系统还会捕获来自卖家（如上架更新和申诉）和顾客（如退货和差评）的反馈信号。关于作者某负责人是某电商平台选品与目录系统部门的首席科学家，他率先设计了大规模自学习生成式AI系统以提升目录质量。他热衷于开发持续改进的闭环系统，并在某选品与目录系统部门领导战略计划，构建一个复杂的自学习闭环系统，整合来自顾客、卖家和供应链运营的信号以优化结果。
11510编辑于 2026-02-18
来自专栏【计网】Cisco
【Cisco Packet Tracer】交换机的自学习算法
⛳️2. 交换机的自学习算法 2.1 实验目的理解自学习算法：通过本实验，旨在深入理解Cisco Packet Tracer交换机的自学习算法，掌握其工作原理和过程。主机0的ARP高速缓存表：同样由主机0往主机2发送数据包，第一次当数据包传递到交换机时交换机会将其转发给集线器：当下一次交换机遇到此类情况便会截止发送：交换机的自学习算法（1）step1 2. （3）step3 在新的局域网下验证交换机的自学习算法：构建新的网络拓扑并由主机4向主机5传输数据包，通过实验发现此时交换机在第一次记录了主机4的MAC地址和端口信息，在主机5收到后返回响应也会传输到交换机并留下主机设置交换机的命令行界面：由于清除了交换机的所有MAC记录，所以再次由主机4向书记5传输数据包交换机会将其进行转发，设置交换机的命令行界面： 2.4 实验体会深入了解自学习算法：通过观察实验中交换机的学习过程，对自学习算法有了更深刻的理解。
86710编辑于 2024-02-20
来自专栏CreateAMind
TCN: 端到端机器人自学习算法
Time-Contrastive Networks: Self-Supervised Learning from Multi-View Observation
50720发布于 2018-07-24
来自专栏编码如写诗
OpenClaw自学习：AReaL 让智能体真正学会
模型家族 Qwen2/3（含MoE版本） Qwen2.5-VL、Qwen3-VL（视觉语言） Gemma 3 其他Hugging Face LLM 训练后端后端数据并行张量并行流水线并行序列并行数学推理 GSM8K：支持多种算法的数学推理训练多轮对话：跨轮次奖励折扣 Countdown：自定义奖励函数 2. 智能体强化学习通用智能体：兼容多种框架客服智能体：Tau2-Bench数据集搜索智能体：端到端搜索流程工具调用：多轮工具使用（Python执行器、计算器等） 3. 集群） python3 examples/math/gsm8k_rl.py \ --config examples/math/gsm8k_grpo.yaml \ cluster.n_nodes=2
76611编辑于 2026-03-05
来自专栏新智元
【攻克Dota2】OpenAI自学习多智能体5v5团队战击败人类玩家
刚刚，OpenAI 宣布了一个大新闻——还记得去年他们的AI在 Dota2 1v1 比赛中战胜了人类职业玩家 Dendi吗？现在，OpenAI的由5个神经网络组成的OpenAI Five，已经开始击败Dota 2的业余玩家队伍。 4月23日，OpenAI Five首次击败了脚本基线。 Dota2究竟有多难？复杂程度超乎想象玩星际争霸或Dota，需要AI在不确定的情况下进行推理与规划，涉及多个智能体协作完成复杂的任务，权衡短中长期不同的收益。 Dota 2 是一个实时竞技电子游戏，有两支5人队伍组成，每个人都控制一个英雄，能玩Dota的AI，必须掌握以下技巧：很长的时间线。我们的一个团队成员在休假时离开了2v2模型的训练，打算看看还需要多久的训练才能提高性能。令他惊讶的是，这个模型学会了没有任何特别的指导或奖励的情况下creep block。 ? 我们还在修复bug。
67400发布于 2018-07-31
来自专栏新智元
【攻陷Dota2】马斯克的OpenAI自学习机器人完虐人类最强玩家
【新智元导读】OpenAI 的机器人刚刚在 Dota2 1v1 比赛中战胜了人类顶级职业玩家 Denti。 Dota2 沦陷继横扫顶级的人类国际象棋大师和围棋大师后，计算机如今在风靡全球的电子游戏 Dota 2 中战胜了世界级的职业玩家。此前未被披露的此场对决发生于 Valve 奖金高达2400万美元的 Dota 2 国际邀请赛 “The International”。 ? OpenAI 的 CTO Greg Brockman 在赛前介绍称这一款机器人通过数千次的加以指导的自我对决进行训练，并称该机器人已经击败了数个 Dota 2 的职业玩家。原文地址：https://blog.openai.com/dota-2/ http://www.businessinsider.com/the-international-dota-2-openai-bot-beats-dendi
91050发布于 2018-03-22
机器人通过自学习实现逼真唇部同步
当人们面对面交谈时，近一半的注意力会集中在嘴唇的运动上。尽管如此，机器人仍然很难以一种令人信服的方式移动嘴巴。即使是最先进的人形机器，也常常依赖僵硬、夸张的嘴巴动作，看起来像木偶，前提是它们有脸的话。
13610编辑于 2026-01-21
来自专栏我还不懂对话
【自学习】- 怎么让对话机器人越来越强？
} \tag{2}同时，聚类需要query两两计算距离，真实情况下query会十分多，这样计算效率低下，十分耗时。图片将用户历史query构建为session，通过seq2seq模型来对语义建模，生成推荐的query。训练目标：1. 生成的损失：每个token预测和标签的交叉熵。 2. copy的损失，和生成的损失类似有用户错误、asr错误，通过这种seq2seq的模型，学习session中的语言模型，能够对其中一些错误进行纠正，获得正确的query改写。 2）换一种说法（复述）。3）换意图or放弃。通过sf表征query，通过会话中的sf构建会话图，建立转移概率句子，利用消融马尔科夫，并统计每个sf的成功率，来对query进行改写。 2）SF，包含domain、intent、slot、得分等、3）一些手工提取的特征，对于DIM模型，预估的是是否存在缺陷。
1.6K20编辑于 2022-09-06
来自专栏Java3y
【面试现场】如何设计可自学习的五子棋AI？
题目：如何设计可自学习的五子棋AI？ ? ? ? ? ? ? ? ? ? ? ? ? 【请教大神】小史回到学校，把面试的情况和计算机学院的吕老师说了一下。 ? ? ? ? ?
92321发布于 2018-12-28
来自专栏FreeBuf
未来趋势 | 自学习网络或许会在2018年替代传统的僵尸网络
在本周举办于法国尼斯的供应商国际媒体会议上，Fortinet的全球安全战略负责人Derek Manky表示，自学习网络（例如由Hivenet驱动的Swarmbot-一种智能集群网络）在2018年将会成为一种新的威胁趋势跟传统的僵尸网络不同，Hivenet自学习网络中的僵尸设备无需等待攻击者向其发送控制命令，而且Hivenet还可以成倍地自发增长和扩大。 Fortinet预测称，这种自学习攻击网络不仅将能够同时对多个目标发动攻击，而且目前的威胁缓解以及事件响应方案都无法有效地应对这种威胁。考虑到企业环境的话，Trump认为：“当某个僵尸网络对你的企业发动DDoS攻击，垃圾邮件攻击或者点击欺诈攻击时，无论发动攻击的是普通的僵尸网络还是Hivenet自学习网络，其实都不重要了。不过，相比于传统僵尸网络来说，基于Hivenet驱动的自学习型僵尸网络的破坏力则更加严重，如果这些基于机器学习技术的僵尸网络真的非常高效，那未来我们所面临的安全威胁就非常恐怖了。”
56960发布于 2018-02-26
来自专栏DeepHub IMBA
instinct：一个基于置信度的 AI Agent 自学习记忆系统
2、合并会话结束时（或定期），运行 consolidate 触发自动晋升： instinct consolidate # Promoted to mature: 3 # Promoted to fix->test conf=8 [mature] sequence # pref:stdlib-first conf=12 [rule] preference # 2 { "command": "instinct", "args": ["serve"] } } } 配置文件里加上这几行，任意 MCP Agent 即可接入自学习记忆 promoted 字段对应成熟度等级：0 = raw，1 = mature，2 = rule。metadata 列存储任意 JSON，用于在不做 schema 迁移的前提下扩展功能。 store.observe("seq:test->fix->test", source="claude-code") store.observe("seq:test->fix->test") # 置信度现在 = 2
9510编辑于 2026-04-15
用STM32制作的315Mhz自学习遥控器
由于项目较大，必须进行拆分，进行逐步实现，大致分为：1、遥控通信协议的破解2、智能网关一代，通过继电器控制一路设备，完成自主控制以及网络外控的全部功能，含全套的UI界面控制3、系统集成，实现全屋灯具的控制第一步但是这样无法用单片机控制，于是，使用单片机针对协议的解码，编码就成了必要实现：硬件图纸：STM32单片机连接发射模块和接收模块，通过单片机解码和编码用于控制遥控设备；目前代码只支持EV1527的解码规范；所谓的自学习遥控器，其实就是先将信号解码并存储，然后再次发送出去就相当于自学习；前端采用SHMICTRL 神秘魔控串口屏，用于实现UI操作，本版本只制作了一个测试界面，完成主要功能，后期第二个版本我们才制作全功能的界面方便实现控制；前端和后端单片机采用串口进行通信，通信协议很简单，如下：当单片机收到遥控信号后，串口传出：app.work(0x00AEADE2);串口屏收到语句后立即会执行app控件的work方法，完成界面的刷新显示 H0max 6#define L0min 14#define L0max 20struct DefCode{ u32 data; //同步码之后的全部24bit的数据 u32 data2;
51600编辑于 2025-09-27
来自专栏机器之心
业界 | 英特尔推出神经形态测试芯片Loihi：可自学习
该芯片模拟了一百万个神经元和 2 亿 5600 万个突触，比起英特尔的第一代 Loihi 测试芯片的规模可大多了。TrueNorth 大概能模拟一只蜜蜂的大脑。
69680发布于 2018-05-10
来自专栏机器之心
前沿 | Science：自学习式人工智能可协助预测心脏病发作
选自Science 作者：Matthew Hutson 机器之心编译参与：蒋思源、黄小天近年来，将人工智能应用于医疗健康已经在蓬勃发展，机器之心也曾报道过医疗方面的文章，变革的开始，深度学习将如何改变医疗成像领域？和纽约客特稿 | 把癌症诊断交给机器，医疗服务会更好吗？《科学》的这篇文章注重于使用机器学习算法解决最难以预测的心脑血管疾病，希望能有助于心脑血管疾病的预防。即使医生有很多工具可以预测患者的健康，但是他们仍会告诉你这些工具远远不能应对人体的复杂性。而心脏病发作就特别难以预测。现在，科学家
905120发布于 2018-05-07
来自专栏素质云笔记
无监督学习︱GAN 在 NLP 中遇到瓶颈+稀疏编码自学习+对偶学习
[2]不一定是最好的方法，但是无疑证明了GAN是可以用在 sentence generation 这个问题上的。我之前也很关注 GAN 和 text 的结合，也可以算是利益相关吧。 http://www.machinedlearnings.com/2017/01/generating-text-via-adversarial-training.html . ---- 二、稀疏编码自学习 为了区别于这种半监督学习，我们称我们的任务为自学习。 自学习方法主要包括以下两个阶段：首先使用无标记数据来学习一种表达，然后将此种表达应用于标记的数据以及分类任务中。一句话说：一个英语句子A，首先用一个网络n1翻译成法语w，然后将翻译好法语w用另一个网络n2翻译成英语句子B。两个网络合在一起成为一个对偶网络。损失函数就是A与B之间的差值。文章说他们的学习方法是网络n1教网络n2，网络n2教网络n1，使用一种增强学习的方法。这个是可以的，但这个老师感觉是变化的哦。
1.5K20发布于 2019-05-26
来自专栏DeepHub IMBA
使用PyTorch实现简单的AlphaZero的算法（3）：神经网络架构和自学习
神经网络架构和训练、自学习、棋盘对称性、Playout Cap Randomization，结果可视化从我们之前的文章中，介绍了蒙特卡洛树搜索 (MCTS) 的工作原理以及如何使用它来获得给定棋盘状态的输出策略我们的神经网络结构是一个resnet结构-它有conv2d, batchnorm2d和relu层，dropout层和两个任务头。输出值的头有一个tanh激活函数，产生一个介于-1和+1之间的数字。输入通过的第一个块由conv2d、batchnorm2d和relu层组成由基本块(conv2d和batchnorm2d层)和relu层组成我们上图所示的残差块（resnet）五个resnet块组成了我们神经网络的中间块损失函数因为我们有2个任务头，所以损失函数需要包含自价值损失和策略损失 AlphaZero的损失函数如下: 价值损失:在游戏结束时使用价值分配获得的预测值和目标价值之间的均方损失。未来的发展方向 Chain Reaction的游戏有一个人类精心设计的启发式策略[2]。训练一个简单AlphaZero代理并试着让它与这样的策略竞争是很有趣的。
96130编辑于 2023-02-01
来自专栏五分钟学算法
【面试现场】如何设计可自学习的五子棋 AI ？
题目：如何设计可自学习的五子棋AI？ ? ? ? ? ? ? ? ? ? ? ? ? 【请教大神】小史回到学校，把面试的情况和计算机学院的吕老师说了一下。 ? ? ? ? ?
1.3K10发布于 2019-10-23
来自专栏苦逼的码农
【面试现场】如何设计可自学习的五子棋AI？
题目：如何设计可自学习的五子棋AI？ ? ? ? ? ? ? ? ? ? ? ? ? 【请教大神】小史回到学校，把面试的情况和计算机学院的吕老师说了一下。 ? ? ? ? ?
89030发布于 2018-12-25
来自专栏数据猿
滴滴出行场景中语音识别模型的自学习平台化实践
于是我们开发了语音识别模型自学习平台来缓解这个问题。语音识别简单来说分为声学模型，语言模型，解码器和发音词典。 2. 平台架构 ▍2.1 用户接口与数据输入 自学习平台为用户提供了Web界面和API接口两种操作方式，通过两种用户接口均可进行优化所需数据的输入更新、优化后模型的测试识别。一方面，为了满足非专业用户参与模型优化，自学习平台基于NodeJS/Antd开发了Web前端页面，为用户提供了简单、易用的模型自学习优化操作界面；另一方面，为了支持开发人员进行定制化的二次开发，平台基于这种自学习的训练方式通常能比单纯使用少量标注数据时，能够带对模型效果带来更大的提升。经过2～3个月模型迭代，滴滴夸ASR服务字准从80%提升到90%，效果显著。在D1定制车项目中，我们使用后处理服务和模型自训练服务对线上ASR服务进行个性化的定制及优化。
1.4K50发布于 2020-11-13
来自专栏计算机视觉工坊
一文带你了解基于视觉的机器人抓取自学习(Robot Learning)
受对象永久性概念的启发，研究人员提出了Grasp2Vec，一种用于获取物体表示的简单而高效的算法。 Grasp2Vec算法中尝试抓取任何东西都会获取以下几条信息——如果机器人抓住一个物体并将其抬起，则物体必须在抓取前进入场景。此外，若机器人知道它抓住的物体当前处于夹爪中，就会将其从场景中移除。通过对物体进行抓取，可以获得1）抓取前的场景图像；2）抓取后的场景图像；3）抓握物体本身的孤立视图。 2）目标物体本地化第二个属性是，可以组合场景空间映射和物体嵌入来本地化图像空间中的“查询对象”。将空间场景的特征图和查询对象的向量相乘，以找到两者之间“匹配”的所有像素。 2)语言接地，根据不同的外部环境，相同的语义也可能会以不同的方式接地。例如，厨房旁边的办公室指的是一个物理位置，但这个位置取决于建筑。
2.3K10发布于 2020-12-11

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

基于Bedrock的自学习生成式AI系统构建

【Cisco Packet Tracer】交换机的自学习算法

TCN: 端到端机器人自学习算法

OpenClaw自学习：AReaL 让智能体真正学会

【攻克Dota2】OpenAI自学习多智能体5v5团队战击败人类玩家

【攻陷Dota2】马斯克的OpenAI自学习机器人完虐人类最强玩家

机器人通过自学习实现逼真唇部同步

【自学习】- 怎么让对话机器人越来越强？

【面试现场】如何设计可自学习的五子棋AI？

未来趋势 | 自学习网络或许会在2018年替代传统的僵尸网络

instinct：一个基于置信度的 AI Agent 自学习记忆系统

用STM32制作的315Mhz自学习遥控器

业界 | 英特尔推出神经形态测试芯片Loihi：可自学习

前沿 | Science：自学习式人工智能可协助预测心脏病发作

无监督学习︱GAN 在 NLP 中遇到瓶颈+稀疏编码自学习+对偶学习

使用PyTorch实现简单的AlphaZero的算法（3）：神经网络架构和自学习

【面试现场】如何设计可自学习的五子棋 AI ？

【面试现场】如何设计可自学习的五子棋AI？

滴滴出行场景中语音识别模型的自学习平台化实践

一文带你了解基于视觉的机器人抓取自学习(Robot Learning)

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐