首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏菩提树下的杨过

    spring-ai 学习系列(8)-上下文记忆-多轮对话

    继续spring-ai学习之旅,大模型本身是无状态的,也就是每次请求对它来说,都是全新的,无记忆! \n\n不过,可能题目是在某种特定的上下文中,比如在数学问题中,或者可能题目本身存在一些陷阱。比如,有时候变量可能有不同的含义,或者在某些语言中,变量名可能与实际值不一致? } 三、使用示例 @RequestMapping(value = "/conversation-stream", produces = "text/html;charset=utf-8" 当前新问题,扔到聊天上下文中 chatMemory.add(conversationId, new UserMessage(prompt)); // 2.

    95710编辑于 2025-08-22
  • 来自专栏CreateAMind

    上下文多任务表示学习

    在这里,我们首先证明细树突分支非常适合实现前馈处理的上下文调制。这种特定于神经元的调制利用以稳定的前馈权重编码的先验知识来实现跨上下文的迁移学习。 在具有独立于上下文的前馈权重的生物物理学现实神经元模型网络中,我们证明了对细树突的调制输入可以使用 Hebb 误差调制学习规则解决线性不可分学习问题。 最后,我们证明了对表示是源自不同输入还是源自同一输入的不同上下文调制的局部预测会导致跨处理层的分层前馈权重的表示学习,以适应多种上下文。 虽然抽象模型中的上下文调制是通过 通过对分类损失的梯度下降,我们表明我们的方法可以转化为生物学上真实的尖峰模型,该模型配备了用于上下文突触的 Hebb 误差调制学习规则。 最后,我们展示了上下文调制表示通过为对比学习提供一种数据增强形式来促进跨处理层层次结构的自我监督学习,这种形式允许更深的处理层提取一般的高级特征,而无需错误 跨层反向传播。

    27510编辑于 2023-09-13
  • 来自专栏前端进阶之路

    JS学习系列 05 - 执行上下文

    根据顺序我们也可以看出来,想要理解作用域链,执行上下文是我们碰到的第一个坎。 这一章我们就来讨论一下到底什么是执行上下文。 1. 但是在逻辑上,我们可以将活动的执行上下文看成一个栈结构。栈底部永远是全局上下文(global context),而顶部就是当前活动的执行上下文。执行到当前代码时,上下文入栈,执行完毕后,上下文出栈。 可执行代码有几种 前面说到当引擎执行到可执行代码的时候,就会将当前上下文压入上下文栈中。那么可执行的代码又分为几种? ,但是却不会退出 只有每次 return 的时候,才会退出当前执行上下文,相应上下文会从栈中弹出,栈指针会自动移动位置。 如果有抛出的异常没有被截获的话,也有可能从一个或多个执行上下文中退出。当所有代码执行完以后,EC 中只会包含全局上下文(global context),当程序退出以后,全局上下文也会退出。

    48710编辑于 2024-02-01
  • 来自专栏前端进阶之路

    JS学习系列 05 - 执行上下文

    根据顺序我们也可以看出来,想要理解作用域链,执行上下文是我们碰到的第一个坎。 这一章我们就来讨论一下到底什么是执行上下文。 1. 但是在逻辑上,我们可以将活动的执行上下文看成一个栈结构。栈底部永远是全局上下文(global context),而顶部就是当前活动的执行上下文。执行到当前代码时,上下文入栈,执行完毕后,上下文出栈。 可执行代码有几种 前面说到当引擎执行到可执行代码的时候,就会将当前上下文压入上下文栈中。那么可执行的代码又分为几种? ,但是却不会退出 复制代码 只有每次 return 的时候,才会退出当前执行上下文,相应上下文会从栈中弹出,栈指针会自动移动位置。 如果有抛出的异常没有被截获的话,也有可能从一个或多个执行上下文中退出。当所有代码执行完以后,EC 中只会包含全局上下文(global context),当程序退出以后,全局上下文也会退出。

    1.3K30发布于 2018-10-31
  • 来自专栏相约机器人

    插图PIRL:不变上下文表示学习

    2019年底,使用对比学习的自我监督学习研究论文数量激增。在2019年12月,Misra等人。来自Facebook AI Research的研究人员提出了一种新的方法PIRL来学习图像表示。 动机 最近提出了许多有趣的自我监督学习方法来学习图像表示。其中许多使用这样的想法,即利用某种几何变换来建立前置任务以获取标签。 这包括几何旋转预测,上下文预测,拼图游戏,帧顺序识别,自动编码转换(AET)等。 ? 设置前置任务,以便学习变换图像的表示形式,以预测变换的某些属性。 迁移学习 训练模型后,然后投影头 F(。)f (。) 和G(。) 删除 g (。),并将ResNet-50编码器用于下游任务。 Chaudhary}, year = 2020, note = {\url{https://amitness.com/2020/03/illustrated-pirl}} } 参考文献 自主学习的不变表示形式学习

    95320发布于 2020-03-20
  • 来自专栏公众号PowerBI大师

    PowerPivot筛选上下文学习测试

    测试问题:我们利用本章节搭建好的数据模型制作数据表,请回答下面图表中9个所标出的数据值的筛选上下文是什么? 问题8 - 将年龄切片器选为30 ? 问题9 - 把行改为'区域负责人名单'[年龄],把'原材料'[咖啡种类]放入视觉级筛选器中,并选为卡布奇诺 ? 答案在下方找! 答案: ?

    56010发布于 2019-08-06
  • 来自专栏数据云团

    Django源码学习-12-ContextMixin 上下文

    Django源码学习-11-base.py ? django.views.generic.base.ContextMixin 属性 extra_context 指定一些简单上下文的便捷方式 as_view()。 TemplateView.as_view(extra_context={'title': 'Article Title'}) 方法 get_context_data(** kwargs) 返回表示模板上下文的字典 提供的关键字参数将构成返回的上下文。 Django中Mixin和View把原来的视图函数中的三个东西分开了,模板(TemplateResponseMixin),上下文数据(ContextMixin),负责将这些联系起来的(View)。

    71820发布于 2019-08-09
  • 来自专栏DeepHub IMBA

    预训练、微调和上下文学习

    这些模型通过预训练、微调和上下文学习的组合来学习。在本文中将深入研究这三种主要方法,了解它们之间的差异,并探讨它们如何有助于语言模型的学习过程。 上下文学习 上下文学习(In-Context Learning)也可以翻译成情境学习:是一种新兴的方法,它结合了预训练和微调,同时在训练过程中结合特定任务的指令或提示。 上下文提示:上下文学习包括提供明确的指令或提示,以指导模型在生成响应或输出时的行为。 强化学习或结构化反馈:上下文学习可以结合强化学习技术或结构化反馈来指导模型的响应。 上下文学习在训练过程中包含特定于任务的指令或提示,指导模型的行为并提高任务性能。 上下文学习包括训练语言模型,以根据特定的指令或提示生成与上下文相关的响应。 总结 语言模型通过预训练、微调和上下文学习的结合来学习。预训练捕获一般的语言理解,微调专门针对特定任务的模型,而上下文学习包含特定任务的指令以提高性能。

    87631编辑于 2023-08-30
  • 来自专栏技术墨客

    React学习(10)—— 高阶应用:上下文(Context)

    任意组件更新Context 某些时候需要在内部组件需要去更新Context的数据,其实我们仅仅需要向上下文增加一个回调即可,看下面的例子: //创建Context组件 const ThemeContext = React.createContext({ theme: 'dark', toggle: () => {}, //向上下文设定一个回调方法 }); function Button() { 16.x之后的Context使用起来比旧版本的简单明了太多,实现思路上还是学习了Redux等将状态抽取出来统一管理并触发更新的方式来实现,在使用时选择一种方式来实现就行。

    1.4K30发布于 2018-08-15
  • 来自专栏python成长之路

    (搬运以学习)flask 上下文的实现

    Request对象 flask通过_RequestContext将app与Request关联起来 总结 app = Flask(__name__)创建了application, 这个application对应的上下文 ,就是application context Flask每响应一个http请求,就会创建一个Request对象,这个request对象对应的上下文,就是request context

    48910发布于 2019-03-01
  • 来自专栏机器之心

    8 千个字学习知识,上下文要多长还是交给 Transformer 自己决定吧

    选自Arxiv 参与:思源 Facebook 这个新 Transformer 能建模 8K Token 的上下文,换到中文语言模型来说,只要有需要,它能利用前面 8 千个汉字预测当前汉字到底是啥。 Facebook 的研究者提出了一种新型自注意力机制,它能够自主学习最优的注意力长度是多少,也就是说到底需要关注多长的上下文。 研究者在字符级的语言模型上测试了这种方法,并发现它在 text8 和 enwiki8 两个数据集上获得了当前最优的效果。值得注意的是,在模型学习到的最优上下文长度中,最大的一个达到了 8k 字符。 Transformer-XL 先将某个定长序列学习到的表征缓存到内存里,然后在计算后一个定长序列时,它可以利用前面序列学习的结果。 此外,新层级能自己学习最优的上下文大小,因此神经网络中的每一个注意力层级都会关注它们需要的上下文,并从这些上下文收集信息。

    80810发布于 2019-07-18
  • 来自专栏python3

    python学习8

    (数字可以是整数) 提示:判断是否整数的方法,isdigit() 遍历所有的输入数据,判断是否在0-9的字符串范围内 方式1: #coding=utf-8 result = 0 count = 0 while result += int(s) if count ==3: break print(result) 方式2:先定义一个判断数字的函数 #encoding=utf-8 break print(result1) 习题14:用嵌套列表的方式,遍历输出一个矩阵 方式1: l = [ [1,2,3], [4,5,6], [7,8,9 [i][j],end = " ") print() 习题15:嵌套列表的正、反对角线之和 正对角线之和 l = [ [1,2,3], [4,5,6], [7,8,9

    38210发布于 2020-01-14
  • 来自专栏CreateAMind

    Atlas: 在测试时学习最优记忆上下文

    然而,这种设计可能因为记忆单个令牌而错过上下文。为此,在这项工作中,我们提出一个长期神经记忆模块,它度量局部(或全局)上下文窗口的惊奇度,这意味着它在测试时学习如何记忆(令牌)上下文。 因此,该序列模型是一个具有两个优化层级的元上下文学习者: 我们的术语体系建立在此框架之上。 3 在测试时学习记忆上下文 长期联想记忆对人类学习至关重要(Terry 2017),它启发了许多人工神经架构(Behrouz, Razaviyayn 等人,2025;Behrouz, Zhong 等人, 模型规模 图 8 给出了 Atlas 与 OmegaNet 随参数规模变化的扩展曲线,并与基线对比。两模型随规模增大均呈现良好的扩展性,在各规模下困惑度均低于基线。 上下文长度 图 8 同时展示了 Atlas 与 OmegaNet 随训练上下文长度的扩展曲线。凭借高记忆容量,两模型在上下文长度增加时均能良好扩展。

    13610编辑于 2026-03-11
  • 来自专栏圣杰的专栏

    DDD理论学习系列(3)-- 限界上下文

    引言 限界上下文可以拆分为两个词,限界和上下文。 限界:是指一个界限,具体的某一个范围。 上下文:个人理解就是语境。 比如我们常说的段子: “我想静静。” 可见上下文语境很重要。 这个例子只是个开胃菜,我们接着往下看。 2. 案例分析 整个应用程序之内的一个概念性边界。 边界之内的每种领域术语、词组或句子--也即通用语言,都有确定的上下文含义。 在DDD的思想下,当划分子域之后,每个子域都对应有各自的上下文。在销售子域和商品子域所在的上下文语境中,商品就是商品,无二义性。 限界上下文的命名 限界上下文只是一个统一的命名,在我们划分子域后,每个子域一般对应一个上下文,也可以对应多个上下文。但如果子域对应多个上下文的时候,就要考虑一下是不是子域能否继续划分。 命名方式很简单,领域名+上下文。 比如我们的销售子域对应销售上下文,物流子域对应物流上下文。 4. 总结 通过我们上面的举例分析,限界上下文也并不是一个高深的概念。

    1.3K100发布于 2018-01-11
  • 来自专栏coding for love

    JS入门难点解析8-作用域,作用域链,执行上下文,执行上下文栈等分析

    (注1:如果有问题欢迎留言探讨,一起学习!转载请注明出处,喜欢可以点个赞哦!) (注2:更多内容请查看我的目录。) 1. 简介 JS入门难点系列到此,我们将进行一个阶段性的总结。 变量对象:变量对象是与执行上下文相关的数据作用域,存储了在执行上下文中定义的变量和函数声明。全局上下文中的变量对象就是全局对象。 ,全局上下文被压入执行上下文栈。 ,f 函数执行上下文被压入执行上下文栈。 f 函数上下文从执行上下文栈中弹出。

    90610发布于 2018-08-27
  • 来自专栏架构进阶之路

    并发多线程学习(二)上下文切换

    上下文切换(有时也称做进程切换或任务切换)是指 CPU 从一个进程(或线程)切换到另一个进程(或线程)。上下文是指某一时间点 CPU 寄存器和程序计数器的内容。 2.在内存中检索下一个线程B的上下文并将其在 CPU 的寄存器中恢复,执行B线程。 3.当B执行完,根据程序计数器中指向的位置恢复线程A。 CPU通过为每个线程分配CPU时间片来实现多线程机制。 所以任务从保存到再加载的过程就是一次上下文切换。 上下文切换通常是计算密集型的,意味着此操作会消耗大量的 CPU 时间,故线程也不是越多越好。 如何减少系统中上下文切换次数,是提升多线程性能的一个重点课题。

    49430编辑于 2023-02-28
  • 来自专栏机器学习算法工程师

    《机器学习》笔记-集成学习8

    对于自己,经历了一段时间的系统学习(参考《机器学习/深度学习入门资料汇总》),现在计划重新阅读《机器学习》[周志华]和《深度学习》[Goodfellow et al]这两本书,并在阅读的过程中进行记录和总结 这两本是机器学习和深度学习的入门经典。 记录笔记,一方面,是对自己先前学习过程的总结和补充。 另一方面,相信这个系列学习过程的记录,也能为像我一样入门机器学习和深度学习同学作为学习参考。 同质集成中的个体学习器亦称为”基学习器“(base learning),相应的学习算法称为”基学习算法“(base learning algorithm)。 个体学习器要有一定的“准确性”,即学习器不能太坏,而且要有“多样性”(diversity),即学习器之间有差异。事实上,如何产生并结合“好而不同”的个体学习器,恰是集成学习研究的核心。

    83760发布于 2018-03-30
  • 来自专栏MiningAlgorithms

    机器学习8:集成学习--LightGBM

    LightGBM是一个梯度Boosting框架,使用基于决策树的学习算法。 它可以说是分布式的,高效的,有以下优势: 1)更快的训练效率 2)低内存使用 3)更高的准确率 4)支持并行化学习 5)可以处理大规模数据 与常见的机器学习算法对比,速度是非常快。 而对于 Histogram 算法,则只需要(#data #features * 1Bytes)的内存消耗,仅为pre-sorted算法的1/8。 无法加速split的过程,该过程复杂度为O(#data),当数据量大的时候效率不高 2),需要广播划分的结果(左右子树的instance indices),1条数据1bit的话,大约需要花费O(#data/8) 虽然CatBoost有多个参数可以调优,但它还包含一些参数,比如树的数量、学习速率、正则化、树的深度等等。

    2.2K20发布于 2019-08-08
  • 来自专栏自然语言处理(NLP)论文速递

    【华盛顿大学&&Facebook&&含源码】上下文学习(Meta Learning)--学习如何学习

    在该文章中,作者通过引入 MetaICL:上下文学习的元训练来解决上面遇到的问题。MetaICL在大量任务上调整预先训练的语言模型,以学习如何在上下文学习,并在严格新的未知任务上进行评估。 在这个数据设置中简单地微调模型直接导致更好的上下文学习——模型学会从给定的示例中恢复任务的语义,就像在测试时对新任务的上下文学习必须做的那样。 文章还表明,MetaICL接近(有时甚至超过)在目标任务训练数据上进行完全微调的模型的性能,并优于具有近8倍参数的更大的模型。 这模拟了推理时的上下文学习,其中前k个例子作为训练例子,最后(k + 1)个例子作为测试例子。 2、MetaICL通常接近(有时甚至超过)通过对目标数据集进行监督微调训练的模型的性能,并且与使用8x参数的模型一样出色。

    85920发布于 2021-11-26
  • 来自专栏深度学习自然语言处理

    陈丹琦团队最新力作:上下文学习上下文“学到”了什么?

    GPT-3的论文Language Models are Few-Shot Learners中提出,这种超能力意味着大模型能够仅从上下文中的例子“学习”执行任务而不进行任何参数更新。 那么,上下文学习究竟在上下文“学到”了什么? 这个问题尚无定论,一派研究假设预训练期间LLMs就已经隐含地学习了下游应用所需的任务,而上下文演示只是提供信息、使模型识别所需任务而已。 另一派则表示,Transformer-based模型可以执行隐式梯度下降以更新“内部模型”,并且上下文学习与显式微调之间具有相似性!这个脑洞有点神奇了! 总体趋势上,GOLD在所有模型族和演示数量方面始终表现最好,这是因为GOLD设置为模型提供了所有信息;RANDOM曲线不会随着模型大小或演示数量而增加,保持基本平稳;在模型尺寸较小或演示数量较少时(K = 8) 也就是说,从上下文示例中识别任务(TR)并不会随着模型大小或示例数量的增加而急剧扩展。 相比之下,任务学习(TL)受规模的影响,并且随着更多演示而进一步改善。

    94620编辑于 2023-08-22
领券