首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏算法进阶

    主动学习概述(ActiveLearning)

    一、前言 本文整理了我对主动学习的理解和最新研究的感悟,主要目的是供大家参考、讨论,一起学习和交流主动学习的技术。 因为主动学习的过程中存在人的标注,所以主动学习又属于 Human-in-the-Loop Machine Learning 的一种。 主动学习为什么是有用的?下面通过一个直观的小例子让大家感受一下。 难以迁移:主动学习是一种数据选择策略,那么实际应用中必然需求更通用、泛化性更好的主动学习策略。 8.2 主动学习与半监督学习结合 由于半监督学习展示出了优异的性能,在标签不足的情况下,如果能将主动学习与半监督学习结合,将会取得更优异的性能。 8.5 主动学习与对比学习结合 对比学习最近势头比较猛,最近也有主动学习与对比学习结合解决对比学习的问题,大家可以欣赏一下。

    79830编辑于 2023-11-16
  • 来自专栏FunTester

    视频是主动学习吗?

    在前段时间的学习过程里,我不禁问了自己一个问题:视频学习主动学习还是被动学习? 先让我们看一下两者的区别。 主动学习 主动学习是一种学习者重度参与的学习方式,是一种以学习者为中心的学习方式。 学习者需要以探索者的角色进入学习状态,需要自己的思考、判断,方能融会贯通。 被动学习 被动学习是传统的学习方法,学生很少参与。环境通常以教授者为中心。学者需要通过被动地接受知识。 从学习效率讲,自然是主动学习效率最高。所以我才会有自己的疑问。同样的,还有一个伴生的问题:看视频教程是接受信息还是接受知识? 个人体验 主动学习是需要自己调动自己的注意力,放在学习上,或者源于自身的兴趣,总而言之是需要投入较多精力和注意力的。 主动学习是以我为中心的方式,学习的进度自然不会像视频时间流速一样,肯定是起伏的,而且每个人的起伏都不一样。能够真正内化成知识的内容会更多,因为即学即用,信息经过加工之后,更容易掌握。

    1.2K20编辑于 2022-12-09
  • 来自专栏机器学习算法与Python学习

    Machine Learning -- 主动学习(AL)

    主动学习已成为模式识别、机器学习和数据挖掘领域的研究热点问题。介绍了主动学习的基本思想,一些最新研究成果及其算法分析,并提出和分析了有待进一步研究的问题。 为了尽可能地减小训练集及标注成本,在机器学习领域中,提出主动学习方法,优化分类模型。 2 主动学习算法 2.1 基于委员会的主动学习算法 主动学习方法选择一定数量的分类模型,构成分类委员会。利用初始训练集训练委员会中的每个模型,并将训练完成的模型用于分类未标记样本池中的样本。 2.3 基于后验概率的主动学习算法 在后验概率主动学习算法中,后验概率反映出样本类别的确信度。该算法根据预测所得样本后验概率值的大小,对候选样本集进行排序。 3 主动学习算法分析 主动学习作为一种新的机器学习方法,其主要目标是有效地发现训练数据集中高信息量的样本,并高效地训练模型。

    3.2K50发布于 2018-04-04
  • 来自专栏DeepHub IMBA

    细胞图像数据的主动学习

    为了解决这个问题,机器学习领域出现了一个叫做主动学习的领域。主动学习是机器学习中的一种方法,它提供了一个框架,根据模型已经看到的标记数据对未标记的数据样本进行优先排序。 使用CellProfiler提取细胞特征——展示如何从生物细胞照片图像中提取形态学特征,以用作机器学习模型的特征。 使用主动学习——展示一个模拟使用主动学习和不使用主动学习的对比实验。 主动学习 我们现在已经有了训练需要的搜有数据,现在可以开始试验使用主动学习策略是否可以通过更少的数据标记获得更高的准确性。 该框架可以轻松地使用不同的主动学习策略。他们的文档也很清晰,所以建议从它开始你的一个主动学习项目。 总结 本文展示了将主动学习用于细胞成像任务的好处。主动学习是机器学习中的一组方法,可根据其标签对模型性能的影响来优先考虑未标记的数据示例的解决方案。

    75320编辑于 2022-11-11
  • 来自专栏数据派THU

    细胞图像数据的主动学习

    为了解决这个问题,机器学习领域出现了一个叫做主动学习的领域。主动学习是机器学习中的一种方法,它提供了一个框架,根据模型已经看到的标记数据对未标记的数据样本进行优先排序。 使用CellProfiler提取细胞特征——展示如何从生物细胞照片图像中提取形态学特征,以用作机器学习模型的特征。 使用主动学习——展示一个模拟使用主动学习和不使用主动学习的对比实验。 主动学习 我们现在已经有了训练需要的搜有数据,现在可以开始试验使用主动学习策略是否可以通过更少的数据标记获得更高的准确性。 该框架可以轻松地使用不同的主动学习策略。他们的文档也很清晰,所以建议从它开始你的一个主动学习项目。 总结 本文展示了将主动学习用于细胞成像任务的好处。主动学习是机器学习中的一组方法,可根据其标签对模型性能的影响来优先考虑未标记的数据示例的解决方案。

    53430编辑于 2022-08-29
  • 来自专栏数据派THU

    ICLR 2022 | 图与主动学习:软标签情况下如何设计图上主动学习策略?

    来源:PKUDAIR本文约2700字,建议阅读5分钟本文介绍了在图神经网络上主动学习的软标签方法。 该论文提出了图神经网络上主动学习的软标签方法,有两个关键创新点:(1)领域专家只判断预测标签的正确性(二元问题)而不是识别确切的类别(多类问题)的轻松查询;(2)提出了轻松查询下软标签主动学习的信息增益传播衡量标准 如何设计在软标签下的图主动学习策略是该论文要解决的问题。 ▲ 图1. 2.2 主动学习(AL) 主动学习通过更好的样本点选择来提高模型的效果和效率。 IGP方法 IGP 是第一个基于图的考虑了轻松查询和软标签的主动学习框架,可以在任何图神经网络模型上运行。

    69720编辑于 2022-06-07
  • 来自专栏机器学习与生成对抗网络

    主动学习(Active Learning)概述及最新研究

    、讨论,一起学习和交流主动学习的技术。 因为主动学习的过程中存在人的标注,所以主动学习又属于 Human-in-the-Loop Machine Learning 的一种。 主动学习为什么是有用的? 难以迁移:主动学习是一种数据选择策略,那么实际应用中必然需求更通用、泛化性更好的主动学习策略。 8.2 主动学习与半监督学习结合 由于半监督学习展示出了优异的性能,在标签不足的情况下,如果能将主动学习与半监督学习结合,将会取得更优异的性能。 8.5 主动学习与对比学习结合 对比学习最近势头比较猛,最近也有主动学习与对比学习结合解决对比学习的问题,大家可以欣赏一下。

    1.5K40编辑于 2022-02-28
  • 主动学习驱动的Prodigy新实体训练

    视频概述本视频演示了如何使用Prodigy(一款由spaCy开发团队打造的新一代、基于主动学习的标注工具)来训练一个针对新概念的短语识别系统。 核心命令是 prodigy ner.teach,它启动了一个主动学习循环:初始模型:从一个初始的空白模型或预训练模型开始。 智能建议:Prodigy通过主动学习算法,从无标注数据中挑选出最具信息量的样本供标注。在线学习:标注者的每一次标注都会立即反馈给模型,模型在线更新,从而在后续的样本选择中表现得更好。 用户可以直观地看到模型在训练集上的损失下降以及关键指标(如精确率、召回率)的变化趋势,这有助于判断模型是否在有效学习。 关键技术与资源Prodigy: 一个高效的主动学习标注工具。spaCy: 用于高级自然语言处理的Python库。主动学习: 一种机器学习策略,模型主动选择最有价值的数据让人类标注,从而最大化标注效率。

    8510编辑于 2026-03-09
  • 来自专栏数据派THU

    主动学习(Active Learning)概述及最新研究

    ©作者 | 白帆 学校 | 香港中文大学研究方向 | 机器人、医疗图像、主动学习 一、前言 我将我对主动学习的理解和最新研究的感悟都整理为这篇文章,主要目的是供大家参考、讨论,一起学习和交流主动学习的技术 因为主动学习的过程中存在人的标注,所以主动学习又属于 Human-in-the-Loop Machine Learning 的一种。 主动学习为什么是有用的? 难以迁移:主动学习是一种数据选择策略,那么实际应用中必然需求更通用、泛化性更好的主动学习策略。 8.2 主动学习与半监督学习结合 由于半监督学习展示出了优异的性能,在标签不足的情况下,如果能将主动学习与半监督学习结合,将会取得更优异的性能。 8.5 主动学习与对比学习结合 对比学习最近势头比较猛,最近也有主动学习与对比学习结合解决对比学习的问题,大家可以欣赏一下。

    2.9K40编辑于 2022-03-04
  • 来自专栏润风拂过存甘霖

    更少标注的机器学习方法——主动学习(python示例)

    我们可以使用著名的mnist数据集来训练这样的机器学习模型。数字示例如下: ? 非也,我们还有主动学习主动学习 何谓主动学习?这里我采用一种通俗的讲法: 想象你面对百万大军,要想打败他们未必需要将其全部剿灭,有时只需要斩其上将首级即可。 主动学习做的,就是帮助我们找到那个“上将”,解决重点问题,达到事半功倍的效果。看下面的图: ? 左图中红绿代表两种数据。现在我们只能标注其中有限个数据来训练分类器。 而右图就是主动学习方法找到的标注点,因为这些点几乎构成了完美分界线的边界,所以使用与中图同样的样本数,它能够取得90%左右的准确率! 那么我们怎么找到这些关键的点呢? 不过进行多次实验也可以看到,两种主动学习方法利用同样多的样本,却能够达到接近90%的准确率。确实比RS更胜一筹,我们可以使用这个技术来降低达到一定准确度所需的标注量。

    1.4K10发布于 2019-10-30
  • 来自专栏DeepHub IMBA

    论文推荐:当自监督与遇到主动学习

    Reducing Label Effort: Self-Supervised meets Active Learning这篇论文将主动学习和自监督训练结合,减少了标签的依赖并取得了很好的效果。 自监督学习 (SimSiam) + 主动学习 (AL) 通过自监督的预训练强化主动学习框架图 该框架包括3个阶段: 在整个数据集上训练自监督训练。 在主动学习方面,考虑了几种获不同的方法,包括Informativeness[10]和Representativeness[42,40]的方法。 从主动学习的角度来看,当标注数据小于1%时,随机抽样优于AL。 上图为CIFAR-100在低预算的情况下,自监督的预训练大大减少了所需的标签数量。 两个实验结果都表明:在主动学习框架中,低预算的情况下SimSiam帮助很大。在高预算下,从头训练和SimSiam之间的性能差距缩小了。

    51010编辑于 2022-11-11
  • 来自专栏AI SPPECH

    96_主动学习提示:用户反馈驱动优化

    一、主动学习提示的基础理论 1.1 主动学习的基本概念 主动学习是一种机器学习范式,其核心特点是模型能够主动选择最有价值的未标记数据进行标注,从而以最小的标注成本获得最大的性能提升。 将主动学习的思想应用于提示工程,就产生了主动学习提示这一新的研究方向。 主动学习提示的基本工作流程包括: 初始提示设计:设计一个初始的提示模板。 候选提示生成:基于初始提示,生成多个候选提示变体。 二、主动学习提示的核心技术 2.1 提示变体生成技术 提示变体生成是主动学习提示系统的第一步,其质量直接影响后续的优化效果。 三、主动学习提示的实施策略 3.1 系统架构设计 主动学习提示系统的架构设计是实施过程中的关键环节。 七、主动学习提示的未来发展趋势 随着人工智能技术的不断发展,主动学习提示作为一种新兴的技术方向,也在快速演进。

    30910编辑于 2025-11-16
  • 来自专栏生信技能树

    系统学习主动探索,是最舒适的入门学习方式!

    本期分享的内容不是课堂上讲的,而是给了踮一踮脚能做出来的超纲练习题,启发学员主动学习,而不是一味等待投喂。 系统学习主动探索,是最舒适的入门学习方式!

    61610编辑于 2022-06-27
  • 来自专栏DrugOne

    主动学习预测结合自由能进行分子优化

    在这项工作中,作者利用自动机器学习(Automated machine learning, AutoML)和主动学习(Active Learning, AL)的技术开发了一个高效的自动化工作流程,只需要数百次 2 模型 图2 模型流程 2.1 主动学习周期 两个主要的计算模块: (1)AutoML模块。负责根据第二个计算模块提供的标记数据开发ML模型。 (2)TI RBFE模块。 2.2 自动化机器学习模块 使用基于先验选择的ML方法(如神经网络)和分子表征(如配体-蛋白质相互作用指纹)构建的ML模型可能会导致大量的模型偏差和样本选择偏差。 4 总结 在这项工作中,作者提出结合自动机器学习(Automated machine learning, AutoML)和主动学习(Active Learning, AL)的方法对配体进行RBFE计算,

    55220编辑于 2022-11-28
  • 来自专栏信安之路

    信安技术学习还是要化被动为主动

    ,平时看不到他在主动学习,另一种是普罗大众,除了认证听老师上课,还利用课余时间进行复习和练习。 大多数的人都因为没有主动学习而被高考成绩限制,无法接受更高等的教育,也就是说大部分的人并非天才,然后主动和被动学习就是普罗大众之间的区别,只有主动学习才能与他人拉开差距,我相信,没有人会认为自己主动了, 对于关注信安之路的所有朋友而言,我认为都是想要了解信息安全这个行业,想要在信息安全这个行业扎根,一定是有所求的,所以对于为什么选择信息安全这个行业,这里就不再讨论,今天就来聊聊信息安全技术的主动和被动学习的方式 ,该如何选择适合自己的学习方式。 信息安全行业随着互联网的发展在不断变化,没有一个拥抱变化,快速学习的能力,是无法跟上时代,迟早是会被淘汰的,所以作为信安从业者,更要化被动为主动

    56640发布于 2021-03-25
  • 语料库构建与主动学习标注工具解析

    开发者可自定义输入数据流并设计简易标注界面,其核心能力包括:将复杂标注决策分解为系列二进制选择与某自然语言处理库实现无缝集成在主动学习框架中支持实时模型更新策略通过配方脚本(GitHub开源)实现工作流定制该方案通过动态调整模型训练流程

    15010编辑于 2025-09-19
  • 来自专栏CNNer

    开源 | 利用情境多样性进行主动学习

    通过使用主动学习(AL)技术可以缓解这个问题,这种技术在给定的注释预算下,允许选择在微调产生的最大精度的数据子集。 利用这一观察结果,结合两个AL框架提出了CD度量:基于核心集的策略和基于强化学习的策略,用于主动帧选择。我们在语义分割、目标检测和图像分类的基准数据集上进行了广泛的经验评估,主动学习的结果SOTA。 消融研究证明了使用情境多样性进行主动学习具有明显优势。 主要框架及实验结果 ? ? ? ? ? ? ? 声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请联系删除。

    76910发布于 2020-10-21
  • 来自专栏智能生信

    主动学习以有效分析高通量纳米孔数据

    最近,许多研究开始使用机器学习技术来分析纳米孔产生的庞大数据。不幸的是,这项技术的成功归功于广泛的标记数据,而这些数据往往会产生巨大的劳动力成本。 为了实现上述目标,作者引入了主动学习,通过选择需要标记的样本来减轻巨大的劳动力成本。 这项工作将几种先进的主动学习技术应用于纳米孔数据,包括 RNA 分类数据集 (RNA-CD) 和 Oxford Nanopore Technologies 条形码数据集 (ONT-BD)。 由于纳米孔数据的复杂性(带有噪声序列),引入偏置约束来改进主动学习中的样本选择策略。 至关重要的是,实验表明,主动学习技术可以帮助专家标记样本,并显着降低标记成本。主动学习可以大大减少大容量纳米孔数据难以标记的困境。作者希望主动学习可以应用于纳米孔序列分析中的其他问题。

    37020编辑于 2022-12-29
  • 来自专栏CreateAMind

    建模结构学习主动推理方法——以概念学习为例

    以概念学习为例,我们在主动推理框架及其伴随的神经过程理论中引入了一种用于建模结构学习的新方法,特别是状态空间扩展和缩减。我们的目标是展示其在该领域促进新的主动推理研究的潜力。 尽管刻意简单,但这些模拟结果突出了主动推理可以为开发结构学习的神经计算模型提供有用资源的方式。 它们为未来的主动推理研究如何将这种方法应用于现实世界的结构学习问题并评估它可能提供的附加效用提供了一个模板。 当与主动推理框架的其他方面整合时,这意味着知觉推理、主动学习和结构学习都是同一原则的表达;即在三个不同的时间尺度上最小化变化的自由能。 (需要模型扩展),以及(2)使用模型简化来删除主动学习的状态-结果映射,这些映射对于解释过去的观察结果是不必要的。

    74720编辑于 2022-11-22
  • 来自专栏NLP/KG

    主动学习(Active Learning)简介综述汇总以及主流技术方案

    这里注意横轴是标注数据的数目,对于主动学习而言,相同的标注数据下,主动学习的样本数>监督学习,这个对比主要是为了说明两者对于训练样本的使用效率不同:主动学习训练使用的样本都是经过算法筛选出来对于模型训练有帮助的数据 如上所述,主动学习的“主动”,指的是主动提出标注请求,也就是说,还是需要一个外在的能够对其请求进行标注的实体(通常就是相关领域人员),即主动学习是交互进行的。 3.1 基于不确定性的主动学习方法 基于不确定性的主动学习方法将最小化条件熵作为寻找判定函数的依据。 coreset认为主动学习目标就是缩小核心集误差,即主动学习选出的样本损失与全体样本损失之间的差别。 我们在主动学习挑选新样本时,并不知道样本的标签,也就没法直接求核心集损失。 整体来说,基于池的主动学习用标注样本来训练任务模型,合成的主动学习标注合成的样本来训练任务模型。

    10.2K32编辑于 2022-12-21
领券