首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏科研菌

    28个样本,4种不同分析方法的比较发了9分?

    图1:HLA分型表现 移除28例样本中低表达的两例HLA基因的样本后,从RNA-seq数据中提取4位分辨率的 HLA分型的OptiType的准确性提高为98.72%,表明HLA基因的低表达可能降低 图2:测序深度对准确性的影响 3、不同样本类型和计算机模拟后的准确性比较 将来自肿瘤组织和对照PBMC样本的WES数据的HLA 分型准确性比较(图a ),发现正常PBMC样本的准确性结果大多高于肿瘤组织 因此,建议最好使用正常样本进行HLA分型。 在计算机模拟中(图b),随着读取HLA基因区域的减少,OptiType的分型错误增加。 虽然出现分型错误,但正常样本HLA 分型的准确性仍高于肿瘤组织。 ? 图3:不同样本类型和计算机模拟后的准确性比较 小结 本篇文章的研究思路和过程较为简单,作者对28例癌症患者进行FFPE肿瘤组织和匹配正常样本的全外显子测序和肿瘤样本的RNA测序。

    1.7K30发布于 2020-11-23
  • 来自专栏AI科技评论

    9行代码提高少样本学习泛化能力 | ICLR2021 Oral

    在本文中我们尝试从数据分布估计的角度去缓解少样本学习中的过拟合现象。我们尝试利用一个样本去估计该类别的整体数据分布,如果该分布估计足够准确,也许可以弥合少样本学习和传统多样本学习的差距。 ? 然后在进行少样本分类时我们利用base class的分布先验去修正少样本类别的数据分布: ? ? 得到修正后的少样本类别的分布 ? 和 ? 后,我们便可以从修正后的分布中直接采样: ? 代码已开源,核心代码只有9行(evaluate_DC.py中的第10-19行)。 我们的方法搭配最简单的线性分类器便可以达到非常高的1-shot分类性能。实验结果如图: ? ? ? 4 总结 在本工作中我们思考了少样本学习和多样本学习的核心差距,并提出通过分布矫正(估计)的方式弥合这种差距。 在该工作的后续期刊拓展版本中我们从generalization error bound的角度为‘基于数据分布估计的少样本学习’这一类方法建立了理论框架,并证明了当数据分布足够准确时,少样本学习和多样本学习的泛化误差等价

    97420发布于 2021-01-25
  • 来自专栏MyBlog

    利用误分类样本来防御对抗样本

    作者首先讲正确分类的样本集合记做 ? ,误分类的样本集合记做 ? 。统一使用对抗训练进行防御,分别只对 ? 和 ? 进行扰动,以及两者均进行扰动,比较这三者的对抗鲁棒性。 这里的扰动,指的就是生成对应的对抗样本加入到训练集合中 对抗鲁棒性指的是,在对抗样本作为输入时,模型的精度 ? 首先作者改变了扰动的方法,将PGD切换成FGSM,分别单独作用于两个样本集合中,从最终的结果上看,仍然是对误分类样本扰动对鲁棒性的提升比较明显,如下图所示: ? (反之,如果模型对于对抗样本和正常样本的输出分布类似,鲁棒性越高?) 然后我们看蓝色虚线(BCE[以扰动样本作为输入]+KL散度)和绿色线(BCE[以普通样本作为输入]+KL散度),说明基础的精度那一项的输入还是扰动样本要优。 KL项的系数 ?

    86610发布于 2021-03-16
  • 来自专栏DeepHub IMBA

    样本和少样本学习

    而·少样本学习的思想是通过比较数据来学习区分类,这样模型使用的数据更少,并且比经典模型表现得更好。在少样本学习中通常会使用支持集(support set)代替训练集。 少样本学习是一种元学习技术。 K-Way N-Shot支持集:支持集具有K类,每个类都有N样本。N-Shot意味着为每个类提供的样本数。如果每个另类都有更多样本,模型可以学习的更好。 孪生网络 孪生网络使用正面和负样本进行分类。 通过比较这样就得到了我们的预测分类 单样本学习 one-shot learning是少样本学习的一种特殊情况,即从一个样本学习并再次识别物体。 从监督到零样本的模式识别 我们以前在经典的分类模型中的做法是这样的: 但当出现新的类别时,该怎么做呢?关键是零样本学习。零样本学习的主要思想是将类别嵌入为向量。

    1.3K20编辑于 2022-11-11
  • 来自专栏生信技能树

    9个组织的37个样本的大豆的长非编码RNA的鉴定

    B Singh , Prem L Bhalla 机构:墨尔本大学 兽医和农业科学学院 植物分子生物学和生物技术实验室 DOI: 10.1104/pp.17.01657 摘要:在这项研究中,来自代表9个组织的 37个样本的超过10亿RNA-seq读取对被用来发现6018个lincRNA基因座。 然后 还使用了9样本(4个来自叶片组织,5个来自新梢顶端分生组织)。 总表达量和唯一表达量最高的样本是花蕾。 ? 每个点代表一个基因(红色,lincRNA;蓝色,蛋白质编码基因),并标记有峰值表达的样本(y轴代表实际表达值)。

    99940发布于 2021-07-06
  • 来自专栏我爱计算机视觉

    9行代码提高少样本学习泛化能力! ICLR2021 Oral,代码已开源

    标题:Free Lunch for Few-shot Learning: Distribution Calibration 简介 从极少量样本中学习到泛化性能良好的模型是很困难的,因为极少的样本形成的数据分布往往与真实数据分布相差较大 在本文中我们尝试从数据分布估计的角度去缓解少样本学习中的过拟合现象。我们尝试利用一个样本去估计该类别的整体数据分布,如果该分布估计足够准确,也许可以弥合少样本学习和传统多样本学习的差距。 ? 代码已开源,核心代码只有9行(evaluate_DC.py中的第10-19行)。 我们的方法搭配最简单的线性分类器便可以达到非常高的1-shot分类性能。实验结果如图: ? ? ? 总结 在本工作中我们思考了少样本学习和多样本学习的核心差距,并提出通过分布矫正(估计)的方式弥合这种差距。 在该工作的后续期刊拓展版本中我们从generalization error bound的角度为‘基于数据分布估计的少样本学习’这一类方法建立了理论框架,并证明了当数据分布足够准确时,少样本学习和多样本学习的泛化误差等价

    52520发布于 2021-01-25
  • 来自专栏生信喵实验柴

    临床样本检测

    metagenomics on a nanopore)为封面,刊登了英国东安格利亚大学 Justin O'Grady 博士及合作者共同发布的首个使用纳米孔技术的快速、经济的宏基因组测序方法,直接从患者呼吸道样本中准确快速地识别细菌病原体 据悉,为了能够准确、快速地识别细菌病原体,研究团队开发了一种能够从临床样本中去除多达 99.99%的宿主核酸的流程,并在便携式 MinION 测序仪上开展了实时的检测和分析。 二、下载数据 https://www.ebi.ac.uk/ena/browser/view/PRJEB30781 三、病原微生物鉴定 3.1单个样本 过滤宿主序列 #数据路径 #/data

    78120编辑于 2023-02-24
  • 来自专栏集智书童

    YOLOv9开源 | 架构图&模块改进&正负样本匹配&损失函数解读,5分钟即可理解YOLOv9

    YOLOv7原作者出手,YOLOv9的性能依旧时一枝独秀: YOLOv9架构图 YOLOv9的整体架构图如下(根据YOLOv9.yaml绘制): YOLOv9改进点一览 YOLOv9从可逆函数角度理论上分析了现有的 CNN架构,基于这种分析,YOLOv9作者还设计了PGI和辅助可逆分支,并取得了优秀的结果; YOLOv9用到的PGI解决了深度监督只能用于极深的神经网络架构的问题,因此使得新的轻量级架构才更适合落地; YOLOv9中设计的GELAN仅使用传统卷积,就能实现比基于最先进技术的深度可分卷积设计更高的参数使用率,同时展现出轻量级、快速和精确的巨大优势; 基于所提出的PGI和GELAN,YOLOv9在MS GELAN模块 YOLOv9提出了新网络架构——GELAN。 损失函数与样本匹配 通过上图代码可以看到,样本匹配依旧使用的是TaskAlign样本匹配。

    11.9K90编辑于 2024-02-23
  • 来自专栏python3

    Python练手,样本

    import pandas as pd def getEmpDataFrame(num):          '''创建一份可复用的数据,有一定的随机性和真实性'''          #员工编号     emp = [''] * num     lenNum = len(str(num))     for i in range(num):         emp[i] = str(i+1).zfill(lenNum)              #性别:男多女少     sex = [1] * int(r

    57030发布于 2020-01-13
  • 来自专栏SimpleAI

    样本,事半功倍:使用样本设计工程 (SDE) 来构造更好的大模型下游微调样本

    关注我公众号的朋友们,抱歉了,转眼本号已经断更了9个月了,这大半年一直很忙,实习、写博士论文,更重要的是我角色转变了——当爹了!所以得忙着照顾老婆孩子哈哈,实在没空没心思提笔写文章了。 提示工程(Prompt Engineering)已经成为提升大模型的零样本、少样本推理能力的基本操作。然而,在大模型实际落地解决下游业务问题的时候,我们往往还需要一些针对性的样本对模型进行微调训练。 本研究表明,细致地考虑大模型微调样本的设计,可以使用更少的样本训练出在下游任务上表现更好的模型。 例如,500 个 ES-SDE 样本的训练效果,就相当于约 2000 个 EW-SDE / heuristic 样本! 这印证了 ES-SDE 生成的微调样本具有极高的质量。 进一步的对PE和SDE关系的实验分析说明了在零样本/少样本推理下好的prompt,不一定能指导我们设计好的下游微调样本,这表明了SDE背后复杂的机理,期待更多的后续研究。

    89621编辑于 2024-04-26
  • 来自专栏红队蓝军

    lokibot样本分析

    temp文件夹下创建vxogkynyop文件图片向文件中写入加密的代码图片此加密代码解密后是一段shellcode 用于解密核心PE文件的还会再temp文件夹下创建wdxw2bfd6vcc5n文件 此文件为样本的核心代码 解密后的数据是PE文件 解密算法就在vxogkynyop文件中图片在临时文件夹下创建frhdgr.exe文件 向文件中写入PE文件创建进程 进程参数就是vxogkynyop文件图片提取样本图片第二层代码 :\/\/[a-zA-Z0-9\/\.:\-_]+""", data)    pe = None    try:        pe = pefile.PE(sys.argv[1])        for :\/\/[a-zA-Z0-9\/\.:\-_]+""", x)    urls += temp    urls = [x for x in urls if x not in ("http://www.ibsensoftware.com MODE_CBC, iv)                temp += dec.decrypt(conf)            temp_urls = re.findall(rb"""[a-zA-Z0-9\

    55920编辑于 2023-09-13
  • 来自专栏Khan安全团队

    Dangerouspassword ( Lazarus ) APT样本

    URL: hXXps://open.googlesheetpage.org/KcyRbGDJKRZoaLq8lHh8/C0sHwcGMH2/jnobmAFCMoY=

    54920编辑于 2022-04-02
  • 来自专栏学习与分享

    【Prometheus】Prometheus的样本

    在 Prometheus 中,"样本"(Sample)是指时间序列数据的一个基本单位,包含了某个特定时刻的一个度量值。一个样本由以下几部分组成: 1. 度量名称(Metric Name) 每个样本都关联着一个度量(或指标)名称,这个名称用于描述被监控的事物。 Prometheus 样本的类型 Prometheus 支持多种度量类型,它们定义了样本值的含义和如何增长: Counter(计数器):计数器值只能增加,表示某个事件的累计发生次数(例如 HTTP 请求总数 示例:不同类型的样本 1. Gauge 样本 cpu_usage{job="api-server", instance="server1"} 0.75 这个样本表示 cpu_usage(CPU 使用率)为 0.75,即 75%。

    61210编辑于 2024-12-18
  • 来自专栏CV学习史

    样本学习介绍

    形式化来说,few-shot 的训练集中包含了很多的类别,每个类别中有多个样本。 (batch)样本作为模型的预测对象(batch set)。 如果K值很小(通常K<10),我们称这种分类任务为极少样本分类任务(当K=1时,变成单样本分类任务)。 为了清楚起见,让我们详细说明度量学习算法是如何解决少样本分类任务的(以下定义为带标签样本的支持集,以及我们要分类的查询图像集): 我们从支持集和查询集的所有图像中提取特征(通常使用卷积神经网络)。 在元训练期间,MAML学习初始化参数,这些参数允许模型快速有效地适应新的少样本任务,其中这个任务有着新的、未知的类别。 MAML目前在流行的少样本图像分类基准测试中的效果不如度量学习算法。

    2.1K21发布于 2019-09-05
  • 来自专栏Bypass

    Webshell 高级样本收集

    收集样本,那可是一件很有趣的精细活。从样本里,你可能会发现很多技巧,并进入另一个视角来领略攻击者的手法。 当在安全社区里看到一些比较高级的Webshell样本,就如同发现宝藏一般欣喜,我会把它保存起来,慢慢地收集了大量的Webshell样本。 什么情况下需要海量的Webshell样本呢? 最近,我就在做产品Webshell扫描检测率方面的测试工作,以前积累下来的Webshell武器库给我的工作带来了极大的便利,通过去分类归整,同时整合了网络上的一些资源,形成一个测试样本库。 ---- 1、JSP高级对抗样本 这个一个可能会改变你对JSP Webshell认知的项目,提供了18个JSP高级样本具有很高的研究价值。 Github项目地址: https://github.com/tennc/webshell 4、Webshell样本库 Github项目地址: https://github.com/ysrc/webshell-sample

    1.2K10发布于 2020-08-02
  • 来自专栏红队蓝军

    lokibot样本分析

    文件夹下创建vxogkynyop文件 向文件中写入加密的代码 此加密代码解密后是一段shellcode 用于解密核心PE文件的 还会再temp文件夹下创建wdxw2bfd6vcc5n文件 此文件为样本的核心代码 解密后的数据是PE文件 解密算法就在vxogkynyop文件中 在临时文件夹下创建frhdgr.exe文件 向文件中写入PE文件 创建进程 进程参数就是vxogkynyop文件 提取样本 第二层代码 :\/\/[a-zA-Z0-9\/\.:\-_]+""", data) pe = None try: pe = pefile.PE(sys.argv[1]) :\/\/[a-zA-Z0-9\/\.:\-_]+""", x) urls += temp urls = [x for x in urls if x not in ("http://www.ibsensoftware.com MODE_CBC, iv) temp += dec.decrypt(conf) temp_urls = re.findall(rb"""[a-zA-Z0-9\

    47820编辑于 2023-09-05
  • 来自专栏R语言及实用科研软件

    🧐 pwr | 谁说样本量计算是个老大难问题!?(三)(配对样本与非等比样本篇)

    1写在前面 之前我们介绍的基于发生率或者均值进行样本量计算的方法,但都是在组间进行计算。 有的时候我们需要获取组内变化,进行样本量计算。 常见的就是配对样本,比如相同受试者进行多个时间点的观察,如下图: 本期我们就介绍一下如何估算配对样本样本量吧。 ---- 4.2 pwr计算样本量 现在,我们可以利用pwr包计算节食前后平均体重变化差(5磅)所需的样本量,具有 80%的power和0.05的显著性。 与之前的示例一样,随着我们增加样本量,估算的不确定性也随之减小。 通过减少这种不确定性,我们在估算中更好地避免了II类错误。 解决这个问题的唯一方法是招募更多患者或通过放宽纳入标准来扩大样本量。

    1.3K20编辑于 2023-02-24
  • 对话系统中零样本与少样本学习技术解析

    获奖论文《面向任务型对话系统的零样本与少样本知识寻求轮次检测》由应用科学家Di Jin、Shuyang Gao、首席应用科学家Seokhwan Kim、Yang Liu以及高级首席科学家Dilek Hakkani-Tür 但这需要大量正负样本,而开放域对话系统允许用户提出任意问题,难以收集足够数量的域外样本。" 性能优势实验结果显示:REDE模型在低资源和高资源设置下,对标准请求和域外请求的性能均优于传统二元分类器在零样本和少样本场景中,REDE模型相比BERT等传统分类器获得更大性能优势技术价值Seokhwan

    15210编辑于 2025-10-07
  • 来自专栏拓端tecdat

    R语言参数检验 :需要多少样本?如何选择样本数量

    例如,t检验是众所周知的参数检验,假设样本均值具有正态分布。由于中心极限定理,如果样本量足够,测试也可以应用于非正态分布的测量。在这里,我们将研究t检验有效所需的大致样本数。 将正态分布拟合到采样均值 为了研究满足t检验要求所需的样本数量,我们迭代各种样本量。对于每个样本大小,我们从几个分布中抽取样本。然后,计算样本的平均值,并将正态分布拟合到平均值的分布。 验证对数似然标准 作为结果的验证,让我们绘制样本大小为5的直方图和平均分布变为正常的样本大小: ? plot.means(norm.means) 这些结果表明对数似然准则是正态性的充分代理。 结论 这些实验的结果表明,对于小于20的样本,绝对应该避免学生t检验。当样本量至少为100时,大多数分布似乎都满足了测试的假设。 总之,特别建议检查样本大小低于100的测量分布。 由于中心极限定理不适用于具有无穷方差的分布,因此验证大样本大小的测量分布也是合理的。排除这种分配的可能性。

    92810发布于 2020-11-11
  • 来自专栏Bypass

    恶意样本基础分析技巧

    本文主要通过几个简单的步骤,分享恶意样本分析的基本方法。 ---- 1、多引擎在线病毒扫描 找到了一个恶意样本程序,通过多病毒引擎进行安全扫描,可以帮助你判断文件是否为恶意程序。 2、文件哈希值 文件哈希值是恶意代码的指纹,通过它用来确认文件是否被篡改,也可以通过HASH值查找恶意样本,一般我们也可以使用多种哈希验证文件的唯一性。 ? 6、云沙箱分析 将恶意样本上传到微步云沙箱,通过威胁情报、静态和动态行为分析,以发现恶意程序存在的异常。 微步云沙箱: https://s.threatbook.cn/ ? 7、动态行为分析 通过火绒剑对文件行为、注册表行为、进程行为、网络行为进行分析,捕获恶意样本特征。 ?

    2.8K20发布于 2021-07-22
领券