首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Sentieon:文献解读

    文献解读-基准方法研究-第十六期|《GeneMind 公司的 GenoLab M 测序平台 WGS 和 WES 数据基准测试》

    关键词:基准方法研究;基因测序;变异检测;文献简介标题(英文):Accuracy benchmark of the GeneMind GenoLab M sequencing platform for WGS and WES analysis标题(中文):GeneMind 公司的 GenoLab M 测序平台 WGS 和 WES 数据基准测试发表期刊:BMC Genomics作者单位:深圳真迈生物科技有限公司发表年份 为了确定GenoLab M的性能,研究者提出了一份报告,以对GenoLab M测序仪的WGS和WES测序数据进行基准测试,并将GenoLab M测序仪NovaSeq 6000和NextSeq 550平台在各种类型的分析中进行比较 该数据集是作为本研究基准数据的。2014年,瓶中基因组(GIAB)发布了金标准基因型数据集(包括参考样本NA12878),为比较变异检测流程的差异提供了资源。 而GenoLab M的100X WES在相同深度下表现出Illumina平台相似或优越的性能,在WES中也具有应用前景。

    34910编辑于 2024-07-09
  • 来自专栏Sentieon:文献解读

    文献解读-基准方法研究-第十五期|《不同 DNA 测序平台的标准化比较》

    关键词:基准方法研究;基因测序;变异检测;文献简介标题(英文):Standardized Comparison of Different DNA Sequencing Platforms标题(中文): LR测序的一个优点是能够解析基因组中难以测序的区域,其中存在大量重复序列,这些区域可能难以参考基因组进行正确比对。直到最近才在临床实验室测试的背景下对SR和LR技术进行大规模全面比较。 测序流程生物分子资源设施协会最近发布了他们对DNA测序技术的基准评估。该研究在使用SR或LR的各种测序平台上对人和细菌DNA样品进行了测序,并将其性能与成熟的基因组重复区域进行了比较。 目标是定义可重复的DNA测序基准测试工具,该工具可以深入了解每种仪器在许多基因组环境中的相对优势和劣势,从而更好地评估平台使用情况。该研究对目前市面上流程的测序公司的几个主要平台进行了详细比较。 文献讨论仪器在大多数情况下都具有可比性,并且在各参与实验室中表现出一致的性能,这表明使用这些基准工具可以获得可重复的数据。

    31710编辑于 2024-07-09
  • 来自专栏AIGC 先锋科技

    ​ LaVy LaVy-Bench | 推进越南语多模态语言理解研究基准测试 !

    LLM的成功激励研究行人探索多模态大型语言模型(MLLM)的潜力,这些模型结合了视觉信息文本数据。 通过开发LaVy,作者旨在弥合越南语LLMMLLM之间的差距,为研究行人和实践者提供了一个强大的工具,以探索越南语背景下语言视觉的交集。 通过建立标准化评估框架,作者旨在推动越南语MLLM的发展和基准测试,促进研究社区内的创新和合作。 在本文中,作者介绍了LaVy和LaVy-Bench基准,作为越南语多模态语言理解领域的重大贡献。 已经提出了各种方法来将来自多个模态的信息集成到预训练的LLM架构中。例如,Flamingo 和BLIP-2 采用了不同的技术,通过门控注意力或Q-former将视觉标记冻结的LLMs融合。 4.2.2 In-the-wild benchmark 为了进一步评估模型的理解能力,作者遵循LLaVA基准(野外环境)Liu等人(2023年)的评估方法,重新收集了一组24张不同类型的图片和60个问题

    33910编辑于 2024-07-08
  • 来自专栏机器之心

    教程 | CMU研究者探索新卷积方法:在实验中可媲美基准CNN(附实验代码)

    Singla 机器之心编译 参与:Panda 尽管卷积神经网络成就非凡,但卷积本身并不完美,卡内基梅隆大学计算机科学博士 Sahil Singla 近日在 Medium 上发文,介绍了他对「新一类卷积」的探索研究 基准和正交卷积每次迭代所用时间的比较 从图中可以看到,正交卷积所用时间几乎超过 7 倍。加速这些代码的方法是存在的,但因为结果如此糟糕,我也就没有更进一步了。 我将其一个称为正交性权重(orthogonality weight)的超参数相乘,然后将其加入到了总体损失之中。 另外,我也尝试进行了一些非标准的(我自己发明的)调整,想让该网络的表现超过基准。但没有一种调整有效。实际上,能成功重现基准结果就已经让我很开心了,尽管我增加了一个比交叉熵本身更大的损失项。 我也相信这项研究有助于更好地可视化卷积层中的权重。这是我接下来会探索的方向。

    794100发布于 2018-05-08
  • 来自专栏跟Qt君学编程

    翻译 | QMapQHash小基准

    blog/qmap_qhash_benchmark.html 作者: Olivier Goffart   在我的Qt开发者日2012演示文稿(深入探讨QtCore)时,我做了一个比较QMap和QHash的基准 基准   基准测试很简单,并且在一秒钟内在循环中进行大量查找并计算迭代次数。 这不是真正科学严谨的。我们的目标只是展示曲线的形状。 结果   在我的电脑上运行,gcc 4.7。 STL相比,Qt容器的性能基本相同。如果少于20个元素,QMap比QHash更快。   如果比较Qt5和Qt4之间的数量,您会发现Qt5的性能更好。这可能与QString中的更改有关。 ---- 相关知识 跳跃表:通过增加多级索引(会增加额外的空间)来提升插入删除操作。 红黑树:是一种特定类型的二叉树,进行插入和删除操作时通过特定操作保持二叉查找树的平衡。 附: 基准测试程序 /* Copyright 2013 Olivier Goffart <ogoffart@woboq.com> http://woboq.com/blog/qmap_qhash_benchmark.html

    1.1K20发布于 2019-09-18
  • 来自专栏我爱计算机视觉

    ICCV 2023 Oral | 突破性图像融合分割研究:全时多模态基准多交互特征学习

    Learning and a Full-time Multi-modality Benchmark for Image Fusion and Segmentation,收录于 ICCV 2023 Oral,研究用于图像融合和分割的多交互特征学习和全时多模态基准 现有大部分方法都仅考虑提升融合图像的视觉效果,忽略了对下游高级视觉任务的支持。目前也有一些研究尝试通过级联融合感知网络设计联合框架,结合加权损失函数实现端到端学习。 方法 为了实现融合后续感知任务的统筹兼顾,本文将融合分割任务的求解联合定制为一个优化目标: 其中 g(·) 是联合优化两个任务约束项,我们通过分层注意力 (HIA) 来实现这一目标。 我们在 MFNet 和 MFB 数据集上都取得了最高的 mIoU,第二名相比提高了 7.66%。同时注意到我们的方法对于人和车的优越结果意味着我们的方法在应用于现实世界感知时有更高的性能。 定性实验 在视觉效果上,本文方法可以有效克服各类可见光降质因素的影响,例如强光干扰极暗成像条件。一方面本文方法有效提取显著红外目标,例如第一行的行人。

    2.1K60编辑于 2023-08-31
  • 来自专栏SRE运维进阶之路

    Linux 性能基准测试工具及测试方法

    ,给我们的经验教训,就是上线前,基准测试的重要性,这篇文章着重介绍一下「Linux 性能基准测试工具及测试方法」 还是老规矩,先请性能领域的大师布伦丹·格雷格(Brendan Gregg)登场 linux_benchmarking_tools | bc -l -q &>1 # 结果分析,看 real 即可,时间越短,性能越好 sysbench 素数计算 # 安装 sysbench yum -y install sysbench # 测试方法 /stream_c.exe # 结果分析,看 Copy、Scale、Add、Triad,数值越大,性能越好 磁盘 IO ⚠️ 测试时请准备裸的数据盘,测试完成后请重新格式化磁盘 测试方法和结果分析和文件 在基准测试时,一定要注意根据应用程序 I/O 的特点,来具体评估指标。 QPS 自动化压测脚本 压测需要大量采样,并实时观察 git clone https://github.com/clay-wangzhi/bench.git bash bench.sh 更多测试方法

    1.3K10编辑于 2024-04-23
  • 来自专栏实验盒

    蛋白质结构tokenization新进展:基准评估框架优化方法的探索

    然而,该技术面临以下挑战: 评估体系碎片化:缺乏统一基准,导致不同方法的性能难以横向比较。 StructToken-Bench的引入为蛋白质结构标记化研究提供了标准化工具,使研究者能够更全面地理解方法的优势局限。 AminoAseed:codebook优化的新方法 在评估现有方法时,研究者发现“codebook坍塌”是普遍存在的问题,即大量codebook向量未被充分利用。 意义局限性 这一研究在以下方面为计算生物学提供了新工具和思路: 评估标准的确立:StructToken-Bench作为首个聚焦局部结构的基准,为后续研究设定了参考框架。 尽管取得了显著进展,当前研究仍存在局限: 适用范围:仅针对单链蛋白进行评估,未涉及蛋白质复合物。 动态建模:对蛋白质动态构象的表征能力仍需提升。 数据整合:冷冻电镜等实验数据的结合尚未探索。

    36910编辑于 2025-03-17
  • 来自专栏时空探索之旅

    评估零样本时间序列预测中系统 1 系统 2 推理方法基准见解

    研究发现,自我一致性策略最有效,多模态预测受益更多,系统1推理增强优于系统2。论文还提供了开源工具包,包括评估套件、测试时扩展法则验证和推理标注数据集。 为此,作者构建了 ReC4TS ,首个用于评估多种主流推理策略在零样本TSF任务中有效性的基准,覆盖8个领域的数据集,评估单模态多模态结合短期长期预测四个场景。 回答:自我一致性(Self-Consistency)方法是目前最好的推理策略对于时序预测。 具体来说,自我一致性方法是指模型平行采样多条推理路径,选取最能代表采样一致性的结果。 实验发现自我一致性方法中推理路径的采样数量和预测效果有着简明的正相关关系,同样印证了自我一致性方法的优势。 结果表明: 零样本时序预测确实能从推理能力中受益 ,并进一步证明使用自我一致性方法的推理策略在零样本时序预测任务中带来了最显著的提升。 作者期待评估结果,洞见和工具库能有助于推理能增强的时序模型研究

    35310编辑于 2025-03-12
  • 来自专栏机器之心

    业界 | TensorFlow基准:图像分类模型在各大平台的测试研究

    选自TensorFlow.org 机器之心编译 参与:蒋思源、黄小天 自 TensorFlow 1.0 发布以来,越来越多的机器学习研究者和爱好者加入到这一阵营中,而 TensorFlow 近日官方又发表了该基准 使用合成数据进行的测试是通过将 tf.Variable 设置为 ImageNet 上每个模型的预期数据相同的形(shape)而完成。我们认为,在对平台做基准测试时,包含真实数据测量很重要。 训练细节及额外结果可参阅亚马逊弹性计算云分布式训练明细(链接:http://suo.im/tgzU9) 合成数据真实数据训练的对比 NVIDIA Tesla P100 ? 方法论 为了生成上述结果,我们将这一脚本(链接:http://suo.im/2OoknL)放入不同平台运行。

    1.7K60发布于 2018-05-08
  • 来自专栏AI科技评论

    DeepMind研究科学家:NLP基准测试的现在、过去和未来

    有些基准在使用的过程中达到了和人类近似的表现,它们被记入这一领域发展的历史中。例如 AlphaFold 2在CASP 14竞赛中达到实验方法竞争的性能就标志着结构生物学领域的重大科学进步。 Mark Liberman曾表示:“研究设计可用几十年的指标,为实际应用短期发展设计的指标之间,存在很大的差异。 效率的高低样本效率、FLOPS和内存约束有关。就是说,如果内存不够或是其他资源有限,评估模型就只能转向其他研究方向。 这样的集合需要进行版本控制,以便能够在学术审查周期之外进行更新,并且以前的方法进行比较。 2015-2019年就读于爱尔兰国立高威大学,工程信息学院,自然语言处理博士毕业。 2017.4-2017.6在哥本哈根大学,自然语言处理组,计算机科学系研究访问。

    65110发布于 2021-10-11
  • AI攻防博弈前沿数学基准测试

    在研发过程中,该机构将自动化测试系统部署至HackerOne平台(一个众包漏洞赏金平台),数千名人类研究员同台竞技。 该成果表明当前已能开发出经济激励人类相竞争的自动化测试系统。囚徒困境揭示AI个性特征某学院某大学研究人员通过迭代囚徒困境博弈研究AI系统的战略推理能力。 前沿数学基准测试挑战AI极限某测试机构推出FrontierMath Tier 4基准,包含50个由博士后研究员和数学教授合作开发的极端困难数学问题。 实施方法:将模型属性(如训练计算量)实体门槛(如定向AI研发支出达10亿美元)相结合。意义:如果人们对AI发展时间线的预测正确,我们需要更多关于前沿发展的信息。 极强大技术由少数私营主体构建,现有监管方法难以提供理想透明度水平。此类研究直面该问题并尝试提出解决方案。技术寓言:罗生门末世AI系统通过文本、电影、音频、游戏等媒介相互通信。

    24710编辑于 2025-08-31
  • 来自专栏AI研习社

    用正确方法对度量学习算法进行基准测试

    但是在基准度量学习论文中并非如此: 1.网络架构并没有保持不变。 这是值得怀疑的,因为之对比的方法使用的是 GoogleNet,这是一个不太强大的架构。因此,大部分性能提升可能来自网络架构的选择,而不是他们提出的方法。 2.图像增强并没有保持不变。 所以让我们正确地对这些算法进行基准测试 ---- 这就是强大的基准测试被用到的地方。 ? 为什么要用这个工具? 透明性。 由于没有标准的实验方法,很难比较各种算法的性能。这阻碍了研究进展,因为我们不知道哪种方法最有效。因此,重要的是要有一个基准工具,使我们能够做公平的比较。 ? 然而,这两种方法常常被排除在结果表之外,或者被认为是性能最差的方法之一。强大的基准测试程序使检查这些基准算法变得容易。 写在最后 ---- 你对这个工具的看法和度量学习的现状怎么看?

    80310发布于 2019-12-23
  • 来自专栏SDNLAB

    专用数据处理器(DPU)性能基准评测方法实现技术白皮书

    DPU 作为新近发展的专用数据处理器,不同厂商的 DPU 功能差异化显著,有的侧重网络可编程,有的侧重存储卸载,有的侧重安全虚拟化。 本文提出的 DPU性能基准评测根据“POC 原则”(真实性、针对性、全面性),围绕网络、存储、计算安全四个维度的应用场景,引入各自典型应用作为基准测试,测试 DPU 的相关指标。 DPU 性能基准评测的提出,首先对于用户而言,一方面获得 DPU 功能定位,另一方面获得性能参考;其次对于 DPU 厂商来说,通过对 DPU 产品基准评测结果,可以不断优化自己的设计;最后对于研究者而言 ,也能够提供对研究 DPU 的帮助。 DPU 支持的场景非常丰富而且还在不断拓宽,DPU 性能基准评测仅选取当前典型的应用作为主要的评测方法,需要根据 DPU 功能的变化增加或修改,不断完善 DPU 性能基准评测方法

    1.2K20编辑于 2022-08-26
  • 来自专栏FunTester

    【连载 72】微基准测试 JMH 实战

    本章的主角——微基准测试(Microbenchmarking)应运而生。微基准测试专注于评估程序中特定代码片段或方法的性能,通过对比不同实现方式的性能差异,助力开发者选择最优方案,优化软件性能。 11.1 微基准测试基础 微基准测试是一种针对程序中特定代码片段的性能测试方法,旨在量化其在不同场景下的性能指标(如吞吐量、执行耗时、CPU占用、内存占用),为性能优化提供数据支持。 全链路测试相比,微基准测试聚焦于单一方法或代码块,测试粒度更细,适合快速定位瓶颈。 微基准测试的核心优势包括: • 精准定位:直接测试特定方法,排除外部因素(如网络延迟、数据库响应)的干扰。例如,测试UserBehavior对象的序列化方法,找出性能瓶颈。 • 高精度可重复性:JMH通过预热(Warmup)、多次迭代和JVM状态控制,消除JIT编译、GC等干扰,确保结果准确。例如,测试订单加密方法时,JMH可提供纳秒级精度。

    34100编辑于 2025-07-16
  • 来自专栏OpenMMLab

    MMDetection 3.0:目标检测新基准前沿

    最近一年,跨模态和任务的感知算法逐渐成为计算机视觉领域新的研究趋势。 因此,为了让 MMDetection 能够作为基准持续支持前沿算法,方便优秀 idea 的实现,经过半年的酝酿设计,再经过半年的开发打磨,2022 年 9 月 1 日,MMDetection 3.0 QAQ MMDetection 的家庭地位 新基准的自我修养 为了向检测社区提供完善强大的基准,MMDetection 3.0 主要在模型库、基准模型的速度性能、用户生态三个方向进行了努力。 MMDetection 支持的各类方法示意图 MMDetection 支持的各类模型 高性能基准模型 高效的训练推理有助于加速实验和模型生产的流程,高精度的基准模型能够为社区提供更多好用的模型。 同时,OpenMMLab 还希望能够为研究员们提供施展拳脚的平台。

    1.3K30编辑于 2022-12-30
  • 来自专栏腾讯移动品质中心TMQ的专栏

    Android手机上用户操作模拟方法研究实现

    一、 问题背景 最近研究了一下Android手机上用户操作的模拟方法, 有一些心得与大家分享下。 之所以去研究Android手机上用户操作的模拟方法,是因为最近做毕业设计,想尝试开发Android的UI自动化测试。 图4 三星GT-i9300手机上单击屏幕时触发的事件 三、 研究内容结果 为了让程序可以在不同的手机上都可以运行,代码需要解决以下两个问题: 1. 目前我暂时的解决对这类手机放到一个适配表里,需要继续研究更好的方法。 2. 由于研究的时间较短,目前只是对少量的手机做到了zoom in和zoom out的模拟,还没有完全研究出针对大部分手机都适用的双指以及多指操作的模拟方法,这也是需要继续研究解决的问题。

    5.1K60发布于 2018-02-02
  • 来自专栏机器之心

    JHU提出最强ToM方法,AutoToM横扫五大基准

    近日,来自JHU 的研究团队提出了 AutoToM,一种全自动、开放式的心智推理方法以往方法相比,我们的方法具有更强的通用性:支持任意结构的 BToM 模型,能够同时考虑多个潜在变量,并支持任意层级的高阶的心智推理。 全自动的模型发现改进 之前的方法依赖于人工设计的 BToM 模型,这限制了它们在特定领域外的适用性。 这些基准覆盖了不同的心理变量、环境、agent 数量、有无语言表达、措辞风格以及模态类型。 AutoToM 不同,许多近年来的 ToM 方法只能应用于特定的基准测试。 AutoToM 及其消融方法在所有基准测试中的平均正确率计算量。 总结和展望 总的来说,AutoToM 是一个 ToM 推理任务的新颖框架。

    26600编辑于 2025-04-18
  • 来自专栏腾讯移动品质中心TMQ的专栏

    Android流量监控方法研究

    1、常用的测试流量方法: (1)使用wireshark进行抓包: Wireshark(前称Ethereal)是一个网络封包分析软件。 同时据我所知wireshark无法通过命令行来获取某些数据包的流量统计(如果哪位同仁知道怎么处理希望能告诉我J) (2)通过已有的工具,比如手机管家、360手机卫士或其他统计工具 使用现场工具是最为简便的方法 在Android中,如果用Root Explorer去查看系统文件,流量监控相关的会有这么几个文件: ① 系统总流量:/proc/net/dev,这个文件中记录的是整个系统的流量情况。 其实,TrafficStats类本身也是读取Linux提供的文件对象系统类型的文本进行解析,其中有的方法也是读取别的文件。 但是需要注意的是,在没有wifi的情况下,各进程获得的getUidRxBytes之和getMobileRxBytes所返回的值不相等,原因在于getUidRxBytes是读取上文提到的文件,而getMobileRxBytes

    5.5K51发布于 2018-02-02
  • 来自专栏SAP梦心的SAP分享

    ALV面向对象方法研究:实现方法(一)

    目前实现ALV的形式报表主要有2种:调用函数REUSE_ALV_GRID_DISPLAY和用面向对象的方法实现。前一种比较普遍,不过性能好像不太高,如果查询语句写得不太精妙,很容易出现卡的情况。 现在着重介绍第二种方法

    81010编辑于 2022-05-10
领券