首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏啄木鸟软件测试

    模型测试:性能优化的5大实战策略

    引言 随着ChatGLM、Qwen、DeepSeek及Llama系列大语言模型在金融、政务、医疗等关键场景加速落地,模型测试已远超传统‘功能是否正确’的范畴——性能成为决定能否上线的核心瓶颈。 这些并非个例,而是大模型测试进入深水区的典型信号:性能不是附加项,而是可信AI的第一道防线。 一、明确性能基线:拒绝‘拍脑袋’指标 大模型性能测试首要误区是套用小模型标准。 二、分层注入式压测:从单卡到集群的穿透验证 传统压力测试常止步于API层,而大模型性能瓶颈常藏于框架底层。 推荐采用‘四层注入法’: 1)API层:模拟真实用户请求分布(如80%短提示+15%中长提示+5%对抗性长上下文),避免均匀负载失真; 2)Engine层:直连vLLM/Triton推理引擎,注入不同 结语 大模型性能测试的本质,是构建‘可测量、可归因、可演进’的效能反馈闭环。

    18710编辑于 2026-03-31
  • 来自专栏小雨的CSDN

    软件测试 —— 测试模型(V模型 W模型

    【软件开发的周期:、需求分析、设计、实现、测试、安装部署、运行维护】 【软件测试的周期:、需求分析,测试计划,测试设计/测试开发,测试执行,测试评估】 软件测试v模型 (v模型是瀑布模型的变种) 优点:后期的测试阶段和前期的阶段可以一一对应起来,清楚的标注每一个测试阶段的依据 缺点:不利于项目前期风险的及时发现 软件测试W模型(双V模型) 特点:测试在项目前期介入,对需求,系统设计等都会进行验证 ,测试的对象不仅是程序,需求、设计等同样要测试测试与开发是同步进行的 优点:测试介入早,有利于全面得发现系统前期的风险,同时,对需求的测试也有利于及时了解项目难度和测试风险,及早制定应对措施,显著减少总体测试时间 ,加快项目进度 缺点:阶段性比较强,需求、设计、编码等活动被视为串行的;测试和开发活动也保持着一种线性的前后关系,上一阶段完全结束,才可正式开始下一个阶段工作不可逆,所以无法适应敏捷开发。

    1.8K30编辑于 2022-10-26
  • 来自专栏达达前端

    软件测试模型以及测试方法

    前言 大家好,我是 Vic,今天给大家带来软件测试模型以及测试方法的概述,希望你们喜欢 软件测试 软件开发过程 软件质量保证 理解软件测试 软件测试分类 测试工作流程 思考软件测试 软件测试时一门很重要的学科 那么软件生存期模型有什么内容呢 瀑布模型 原型模型 增量模型 螺旋模型 1.瀑布模型 答:对于瀑布模型,我知道有六个阶段:计划,需求分析,设计,编码,测试,运行维护。 3.什么是增量模型 答:对于增量模型,记住的是在每个阶段都会生成一个可发布的正式版本,而且每个软件版本是逐步完善的。 4.什么是螺旋模型 答:螺旋模型是瀑布模型和原型模型结合起来的,记住这个模型是有四个阶段,这四个阶段都是主要的,一是制定计划,二是风险分析,三是实施工程,四是评审。 总结 本文讲了软件测试模型以及测试方法,如果您还有更好地理解,欢迎沟通 定位:分享 Android&Java知识点,有兴趣可以继续关注

    96320发布于 2019-07-03
  • 来自专栏陶陶计算机

    PyTorch 实战(模型训练、模型加载、模型测试

    本次将一个使用Pytorch的一个实战项目,记录流程:自定义数据集->数据加载->搭建神经网络->迁移学习->保存模型->加载模型->测试模型 自定义数据集 参考我的上一篇博客:自定义数据集处理 数据加载 torch.eq(pred, y).sum().float().item() return correct / total def main(): model = ResNet18(5) test_acc = evalute(model, test_loader) 迁移学习 提升模型的准确率: # model = ResNet18(5).to(device) trained_model 此时使用的是前17层的网络 0-17 *:随机打散 Flatten(), nn.Linear(512,5) model.pkl则是第一种方法保存的 [在这里插入图片描述] 测试模型 这里是训练时的情况 [在这里插入图片描述] 看这个数据准确率还是不错的,但是还是需要实际的测试这个模型,看它到底学到东西了没有

    3.3K20编辑于 2022-05-12
  • 来自专栏流柯技术学院

    性能测试学习之二 ——性能测试模型(PV计算模型

    PV计算模型 现有的PV计算公式是: 每台服务器每秒平均PV量 =( (总PV*80%)/(24*60*60*40%))/服务器数量               =2*(总PV)/* (24*60*60

    1.4K20发布于 2018-08-30
  • 来自专栏嵌入式视觉

    【Kaggle竞赛】模型测试

    是骡子是马拉出来溜溜就知道,一个模型好还是坏,放在全新的测试集上去测试下就知道了,根据模型测试的结果我们才能衡量模型的泛化性、稳定性等指标如何,从而方便我们根据测试的反馈去进行调参优化模型。 这里我是根据kaggle比赛来写的模型测试代码,所以可能跟实际的工程项目有所差别,注意区分。 这里的模型测试程序,是我参加dogs-vs-cats-redux-kernels-edition比赛而编写的,其他Kaggle比赛有所区别,但大致逻辑和流程没有差别。 模型测试及输出结果程序实现 下面的程序中,我只是加载了模型中每一个变量即权重参数的取值,没有加载模型中定义好的变量,对输入和输出我都重新定义了,其实是可以通过以下代码直接返回训练好的模型中设置的输入输出变量的 ,glob,skimage,numpy, # Function:负责测试猫狗识别网络模型,并将识别结果输出到csv文件中 from PIL import Image import matplotlib.pyplot

    80030编辑于 2022-09-05
  • 来自专栏搜狗测试

    测试策略模型探索

    测试的重点和难点是什么? ④ 测试的深度和广度是什么? ⑤ 如何安排各种测试活动(先测试什么,再测试什么)? ⑥ 如何评价测试的效果? 测试策略的制定思路 实际项目中,以上6个问题看起来不难,但是想回答好却并不简单。小编借鉴书中的一种思路,通过模型化的方法来指导策略制定,具体模型图是: ? ; ② 质量活动包括确定测试类型、测试框架及测试工具; ③ 质量评估可以反馈产品的质量和用户满意度,从而得出策略是否有效和高效; 测试总体框架图 通过测试策略和测试活动按照测试框架绘制出来 ,并按照研发流程和测试分层来组织测试活动的先后次序,形成测试总体框架: ? 测试策略项目落地实践 测试质量目标的落地 测试质量的目标围绕的是刚刚好的状态。

    1K50发布于 2020-07-24
  • 来自专栏漫谈测试

    性能测试成熟模型业务模型

    我们针对具体方案的设计进行抽象和总结,将其归纳为6个性能测试模型。 在企业建设性能测试体系的过程中,性能测试模型可作为性能测试项目实施的基础理论,当每个项目开展性能测试时,基于该理论进行具体的性能测试方案的设计,从而保障企业内部性能测试实施过程的标准化、规范化。 性能测试模型是性能测试工程师开展性能测试项目必须掌握的内容,他们只有深度掌握这6个模型,并在不同的项目实施方案设计中灵活运用,才能达到性能测试项目的预期目标,本文主要聊聊性能测试中的业务模型模型的目的是什么 在实施结果价值上,业务模型为性能测试提供更接近于生产实际的业务场景,使测试结果对生产更具有参考性。设计的测试场景与生产用户使用的场景差异越小,其测试结果对生产的参考价值越大。 ”功能压力占比20%、"下单"功能压力占比15%、“查询”功能压力占比5%,将其来作为系统压测的业务模型

    40920编辑于 2024-10-30
  • 来自专栏漫谈测试

    性能测试成熟模型策略模型

    策略模型的概述策略建模作为性能测试方案的重要组成部分之一,通过设置不同的策略来实现不同的测试目的和需求。 在对业务模型中的功能点或接口进行策略的设置时,其核心目的是在测试策略方面保障测试执行场景的多样性。这里介绍的策略模型内容基于前期的性能测试的类型,在企业实际建设过程中对其他性能测试类型方面进行补充。 策略模型建模的方法以下针对每一个模型的内容进行具体说明,包括模拟场景、测试目的、负载压力、执行方法、指标要求和测试结果分析几个维度,基础测试如下表所示。单场景测试如下表所示:负载测试场景如下图所示。 其它形式的测试不进行详细说明了,比如容积测试(容量测试);稳定性测试;健壮性测试;压力测试;恢复性测试浪涌测试;批量处理场景测试。性能测试策略模型优缺点有哪些? 选择适合的性能测试策略模型应当基于项目特性、开发方法学、预算限制以及对软件质量的具体要求。每种模型都有其独特的优势和局限性,理想情况下,综合运用多种测试策略可以获得最佳效果。

    28210编辑于 2024-11-07
  • 来自专栏漫谈测试

    性能测试成熟模型风险模型

    风险模型是指在性能测试实施过程中可能存在的风险,这些风险主要是由外部因素导致的而不是应用系统本身发生的。 风险模型作为性能测试方案的重要组成部分之一,通过在实施性能测试过程中提前对可能存在的风险进行评估和拟定应对方案,以保证性能测试实施过程的顺利进行,以及在出现问题后能够快速解决问题,验证测试结果数据的准确性 5)监控风险:在用性能测试工具监控时可能存在对某些对象无法实现监控的问题,比如在用用监控工具监控的时候可能涉及版本、费用、有效周期、使用人员能力等方面的问题。 风险建模的5个方面主要包含? 5)版本管理:进行压测版本的有效管理和每一轮压测的回归,对压测的应用版本,由开发与性能测试工程师确认无误后进行压测环境的版本发布,同时性能测试人员记录时间和版本以及对应的测试结果。

    30720编辑于 2024-11-08
  • 来自专栏C / C++

    测试开发测试】从“0”建立【模型】的概念:需求、开发模型测试模型一文全知道

    2 模型:开发模型&&测试模型 2.1 “模型”到底是什么? 参与的团队成员一般是5到9人。每期迭代要完成的userstory是固定的。每次迭代会产生一定的交付。 (5)回顾会议:项目团队对本期迭代进行总结,发现不足,制定改进计划,下一次迭代继续改进,以达到持续改进的效果。 2.4 测试模型 测试模型中有两个非常重要且具有标志性的测试模型:V模型和W模型。 缺点:仅仅把测试作为在编码之后的一个阶段,未在需求阶段就介入测试。缺点同瀑布模型。 2.4.2 W模型(双V模型) V模型中未将测试前置的问题在W模型中得以解决。

    22110编辑于 2025-11-13
  • 来自专栏FunTester

    测试模型中理解压力测试和负载测试

    首先我接受了一个观点:性能测试是所有性能相关的测试的集合,而压力测试和负载测试就是性能测试的子集。 原始文章地址:性能测试、压力测试和负载测试。 压力测试 对应的性能测试模式就是固定线程,通过使用固定线程的模式对服务进行性能测试,或者使用阶梯型的线程递增模式进行性能测试。 通过控制线程数来进行不同场景的测试。 通常来说,压力测试确定了在繁重的工作负载下应用程序的健壮性和错误处理能力。压力测试是通过考虑更多数据和许多用户来确定压力下系统状态的测试方法。 压力测试的好处 帮助验证系统过载时是否会破坏数据 确保发现BUG和同步问题 验证故障期间的数据传递和消息传递功能 通过克服软件故障的风险来确保交付可靠的软件 负载测试 对应的性能测试模型就是固定QPS, 负载测试的目的是开发一种在意外的极端负载条件下也能稳定运行的应用软件。这种测试方法也称为耐力测试。可以通过选择合适的自动化工具轻松地执行此操作。

    1.6K10发布于 2021-01-22
  • 来自专栏学习

    【软件测试】敏捷模型(Scrum模型)和V模型、W模型

    参与的团队一般是 5 到 9 人。 ,所以测试人员不应使用传统的 Excel 填写测试用例的方法,更多的是使用思维导图、探索性测试(强调自由度,设计和执行同时进行,根据测试结果不断调整测试计划)、自动化测试等 敏捷讲求合作,在敏捷项目组中 ,测试人员应主动跟开发人员了解需求、讨论设计、一起研究 bug 出现的原因 测试模型 V 模型 V 模型中,明确的标注了测试过程中存在的不同类型的测试 右边的测试,都需要参考左边对应高度的要求 缺点: 缺点和瀑布模型一样 W 模型(双 V 模型) V 模型中未将测试前置的问题在 W 模型中得以解决 开发 V 模型并不是单单指编码阶段,而是为产品开发流程而实施的各个阶段 测试的对象不仅是程序,需求、 对于当前软件开发复杂多变的情况,W 模型并不能解除测试管理面临着困惑

    2.8K10编辑于 2024-11-15
  • 来自专栏啄木鸟软件测试

    软件性能测试(连载5

    这个值不应该超过5。 ØPage Faults。 处理器页面错误计数。这个值大说明操作系统向内存读取错误数据过多。 •Physical disk。 Ø%Disk Time。 表3-3 磁盘的I/O数的计算方法 RAID类型计算方法RAID0(Reads+Writes)/Number of DisksRAID1(Reads+2×Writes)/2RAID5(Reads+4× 如果这个值持续增长或者性能测试终止后这个值仍旧不降,说明发生了内存泄露。 5.网络 •Network interface。 Ø Bytestotal/sec。

    1.1K10发布于 2020-02-19
  • 来自专栏用户1337634的专栏

    JMeter5性能测试

    本文介绍一下如何使用JMeter5完成性能测试 最简单执行计划 创建计划 添加Thread Group TestPlan -> Add -> Threads(Users) -> Thread Group 测试结果 ---- 高级功能 读取文件 上面的测试,每次发送的URL请求都是同一个,可能因为缓存等原因导致性能数据偏差。 可以使用读取CSV文件的方式,对每个请求构造不同的请求。 参数读取规则 配置完成后,可以在一次执行计划中根据CSV文件中配置的参数,构造不同的请求 NoGui 不要使用GUI界面进行性能测试 不要使用GUI界面进行性能测试 不要使用GUI界面进行性能测试 如果要执行性能测试,需要使用命令行模式,如下: . /jmeter -n -t ~/process.jmx -l result.jtl -n: No Gui模式 -t: 指定配置文件 -l: 指定测试结果文件 性能测试结果 在No Gui模式下生成的性能测试结果

    1.5K20发布于 2019-03-27
  • 来自专栏dongfanger

    JUnit5的条件测试、嵌套测试、重复测试

    条件测试 JUnit5支持条件注解,根据布尔值判断是否执行测试。 如果定义在测试类外部,那么需要是static方法。 内置条件 JUnit5的org.junit.jupiter.api.condition包中内置了一些条件注解。 借助于Java嵌套类的语法,JUnit5可以通过@Nested注解,实现嵌套测试,示例: import static org.junit.jupiter.api.Assertions.assertEquals └─ Wiederholung 5 von 5 ✔ 小结 本文分别对JUnit5的条件测试、嵌套测试、重复测试进行了介绍,它们可以使得测试更加灵活和富有层次。 除了这些,JUnit5还支持另一个重要且常见的测试:参数化测试

    2.2K20发布于 2021-07-16
  • 来自专栏世荣的博客

    渗透测试笔记-5

    执行一个外部的应用程序的输入并显示输出的结果 2.exec():执行一个外部的应用程序,但不显示输出的结果 3.passthru():执行一个系统命令并显示原始的输出 4.shell_exec():执行shell命令并返回输出的结果的字符串 5. 7.0之后的demo: 3.call_user_func():回调函数,可以使用is_callable查看是否可以进行调用 4.call_user_fuc_array():回调函数,参数为数组 5.create_function ():创建匿名函数 5.preg_replace():当php版本小于7时,当为 /e 时代码会执行 6.array_map():为数组的每个元素应用回调函数 7.array_filter():依次将

    46520编辑于 2022-03-18
  • 来自专栏自学测试之道

    H5专项测试

    前言 随着Html5的流行,现在很多业务场景使用H5页面来承载,使活动类、运营类的业务功能更便捷在微信、Native端部署,所以H5方面的测试也变得越来越重要。 ? H5业务测试流程图 一、H5测试基本点 1. ; 8.数据埋点 用于BI的数据埋点 二、常用工具 工欲善其事,必先利其器,在做H5前端性能测试之前,选择合适的工具能让我们的测试工作事半功倍。 在我们做H5前端性能测试的时候,个人觉得只要不修改包,不对H5调试,就可以放弃使用这类工具,不是工具不好,而是大材小用(杀鸡焉用牛刀??是吧!)。 我们可以快捷的测试出H5前端性能中数据,视图,并给出一定程度的优化建议。 ? 工具对比列表 工具使用详情请参考【H5前端性能测试快速入门】

    2K42发布于 2019-09-29
  • 来自专栏Hadoop数据仓库

    ShardingSphere实践(5)——性能测试

    本次测试使用上篇“二、用例测试”的环境。BenchmarkSQL基准测试属于压测,为尽量减小复制延迟,将两个从库的刷盘参数设置为0,并开启组提交与多线程复制。 直连主库         首先不通过Proxy,直连主库进行基准测试,用以结果数据对比。         准备测试数据,创建16张表,每张表一百万条数据。 ,预热一分钟,压测5分钟,每秒输出一行报告。 sbtest4    | sysbench_ds   | | sbtest3    | sysbench_ds   | | sbtest6    | sysbench_ds   | | sbtest5     准备测试数据,建一个测试表,插入一千六百万行。按照规则,会在四个数据源中使用hash_mod算法平均自动分成16个分表,每个数据源4个分表,每个分表近似一百万数据。

    1.7K21编辑于 2022-06-05
  • 来自专栏漫谈测试

    性能测试策略模型测试类型选取建议

    联机类系统通常选取的性能测试类型主要为基准测试、单场景测试、负载测试、容量测试、稳定性测试。根据具体测试目的,可通过增删来选取适当的性能测试类型。 以下针对常见测试目的来提供一些测试类型选取建议,可根据相应的目的进行组合,形成高效的测试策略,如下图所示:不同测试目的与软件宜采用的性能测试类型负载测试:这是最常见的性能测试形式之一,旨在通过模拟预期的真实用户负载来评估应用程序的行为 压力测试(也称耐力测试):目的是为了找出系统崩溃点或极限值。这种类型的测试通常会将系统置于极端条件下运行,比如极高的并发请求量下,以观察系统何时开始出现性能下降甚至故障。 稳定性测试:长期运行系统于高负载状态下,检查是否有内存泄漏等问题发生。此类测试有助于发现随着时间推移可能出现的问题,如资源耗尽等。峰值测试:专注于短时间内突然增加大量请求的情况下的系统表现。 配置测试:通过改变硬件/软件环境参数(例如CPU速度、内存大小等),查看它们如何影响应用程序性能。这对于优化成本效益比很有帮助。容量规划测试:估计未来增长所需资源量的过程。

    25110编辑于 2024-11-07
领券