我正准备对各种货架产品进行一系列性能比较。
我需要做什么才能在测试中显示可信度?我如何设计我的基准测试,使它们是可敬的?
对于测试的实际设计,我也很感兴趣。在不影响测试的情况下加载数据的方法(海森伯格测不准原理),或者监控数据的方法……等
发布于 2010-09-18 11:31:22
在不知道您正在尝试评估的是哪种“现成”产品的情况下,回答这个问题有点棘手。您是否在寻找UI响应性、吞吐量(例如,电子邮件、事务/秒)、启动时间等-所有这些都有不同的标准来衡量您应该跟踪什么,以及不同的测试或评估工具。但要回答你的一些一般性问题:
还要尝试消除任何环境可变性的来源或可能的噪声源。如果你正在做一些网络密集型的事情,考虑隔离网络。尝试禁用任何您不关心的服务或应用程序。限制任何类型的磁盘IO、内存密集型操作等。如果磁盘IO可能会在CPU受限的情况下引入噪音,请考虑使用SSD。
在设计测试时,请牢记可重复性。如果您正在进行某种类型的微基准测试(例如,perf单元测试),那么让您的基础架构支持完全相同地运行n次相同的操作。如果你在驱动UI,尽量不要在物理上驱动鼠标,而是使用底层的可访问层(MSAA、UIAutomation等)以编程的方式直接点击控件。
再说一次,这只是一般性的建议。如果你有更多的细节,我可以尝试跟进更多相关的指导。
享受吧!
发布于 2010-09-19 05:33:49
你的问题很有趣,但有点含糊,因为如果不知道要测试什么,就不容易给你一些线索。
您可以从许多不同的角度测试性能,然后,根据库的使用或目标,您应该尝试一种或另一种方法;我将尝试列举一些您可能需要考虑的测量事项:
工具:
发布于 2010-09-08 23:25:09
你为什么要关心表演呢?在这两种情况下,将消息写入存储日志的位置所需的时间将比其他任何情况都要慢得多。
如果您真的在执行匹配日志记录,那么您可能需要对日志文件进行索引,以便能够找到所需的日志条目,此时您不是在执行标准日志记录。
https://stackoverflow.com/questions/3669107
复制相似问题