00:00
嘿,你好,不知道你有没有察觉到,在软件测试这个行业里,有些东西正在悄悄的发生变化。嗯,表面上看起来我们好像还在做着差不多的事情,但实际上呢?AI的到来正在悄悄的把测试工程师的职业道路分成了两条完全不同的岔路。没错,虽然我们每天可能还是在写用力起bug,那两条完全不同的职业发展轨迹已经开始分道扬镳了。而且你知道吗,这个分叉点关键不在于你用的是什么新工具,而是在于你脑袋里的那个思维框架。这就是我们今天要聊的核心问题。说到底,真正决定你未来能走多远的,可能不是你会不会写更复杂的自动化脚本,而是你的思考方式、你的认知有没有跟上现在这些越来越复杂的系统的脚步。好的,那接下来咱们就一起聊聊4种非常关键的思维转变,而且更重要的是,我还会给你一些非常具体,马上就能用的上的行动建议,帮你在这条全新的职业道路上走的更快也更稳。好了,我们来看第一个转变,这个转变可以说是直接挑战了我们传统测试最根本的那个基石,也就是我们过去一直坚信的确定性。我们总觉得程序就应该像一台超级精密的机器一样,分毫不差。以前多简单啊,我们测试一个业务逻辑,输入A就必须得到输出B,不然那就是bug。但你现在想想,一个AI推荐系统,他今天给你推荐了这个,明天给你推荐了那个,这能算是个bug吗?当然不算了,对吧?所以这里的关键转变就是我们不能再死盯着那个唯一的正确输出了,而是要去理解他的行为到底合不合理。这就意味着我们提问题的方式得彻底变一遍了,我们问的不再是简单的通过还是失败,而是要去问。比如说这个模型在处理一些很偏很怪的边见数据的时候,性能会不会突然变得很差?有没有因为线上数据慢慢变了,也就是我们说的数据漂移导致它的推荐质量下降了,或者更深一点,它对不同的用户群体是不是存在着某种不公平的偏见?
01:45
这些才是新时代测试工程师需要去回答的问题。所以你看啊,如果你不从根上理解AI模型的这种行为特性,只是一个劲的去写更多的脚本,那感觉就像什么呢?就像在黑漆漆的屋子里,凭感觉挥拳头,力气花了不少,但可能根本没打中要害。所以说,思维的转变必须得走在行动前面。好,既然我们现在开始关注行为了,那下一个问题自然就来了,我们用什么来衡量和验证这些行为呢?这就引出了我们的第二个转变,这个转变会重新定义我们手里最有价值的测试资产。
02:16
这么说吧,我们过去辛辛苦苦一条一条攒下来的传统测试用例库,它的价值正在飞速下降,为什么?你想想看,你根本就不可能把一个大语言模型或者是一个推荐系统的所有正确的输入和输出给穷举出来,对吧?我们手工写的用例终究是有限的,但是真实世界的数据分布那几乎是无限的。这就带出了一个很重要的概念,叫做数据驱动测试。这是什么意思呢?简单来说就是我们要开始像一个数据工程师那样去思考问题了,我们要去分析我们手里的测试数据,它的分布合不合理,它的质量高不高,模型在不同的数据子集上表现有什么差异。所以请一定记住这句话,数据,它已经不再是什么辅助材料了,它就是我们下一代测试工程师最最核心的生产资料,谁能把数据玩儿明白,谁就掌握了通往未来的钥匙。
03:01
好了,现在我们有数据了,但光有数据还不够,我们海雷知道这些数据在系统里到底是怎么跑的,经历了些什么,这就要求我们必须做出第三个转变了,打破那个黑盒子的外壳,深入到系统内部去看一看。来,我们想象一个场景,你发现一个AI服务的响应时间变慢了。如果你用传统的黑盒测试方法,你最多只能发现,哦,它变慢了。但问题到底出在哪儿呢?是模型推理慢了,还是前面的特征工程出了问题?又或者是中间的向量召规层卡住了?光看API文档是绝对不够的,这种黑盒视角已经跟不上时代了。你看啊,一个AI请求的旅程,它可能要经过好多站,首先系统要从原始数据里提取有用的特征,然后它可能要去一个巨大的向量库里快速找到最相关的一些信息,也就是所谓的向量召回,再然后才把这些东西交给模型去计算,最后还得对模型输出的结果进行一些处理才能展示给你。我们必须得对每一步发生了什么都心里有数,才能再出问题的时候一针见血的找到根源。当你拥有了这种对系统的纵深理解之后,你的价值就变了。你不再只是一个找bug的人,你甚至能更早的参与到架构讨论里去,在设计阶段就能发现那些可能会影响产品质量的风险点,你的工作是从源头上让缺陷更难发生。
04:13
好,我们来总结一下,当你开始理解系统的行为,当你学会了用数据说话,当你能够看透整个系统的运作逻辑,你的角色自然而然就会发生第4个也是最关键的一个转变,从一个单纯的测试执行者升级成为一名质量架构师。咱们来看看这两者到底有什么区别。执行者通常是等开发说我做完了,然后才介入,每天最关心的就是这条用力跑过了吗?而质量架构师呢?他们从项目立项,从设计阶段就参与进来了,他们问的问题是我们这个功能的质量目标到底是什么?你看,一个人的影响力只在某个功能点,另一个人的影响力却能贯穿整个研发流程。我给你举个特别生动的例子,在一个大医院模型的项目里,一位质量架构师从一开始就把幻觉率,也就是模型胡说八道的比例定义成了整个项目的核心质量指标,这个标准从一开始就深深的嵌入到整个设计和开发过程里。结果怎么样呢?产品上线以后,因为幻觉导致的问题发生率远远低于行业平均水平,这个不是因为后期测试做的有多牛,而是因为好的质量架构从源头上就让问题胎死腹中了。想到这里,你心里可能会犯低谷,哎哟,我好像每天还在学用力跑回归,我是不是已经落后了?先别着急,别担心,我们今天聊的这一切,它是一种能力的演进,而不是对你过去技能的完全否定和取代。
05:21
你现在掌握的那些传统的测试技能非常非常重要,他们就像一栋大楼的地基,是你整个职业生涯的基石。我们现在要做的就是在这个无比坚实的地基之上,一层一层的去构建新的能力楼层。那么具体到底该怎么做呢?来这里有四件小事,你从今天,从下一个项目里就可以马上开始。第一,花点时间去理解你正在测试的模型,不用太深,但至少要知道它的基本原理和常见的失败模式。第二,开始用数据的眼光去审视你的测试集,问问自己他有没有偏差,有没有代表性,第三,主动去跟你上游或者下游的工程师聊聊天,扩展你的认知边界。第4,在下一个新项目中勇敢的去尝试提出一个你认为很关键的质量指标,每做一步,你对质量的理解都会更深一层,你的影响力也会更大一分。
06:06
你看,这条路其实是没有终点的,但你每一次的认知升级,都会让你在整个团队的协作网络里成为一个更重要、更不可或缺的节点。到那时,你就再也不只是那个找bug的人了,你会成为一个同时理解业务、数据、模型和系统的复合型专家。好了,最后我想留给你一个问题来思考一下,面对未来的这些挑战和机遇,你下一步打算为自己的能力大厦填上哪一块砖,建起哪一层楼呢?
我来说两句