上下文:我们有一些很少调用任何后端服务的特性,并且逻辑停留在前端。
我们拥有的大多数工具都可以根据延迟和服务器端返回的错误代码计算SLI/SLO状态,但是现在由于应用程序的前端很重,我们主要是根据用户报告手动跟踪bug。
我们正在尝试添加一些服务来跟踪最终用户的交互,并希望我们能够收集一些指标,例如点击次数。
主要问题是:为前端应用程序收集什么好的度量标准?
我认为分析bug罚单、用户反馈和调查也是很好的方法,但我正在寻找一些“黑匣子”度量标准,因此我们可以根据这些指标设置某种警报,通知我们的团队在bug罚单到来之前派人进行调查。
发布于 2023-03-15 18:15:03
这里有一些分析工具,您可能对此感兴趣:
如果您监视这些,您可以设置自动警报时,有异常,如突然增加的前端错误,可能是由于更改您的应用程序的最新版本。
愤怒点击和死死点击表明可用性问题。
如果整个应用程序运行在前端,而不与后端服务通信,那么您可能会期望时间非常快,但是如果操作时间超过几毫秒,这肯定会带来惊喜!
除此之外,还将跟踪与应用程序相关的业务指标。你希望人们会因为这个应用程序而做些什么吗?有多少/有多大比例的用户做你想做的事情?
新版本的应用程序在技术上可能很棒,但如果用户停止做你希望做的事情,它可能需要回滚,以保持您的业务运作。
举个例子,如果你运行了一个酒店预订网站,并发布了对结果排序的更改,它可以减少酒店预订的数量或价值,如果你不回到旧的排序,就会让你停业。
https://devops.stackexchange.com/questions/16002
复制相似问题