文章/答案/技术大牛

发布

社区首页 >问答首页 >在上看到502

问在上看到502
EN

Server Fault用户

提问于 2019-01-28 22:44:25

回答 1查看 11.1K关注 0票数 4

我在上看到了很多502个“坏网关”错误。很难在下面的图表上看到(颜色非常相似，我不知道如何改变它们)，但这是我过去6个小时的流量：

暗红色线代表5xx错误。他们今天早上9:30开始工作，12点半左右平静下来。但在这3个小时内，nginx一直在返回502 Bad Gateway。然后它就停止了。

在此期间，试图改变行为的我对代码的唯一提交是将每个实例从内存的0.5增加到1G，并在大约404个响应上增加缓存TTL。我也是添加了活性检查，这样nginx就能知道什么时候应用服务器坏了。

我查看了nginx的错误日志，看到了一堆这样的内容：

failed (111: Connection refused) while connecting to upstream

我进行了三次检查，我所有的应用服务器都运行在8080端口上，所以我排除了这一点。我在想，也许活性检查可以帮助应用程序引擎知道什么时候重新启动需要它的服务器，但是我没有从应用服务器的stdout日志中看到任何显示它们中的任何一个是坏的。

这会是应用程序引擎的某种错误吗？

编辑@9:17pPST:下面是我的app在过去24小时的流量的图片，并尽量减少对应用程序的代码更改。我高亮显示了5xx的尖峰，这样你就能更清楚地看到它们。

google-app-engine

nginx

google-cloud-platform

node.js

回答 1

Server Fault用户

发布于 2019-04-04 18:13:18

不幸的是，502个错误激增的原因有很多，例如：

后端实例需要比后端服务超时更长的时间来响应，这意味着应用程序被重载，或者后端服务超时设置得太低。
前端无法建立到后端实例的连接。
前端无法识别要连接到的可行后端实例。(所有后端的健康检查都失败)

要获得更多信息，您需要对来自云控制台的502错误进行查看堆栈驱动程序。

下一次出现峰值时，您可以检查的是如果502错误是由您的健康检查给出假阳性引起的。还有另一个服务器故障邮政也有同样的问题，可以让您知道更多。如果是这样的话，您可能需要研究如何增加实例的磁盘空间。

为了避免进一步的尖峰，我建议您在app.yaml文件中添加就绪检查以及活性检查，这样在实例完全准备好接受它之前，它不会得到任何通信量。您可能已经看过了，但是这是文件用于添加就绪检查

要检查的最后一件事是，与所有流量相比，具有峰值的流量百分比是否低于二语习得。

票数 3

页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://serverfault.com/questions/951189

复制

相似问题

问在上看到502
EN

回答 1

Server Fault用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在上看到502EN

回答 1

Server Fault用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在上看到502
EN