首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Google :解释并发性的CPU利用率指标

Google :解释并发性的CPU利用率指标
EN

Stack Overflow用户
提问于 2022-06-05 19:24:16
回答 1查看 366关注 0票数 1

在关于并发性的GCR文档中,建议允许并发连接,除非您预期每个请求都会使CPU/RAM (https://cloud.google.com/run/docs/about-concurrency#concurrency-1)达到最大值。

我在解释“度量”图(下图)时遇到了困难。

问题:

  1. 这是否意味着我的请求占用了大约20%的CPU?图上是这么说的,但传说中的红线是95%:17%,对我来说没有任何意义。
  2. 如果是(即CPU的20% ),这是否意味着我可以安全地将并发性提高到4-5 (20% x5= 100%)?
  3. 如果我增加CPU的数量,那么对于单个请求,我会看到更好的性能,还是能够处理更多的请求?(我正在运行一个CPU密集型的机器学习任务。)也许,如果没有更多的细节,这是无法回答的,但如果有一个普遍的答案,那就去问吧。
  4. 在“修订”选项卡中,您可以选择“较慢的冷启动,但更有效的CPU使用”预览,但尚不清楚的是,每一个权衡的多少是.是否有人有具体的知识或经验“开始速度有多慢,处理速度有多快?”

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2022-06-06 08:03:06

回答你的问题:

  1. 是的,图表显示您的请求使用了大约20%的CPU。下面的图例意味着95%的时间,您的CPU使用率将在20%左右。
  2. 是的,您可以将并发性提高到最大的1000。您可以在并发值设置最大并发性(服务)上查看这些文档。并发性的默认值是80
  3. 我没有尝试过这一点,因为它将取决于请求的负载。在有些情况下,有单个请求的负载较轻或较重。
  4. 的最小实例数设置为1将减少冷启动的数量,因为当它在空闲状态下运行时,它可以为传入的请求提供服务。缺点是,这将引起费用,因为服务仍在运行。谷歌建议购买承诺使用折扣,因为这些费用是非常可预测的。有关最小实例的完整文档可以通过这个链接找到。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72510483

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档