首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >influxDB聚合查询慢、cpu占用率高

influxDB聚合查询慢、cpu占用率高
EN

Stack Overflow用户
提问于 2019-05-14 02:19:09
回答 1查看 567关注 0票数 1

我们有一个非常恼人的InfluxDB问题(没有集群)。我们的InfluxDB版本是1.7。

作为我们业务需求的一部分,我们存储事件的点(或数据)。我们时不时地会有峰值(一天大约有2000万次事件)。

我们有两个键的标签- tag1,tag2和键值- value1。

我们运行后的基数:

代码语言:javascript
复制
SHOW SERIES CARDINALITY ON db1

是24。

具体来说,对于这个具有2000万个点的度量'measurement1‘,我们只有一个系列(我们只有一对关键字tag1和tag2的值):

代码语言:javascript
复制
measurement1,tag1=tag1value,tag2=tag2value

现在,正如我所说的,如果在选定的一段时间内,我们可以拥有高达2000万点。

代码语言:javascript
复制
SELECT SUM(someDoubleValue) AS result 
FROM measurement1 
WHERE time > '2019-04-15T21:00:00Z' 
  AND time < '2019-05-17T20:59:59.999Z' 
  AND (tag1 = '1234567') 
GROUP BY time(30d, 21h) FILL(0);

这个查询在6-7秒后返回,但它消耗了80-100%的cpu。

现在基数是低的(也许我可能错了--有没有其他方法来验证我们的基数是低的?)。

我们想要解决的另一个问题是,在我们的一些流程中,我们可以并行调用2-3个这样的查询。当然,这会导致它们全部失败(我们的客户端超时)。

我们试图弄清楚这是否是分片问题--我们使用的默认分片是1周,所以我们不认为查询2个月应该是个问题。

我们增加了机器的功率,但没有运气-从i3-large到i3-xlarge (AWS)。

我们正在尝试找出这是InfluxDB中的一个问题,还是我们测量的一些错误配置。

EN

回答 1

Stack Overflow用户

发布于 2019-05-16 03:39:14

您使用的是tsm索引吗?我们的tsi索引提供了性能改进,这可能会有所帮助。

https://docs.influxdata.com/influxdb/v1.7/concepts/tsi-details/

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56117854

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档