我最初的碳存储模式配置设置为10s:1w,60s:1y,并且在几个月内一直运行良好。我最近把它更新为1s:7d,10s:30d,60s,1y。我使用下面的bash代码调整了所有密谈文件的大小,以反映新的保留模式:
collectd_dir="/opt/graphite/storage/whisper/collectd/"
retention="1s:7d 1m:30d 15m:1y"
find $collectd_dir -type f -name '*.wsp' | parallel whisper-resize.py \
--nobackup {} $retention \;我已经确认它们已经使用whisper-info.py使用正确的保留和数据点进行了更新。我还使用存储模式验证脚本确认了存储模式是有效的。
carbon-cache{1..8}、carbon-relay、carbon-aggregator和collectd服务在密语调整大小之前已停止,然后在调整大小完成后启动。
然而,当在Grafana仪表板上签入时,我看到的是collectd插件图表上有正确数据点(每秒,但没有数据)的空图;但对于提供数据的图表,它每10秒(旧保留时间)显示一次数据和数据点,而不是1秒。
/var/log/log/console.log看起来不错,收集的密谈文件都有carbon用户访问权限,所以在写入时不会出现权限拒绝问题。
在石墨主机的端口2003上运行ngrep时,我看到与中继的连接,以及正在发送的指标。然后,这些指标将被中继到8个缓存的池中,以连接到他们的pickle端口。
是否有其他人遇到过类似的问题,或者可以帮助我进一步诊断问题?我是不是漏掉了什么?
发布于 2019-07-17 03:08:01
所以我花了一段时间才弄明白。与一些旧的响应一样,它与local_settings.py文件没有任何关系,但它与collectd.conf中的Interval函数有关。
很多老版本的回复都提到需要在每个插件容器中包含“Interval 1”。我认为,由于对每个指标的控制,这将是很棒的。但是,这会在我的日志中创建配置错误,并破坏指标。在配置的顶层设置“间隔1”解决了我的问题。
https://stackoverflow.com/questions/57013212
复制相似问题