首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Ganglia - gmetad -过程被SIGSEGV终止

Ganglia - gmetad -过程被SIGSEGV终止
EN

Stack Overflow用户
提问于 2016-10-20 18:46:25
回答 1查看 895关注 0票数 0

在过去的几天里,我开始看到这个问题。节段性断层( SIGSEGV )在启动后5分钟内终止。

这是稳定的,因为最近几个months..so不确定什么改变。

代码语言:javascript
复制
Version - gmetad 3.7.1

/var/log/messages/var/log/中,我没有看到任何核心转储或特定于gmetad的任何内容。

此事件发生时(从顶部)系统快照

代码语言:javascript
复制
load average: 1.97, 0.99, 0.42

内存看起来也很好

代码语言:javascript
复制
 free -m
             total       used       free     shared    buffers     cached
Mem:          7989       3624       4364          0        333       2562
-/+ buffers/cache:        728       7260
Swap:         4095          0       4095

我有一个超能力的程序,它可以观察和观察gmetad -

这是主管的日志

代码语言:javascript
复制
2016-10-20 14:34:55,707 INFO exited: gmetad (terminated by SIGSEGV; not expected)
2016-10-20 14:34:55,707 INFO received SIGCLD indicating a child quit
2016-10-20 14:34:57,712 INFO spawned: 'gmetad' with pid 24561
2016-10-20 14:34:59,929 INFO exited: gmetad (terminated by SIGSEGV; not expected)
2016-10-20 14:34:59,929 INFO received SIGCLD indicating a child quit
2016-10-20 14:35:02,932 INFO spawned: 'gmetad' with pid 24593
2016-10-20 14:35:04,897 INFO exited: gmetad (terminated by SIGSEGV; not expected)
2016-10-20 14:35:04,897 INFO received SIGCLD indicating a child quit
2016-10-20 14:35:08,903 INFO spawned: 'gmetad' with pid 24618
2016-10-20 14:35:11,257 INFO exited: gmetad (terminated by SIGSEGV; not expected)
2016-10-20 14:35:11,257 INFO received SIGCLD indicating a child quit
2016-10-20 14:35:12,257 INFO gave up: gmetad entered FATAL state, too many start retries too quickly

有谁特别遇到过gmetad这样的问题吗?感谢你的指点。

EN

回答 1

Stack Overflow用户

发布于 2016-10-20 21:14:57

我找到了问题并解决了。

一些关键步骤/调查结果-

  1. 将gmetad.conf中的‘gmetad.conf’更改为>1,以便在前台运行gmetaa,并将详细的日志显示在它所做的事情上。
  2. 我发现gmetad进程在一个完全相同的点被杀死-当它试图处理特定data_source的特定节点的文件时。
  3. 您可以注释掉gmetad.conf中的所有其他‘gmetad.conf’,并尝试隔离哪个data_source->节点有问题。
  4. 在找出有问题的节点之后,我只是删除了/path/to/rrd/ node _ dir /file_with或整个dir本身。(需要找到更好的方法,因为这是数据丢失)
  5. 更改回debug_level并重新启动gmetad!

在我的例子中,为了指出文件名- 'part_max_used.rrd‘是/path/ to /ganglia/rrds/node_name下的文件名,是SIGSEGV的根本原因。

希望这有帮助-)

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40162219

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档