首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >BareOS BackupCatalog作业已被终止,RunAfterJob未运行

BareOS BackupCatalog作业已被终止,RunAfterJob未运行
EN

Server Fault用户
提问于 2019-12-04 06:53:12
回答 1查看 189关注 0票数 1

这看起来很奇怪。我使用巴库拉( Bacula )和现在的BareOS已经有十多年了,但是现在有一个系统会有奇怪的行为,我不知道为什么和如何修复。

当它运行日常备份时,它可以正常工作,直到到达BackupCatalog作业,该作业被配置为在所有其他操作之后运行。

此作业看起来已成功终止(JobStatus=T在list jobs表中):

代码语言:javascript
复制
*list jobs
...
+-------+---------------+--------------+---------------------+------+-------+----------+-----------------+-----------+
| JobId | Name          | Client       | StartTime           | Type | Level | JobFiles | JobBytes        | JobStatus |
+-------+---------------+--------------+---------------------+------+-------+----------+-----------------+-----------+
...
| 5,475 | BackupCatalog | kantor-fd    | 2019-12-04 02:56:40 | B    | F     |       21 |      27,364,860 | T         |
+-------+---------------+--------------+---------------------+------+-------+----------+-----------------+-----------+

但是,在messages和日志文件中,我看不到上次作业的通常摘要。日志文件的结束方式如下:

代码语言:javascript
复制
19-Nov 02:32 kantor-dir JobId 5398: shell command: run BeforeJob "/usr/lib/bareos/scripts/make_catalog_backup.pl Kantor"
19-Nov 02:33 kantor-dir JobId 5398: Start Backup JobId 5398, Job=BackupCatalog.2019-11-18_23.10.00_10
19-Nov 02:33 kantor-dir JobId 5398: Using Device "FileStorage" to write.
19-Nov 02:33 kantor-sd JobId 5398: Volume "Kantor-2018-01-08_08:48:50" previously written, moving to end of data.
19-Nov 02:33 kantor-sd JobId 5398: Ready to append to end of Volume "Kantor-2018-01-08_08:48:50" size=4716094462
19-Nov 02:33 kantor-sd JobId 5398: Elapsed time=00:00:05, Transfer rate=5.663 M Bytes/second

仅此而已。注意,RunAfterJob脚本似乎没有被执行。但是,如果我手动执行它,它就能工作(导出的目录数据库文件会被删除)。然而,这并不是RunAfterJob脚本的唯一工作。

我希望它最终能展示出这样的东西。所有其他工作都有:

代码语言:javascript
复制
19-Nov 02:32 kantor-dir JobId 5397: Bareos kantor-dir 16.2.6 (02Jun17):
  Build OS:               x86_64-pc-linux-gnu debian Debian GNU/Linux buster/sid
  JobId:                  5397
  Job:                    FTP.2019-11-18_23.05.00_09
...
  FD termination status:  OK
  SD termination status:  OK
  Termination:            Backup OK

19-Nov 02:32 kantor-dir JobId 5397: Begin pruning Jobs older than 1 month 10 days .
...

此外,董事的地位看起来很奇怪:

代码语言:javascript
复制
*status dir
kantor-dir Version: 16.2.6 (02 June 2017) x86_64-pc-linux-gnu debian Debian GNU/Linux buster/sid
Daemon started 03-Dec-19 11:10. Jobs: run=4, running=1 mode=0 db=mysql
 Heap: heap=135,168 smbytes=222,459 max_bytes=236,758 bufs=543 max_bufs=594

Scheduled Jobs:
...
====

Running Jobs:
Console connected at 04-Dec-19 09:03
 JobId Level   Name                       Status
======================================================================
  5475 Full    BackupCatalog.2019-12-03_23.10.00_08 has terminated
====

Terminated Jobs:

 JobId  Level    Files      Bytes   Status   Finished        Name 
====================================================================
...
  5471  Incr      6,591    7.499 G  OK       03-Dec-19 23:15 termsrv
  5472  Incr        427    11.37 G  OK       03-Dec-19 23:44 1C
  5473  Incr          3    3.198 G  OK       04-Dec-19 02:56 Oracle
  5474  Incr      5,797    2.600 G  OK       04-Dec-19 02:56 FTP


Client Initiated Connections (waiting for jobs):
...
====

也就是说,所述职务列在“运行中的作业”中,但它表示已被终止。它没有列在“终止的工作”中,就好像导演还有什么要做的。

它在这个州吊死了六个小时。我还看到了一些与时间有关的奇怪之处(表中和日志文件中的StartTime与日志文件中的时间不同,但是,系统date和MySQL的select NOW();是同步的)。

重新启动董事后,董事状态看起来更合适:

代码语言:javascript
复制
Running Jobs:
Console connected at 04-Dec-19 09:06
No Jobs running.
====
No Terminated Jobs.

这一切是两周前开始的。如果我把它挂起,下面所有的计划作业都将无限期地等待这个被卡住的作业,这意味着不会执行任何备份。

我觉得这可能是这个作业的RunAfterJob脚本的问题,但它是标准的附带脚本。如果我牵着手跑进去,它就能用了。作业定义本身也是标准的,唯一的修改是我在FileSet中添加了FileSet,但是每次都这样做,这不会造成任何问题。

要找什么?怎么修?

更新:

问题消失了。我不明白,为什么。备份至少工作两天。似乎什么都没有卡住。

EN

回答 1

Server Fault用户

回答已采纳

发布于 2022-02-05 19:46:01

它似乎被配置为在BackupCatalog作业的备份结束时通过电子邮件发送引导文件:

代码语言:javascript
复制
Write Bootstrap = "|/usr/bin/bsmtp -h localhost -f \"\(Bareos\) \" -s \"Bootstrap for Job %j\" root@localhost"

如果没有配置在服务器上发送的电子邮件,它就会卡住。如果邮件发送被阻碍,但后来在服务器外被修复,它将突然解除,没有可见的迹象,什么是改变。那似乎是我的案子。

通过删除此Write Bootstrap,完全避免了问题。(该作业将编写在JobDefs-referenced DefaultJob模板中配置的本地引导文件。)

这是BareOS的一个缺陷,它没有解释什么可能出错,也没有将其记录为问题并更进一步。它只是乱七八糟。这太糟糕了。不是一个遗憾,它也是这样配置的,在默认情况下。

票数 0
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/994232

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档