产品
产品中心
< 返回主菜单
产品

交换机

交换机所有产品
< 返回产品
交换机
查看交换机首页 >

无线

无线所有产品
< 返回产品
无线
查看无线首页 >

云桌面

云桌面产品方案中心
< 返回产品
云桌面
查看云桌面首页 >

安全

安全所有产品
< 返回产品
安全
查看安全首页 >
产品中心首页 >
行业
行业中心
< 返回主菜单
行业
行业中心首页 >

【SAM+案例详解】数据库自动备份功能失效

发布时间:2024-06-17
点击量:49

关键字:SAM+ 数据库自动备份、失效

故障现象描述

RG-SAM+ 数据库自动备份功能失效:开启自动备份功能,但对应磁盘下未生成备份数据库文件


故障排查分析

  1. SAM+每日凌晨2点定时任务会队列执行数据库备份等任务,具体执行结果会记录在运维日志里。
  1. 查看现场运维日志,发现定时任务只执行到某一天,之后就未打印执行日志。判断是此时定时任务异常了未执行,则需要进一步分析产品定时任务执行情况。
  2. 查看系统日志中有提示系统定时器超时而终止。(正常是提示“系统定时器执行完毕!”)

  3. 查看底层对应时间的LOG日志:
  4. LOG日志分析方法:先用“系统定时器超时而终止”过滤,在用“billingScheduler_Worker”任务线程去过滤

  5. 发现提示“系统定时器超时而终止“之前的一个任务:用户用网使用详情(时长)定时器执行时间过长,且结束时间为10:22,执行时间超过3小时,进而整个定时任务截止。
  6. 备注定时任务机制说明:5、6两个任务是在凌晨2点开始执行,到9点08秒截止,已开始的任务会继续执行完毕。
  7. 针对运维日志里“数据库定时任务”。如果有一个任务执行超过3小时,只停这一个任务,不会打印截止日志。
  8. 截止日志只对于开始新任务时判断时间是否超过9点08秒,超过了就打印截止,就比如下图,用户用网使用详情这个任务就没有执行直接被截止了。

  9. 针对用户用网使用详情(时长)定时器执行时间过长的可能原因分析:
备注:可以拿回现场数据库后台测试执行时间。
  1. 已检查现场服务器CPU内存满足安装要求,磁盘IO稳定在300M/S以上,数据库分配的最大可用内存是物理内存的一半,所以排除。
  2. 该任务是基于用户上网明细表做统计,将ONLINE_DETAIL统计这个表插入到AGGR_RECORD这个表里,需要检查索引是否有丢失,可以参考如下,有少的话说明有存在丢失,可以联系400获取解决对策。(客户现场通过核查也排除这一点)



故障根因说明

软件问题:
RG-SAM+ 数据库自动备份功能失效的根因是“凌晨2点的数据库自动备份”定时器被截断未正常执行,截断的原因是“用户用网使用详情定时器”定时器执行时间过长导致整个系统定时器截止,执行时间过长的原因是该任务聚合逻辑存在缺陷,在大数据情况下执行非常慢,超过产品限制的3小时。


故障解决方案

更新补丁:将原来只有1个线程执行凌晨定时任务调整为3个线程并行处理,提升执行速率
该补丁已合并至4.22P6标准版本,若是4.22P3版本需要打上补丁合集20231025及以上(补丁下载

如遇故障无法定位解决可转:售后闪电兔 处理

返回顶部

请选择服务项目
关闭咨询页
售前咨询 售前咨询
售前咨询
售后服务 售后服务
售后服务
意见反馈 意见反馈
意见反馈
更多联系方式
是否找到您想要的内容?
您遇到了什么问题?
找不到想要的信息
筛选功能不好用
加载速度太慢
页面体验差
提交
您是否找到了与产品相关的文档
筛选功能是否帮助您更快找到所需的文档?
有帮助
一般
没有帮助
没用过
请问您遇到了什么问题?
需要填写的内容太多
有些信息不懂怎么填
页面有问题/错误
其他
确定
这些客户案例是否对您有帮助?
非常有帮助
比较有帮助
没有帮助
请您对这个客户案例进行评价
兴趣度
相关性
可信度
确定
感谢您的反馈!
感谢您的反馈!