这是一个面试问题.
开发人员开始了一个过程.
但是当客户想要使用该流程时,他发现流程没有运行.
开发人员登录后发现该进程已经死亡.开发人员怎么知道出了什么问题?
跟进:一个正在运行的进程,它应该将日志写入文件.但是文件中没有日志.开发人员如何弄清楚流程中发生了什么?
我认为 :
如果程序可以重新运行,我将使用gdb来跟踪该过程.
如果没有,请检查进程(应用程序)中的输出文件.
或者,在代码中添加print.
解决方法
如果您有磁盘空间和备用cpu电源,则可以在程序后面留下
strace
以捕获导致退出的序列.
如果程序在没有留下任何痕迹的情况下死亡,一个可能的原因是Out-Of-Memory (OOM) killer.如果它终止了你的进程,这将在内核日志中留下一条消息.
从同一个答案中,可以修改process accounting,通过告诉退出代码和退出时间来提供一些线索.