我有一台
Linux机器,可以运行~10个内部编写的进程.
每隔一天(!)机器完全耗尽RAM,进入交换并变得无响应.这种情况在几秒钟内很快就会发生,所以坐下来观察机器直到它死亡是不可行的.这是一个突然的泄漏,而不是一个渐进的泄漏,所以top(1)并没有给出任何可能发生的坏事.
确定哪些进程导致问题的最佳方法是什么?
解决方法
你可以考虑禁用内存过量使用,这样内核就会杀掉泄漏进程而不是机器.
您可以使用以下两个sysctl禁用overcommit:
vm.overcommit_ratio=60 vm.overcommit_memory=2
第一个数字取决于你有多少内存和多少交换.
分配限制将是:
amount_of_swap + overcommit_ratio/100 * amount_of_ram