我正在Linux上开发一个应用程序,我希望以特定频率回溯所有正在运行的线程.所以我的用户定义的信号处理程序SIGUSR1(对于所有线程)调用backtrace().
我在我的信号处理程序中发生崩溃(SIGSEGV),该处理程序源自backtrace()调用.我已经在大多数网站上指定了函数的正确参数.
http://linux.die.net/man/3/backtrace.
在这种情况下,什么可能使backtrace()崩溃?
要添加更多详细信息:
是什么让我得出结论崩溃在内部回溯是下面的第14帧. onMySignal是信号处理程序SIGUSR1,它调用backtrace.
onMySignal的示例代码是(从backtrace的linux文档中复制)
pthread_mutex_lock( &sig_mutex );
int j,nptrs;
#define SIZE 100
void *buffer[100] = {NULL};//or void *buffer[100];
char **strings;
nptrs = backtrace(buffer,SIZE);
pthread_mutex_unlock( &sig_mutex );
(gdb) where
#0 0x00000037bac0e9dd in raise () from
#1 0x00002aaabda936b2 in skgesigOSCrash () from
#2 0x00002aaabdd31705 in kpeDbgSignalHandler ()
#3 0x00002aaabda938c2 in skgesig_sigactionHandler ()
#4
希望这会更清楚问题..
@janneb
我已经在Mutex锁中编写了信号处理程序实现,以实现更好的同步.
@janneb
我没有在文档中找到指定API的backtrace_symbols / backtrace是否为async_signal_safe.以及它们是否应该在信号处理程序中使用.
我仍然从我的信号处理程序中删除了backtrace_symbols并且不在任何地方使用它..但我在backtrace()中崩溃的实际问题仍然存在.并且不知道它为什么会崩溃..
编辑23/06/11:更多细节:
(gdb) where
#0 0x00000037bac0e9dd in raise () from
#1 0x00002aaab98a36b2 in skgesigOSCrash () from
#2 0x00002aaab9b41705 in kpeDbgSignalHandler () from
#3 0x00002aaab98a38c2 in skgesig_sigactionHandler () from
#4
当realloc正在执行时,崩溃发生,其中一个地址就像0x00000000000007e0(看起来无效).
定义要从信号处理程序调用的安全函数列表,您不能使用任何其他函数,包括回溯. (在该文档中搜索async-signal-safe)
您可以做的是写入您之前设置的管道,并让一个线程等待该管道,然后执行回溯.
编辑:
好的,所以backtrace函数返回当前线程的堆栈,所以不能从另一个线程使用,所以我使用单独的线程来做回溯的想法是行不通的.
因此:您可以从信号处理程序中尝试backtrace_symbols_fd.
作为替代方案,您可以使用gdb来获取回溯,而无需在程序中包含代码 – 并且gdb可以轻松处理多个线程.
用于运行gdb并获取跟踪的Shell脚本:
#!/bin/bash
PID="$1"
[ -d "/proc/$PID" ] || PID=$(pgrep $1)
[ -d "/proc/$PID" ] || { echo "Can't find process: $PID" >&2 ; exit 1 ; }
[ -d "$TMPDIR" ] || TMPDIR=/tmp
BATCH=$(mktemp $TMPDIR/pstack.gdb.XXXXXXXXXXXXX)
echo "thread apply all bt" >"$BATCH"
echo "quit" >>"$BATCH"
gdb "/proc/$PID/exe" "$PID" -batch -x "$BATCH"