热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

dddlinux调试工具_大佬干货|Linux后台开发常用调试工具

01总览编译阶段nm获取二进制文件包含的符号信息strings获取二进制文件包含的字符串常量strip去除二进制文件包含的符号readelf显示目标文件详细信息objdump尽可能

ec9715578dca90aba4915306ecf336f2.png

01 总览

编译阶段

  • nm                 获取二进制文件包含的符号信息
  • strings           获取二进制文件包含的字符串常量
  • strip               去除二进制文件包含的符号
  • readelf           显示目标文件详细信息
  • objdump         尽可能反汇编出源代码
  • addr2line        根据地址查找代码行

运行阶段

  • gdb                强大的调试工具
  • ldd                 显示程序需要使用的动态库和实际使用的动态库
  • strace            跟踪程序当前的系统调用
  • ltrace             跟踪程序当前的库函数
  • time               查看程序执行时间、用户态时间、内核态时间
  • gprof              显示用户态各函数执行时间
  • valgrind          检查内存错误
  • mtrace           检查内存错误

其他

  • proc文件系统
  • 系统日志

02 编译阶段

nm(获取二进制文件里面包含的符号)

符号:函数、变量

参数:

  • -C           把C++函数签名转为可读形式
  • -A           列出符号名的时候同时显示来自于哪个文件。
  • -a           列出所有符号(这将会把调试符号也列出来。默认状态下调试符号不会被列出)
  • -l            列出符号在源代码中对应的行号(指定这个参数后,nm将利用调试信息找出文件名以及符号的行号。对于一个已定义符号,将会找出这个符号定义的行号,对于未定义符号,显示为空)
  • -n           根据符号的地址来排序(默认是按符号名称的字母顺序排序的)
  • -u           只列出未定义符号

strings(获取二进制文件里面的字符串常量)

功能:

获取二进制文件里面的字符串常量

用途:

比较重要的是检查KEY泄露

eg:strings | grep '^.\{16\}$' 查找中是否存在一行有16个字符的行,并显示出来。

选项:

  • -a 不只是扫描目标文件初始化和装载段, 而是扫描整个文件。
  • -f 在显示字符串之前先显示文件名。
  • -n min-len打印至少min-len字符长的字符串.默认的是4。

#strings /lib/tls/libc.so.6 | grep GLIBC
GLIBC_2.0
GLIBC_2.1
GLIBC_2.1.1
……

这样就能看到glibc支持的版本。

strip(去除二进制文件里面包含的符号)

用途:

可执行程序减肥(通常只在已经调试和测试过的生成模块上,因为不能调试了)

反编译、反跟踪

readelf(显示目标文件详细信息)

nm 程序可用于列举符号及其类型和值,但是,要更仔细地研究目标文件中这些命名段的内容,需要使用功能更强大的工具。其中两种功能强大的工具是objdump和readelf。

readelf工具使用来显示一个或多个ELF格式文件信息的GNU工具。使用不同的参数可以查看ELF文件不同的的信息。

readelf

  • -a           显示所有ELF文件的信息
  • -h           显示ELF文件的文件头
  • -l            显示程序头(program-header)和程序段(segment)和段下面的节
  • -S           显示较为详细的节信息(section)
  • -s           显示符号信息,
  • -n           显示标识信息(如果有)
  • -r            显示重定位信息(如果有)
  • -u           显示展开函数信息(如果有)
  • -d           显示动态节信息,一般是动态库的信息

objdump(尽可能反汇编出源代码)objdump –S

尽可能反汇编出源代码,尤其当编译的时候指定了-g参数时,效果比较明显。

addr2line(根据地址查找代码行)

当某个进程崩溃时,日志文件(/var/log/messages)中就会给出附加的信息,包括程序终止原因、故障地址,以及包含程序状态字(PSW)、通用寄存器和访问寄存器的简要寄存器转储。

eg:Mar 31 11:34:28 l02 kernel: failing address: 0

如果可执行文件包括调试符号(带-g编译的),使用addr2line,可以确定哪一行代码导致了问题。

eg:addr2line –e exe addr

其实gdb也有这个功能,不过addr2line的好处是,很多时候,bug很难重现,我们手上只有一份crash log。这样就可以利用addr2line找到对应的代码行,很方便。

注意:

  1. 该可执行程序用-g编译,使之带调试信息。
  2. 如果crash在一个so里面,那addr2line不能直接给出代码行。

参数:

  • -a     在显示函数名或文件行号前显示地址
  • -b     指定二进制文件格式
  • -C     解析C++符号为用户级的名称,可指定解析样式
  • -e     指定二进制文件
  • -f      同时显示函数名称
  • -s     仅显示文件的基本名,而不是完整路径
  • -i      展开内联函数
  • -j      读取相对于指定节的偏移而不是绝对地址
  • -p     每个位置都在一行显示

03 运行阶段

调试程序的常见步骤:

1、确定运行时间主要花在用户态还是内核态(比较土的一个方法:程序暂时屏蔽daemon()调用,hardcode收到n个请求后exit(0),time一下程序……)。

2、如果是用户态,则使用gprof进行性能分析。

3、如果是内核态,则使用strace进行性能分析,另外可以使用其他工具(比如ltrace等)辅助。

ldd(显示程序需要使用的动态库和实际使用的动态库)

# ldd /bin/ls
linux-gate.so.1 =>  (0xbfffe000)
librt.so.1 => /lib/librt.so.1 (0xb7f0a000)
libacl.so.1 => /lib/libacl.so.1 (0xb7f04000)
libc.so.6 => /lib/libc.so.6 (0xb7dc3000)
libpthread.so.0 => /lib/libpthread.so.0 (0xb7dab000)
/lib/ld-linux.so.2 (0xb7f1d000)
libattr.so.1 => /lib/libattr.so.1 (0xb7da6000)

第一栏:需要用什么库;第二栏:实际用哪个库文件;第三栏:库文件装载地址。

如果缺少动态库,就会没有第二栏。

strace(跟踪当前系统调用)

结果默认输出到2。

  • -p  attach到一个进程
  • -c 最后统计各个system call的调用情况
  • -T 打印system call的调用时间
  • -t/-tt/-ttt 时间格式
  • -f/-F 跟踪由fork/vfork调用所产生的子进程
  • -o ,将strace的输出定向到file中。

如:strace -f -o ~/

  • -e expr 指定一个表达式,用来控制如何跟踪,格式如下:
  • -e open等价于-e trace=open,表示只跟踪open调用

使用 strace –e open ./prg 来看程序使用了哪些配置文件或日志文件,很方便。

  • -e trace= 只跟踪指定的系统调用

例如:-e trace=open,close,rean,write 表示只跟踪这四个系统调用.

  • -e trace=file只跟踪有关文件操作的系统调用
  • -e trace=process只跟踪有关进程控制的系统调用
  • -e trace=network跟踪与网络有关的所有系统调用
  • -e strace=signal 跟踪所有与系统信号有关的系统调用
  • -e trace=ipc跟踪所有与进程通讯有关的系统调用

ltrace(跟踪当前库函数)

参数和strace很接近

time(查看程序执行时间、用户态时间、内核态时间)

# time ps aux | grep 'hi'
1020 21804 0.0 0.0 1888 664 pts/6 S+ 17:46 0:00 grep hi
real 0m0.009s
user 0m0.000s
sys 0m0.004s

注意:

time只跟踪父进程,所以不能fork

gprof(显示用户态各函数执行时间)

gprof原理:

在编译和链接程序的时候(使用 -pg 编译和链接选项),gcc在你应用程序的每个函数中都加入了一个名为mcount(or“_mcount”, or“__mcount”)的函数,也就是说-pg编译的应用程序里的每一个函数都会调用mcount, 而mcount会在内存中保存一张函数调用图,并通过函数调用堆栈的形式查找子函数和父函数的地址。这张调用图也保存了所有与函数相关的调用时间,调用次数等等的所有信息。

使用步骤:

1、使用 -pg 编译和链接应用程序

gcc -pg -o exec exec.c

如果需要库函数调用情况:

gcc -lc_p -gp -o exec exec.c

2、执行应用程序使之生成供gprof 分析的数据gmon.out

3、使用gprof 程序分析应用程序生成的数据

gprof exec gmon.out > profile.txt

注意:

程序必须通过正常途径退出(exit()、main返回),kill无效。对后台常驻程序的调试——我的比较土方法是,屏蔽daemon()调用,程序hardcode收到n个请求后exit(0)。

有时不太准。

只管了用户态时间消耗,没有管内核态消耗。

gdb core exec (gdb查看core文件) 准备生成core:

启动程序前,ulimit -c unlimited,设置core文件不限制大小。(相反,ulimit -c 0,可以阻止生成core文件)

默认在可执行程序的路径,生成的是名字为core的文件,新的core会覆盖旧的。

设置core文件名字:

/proc/sys/kernel/core_uses_pid 可以控制产生的core文件的文件名中是否添加pid作为扩展,1为扩展,否则为0。

proc/sys/kernel/core_pattern 可以设置格式化的core文件保存位置或文件名,比如原来文件内容是core,可以修改为:

echo "/data/core/core-%e-%p-%t" > core_pattern

以下是参数列表:

  • %p - insert pid into filename 添加pid
  • %u - insert current uid into filename 添加当前uid
  • %g - insert current gid into filename 添加当前gid
  • %s - insert signal that caused the coredump into the filename 添加导致产生core的信号
  • %t - insert UNIX time that the coredump occurred into filename 添加core文件生成时的unix时间
  • %h - insert hostname where the coredump happened into filename 添加主机名
  • %e - insert coredumping executable name into filename 添加命令名

使用gdb查看core:

gdb

opprofile (查看CPU耗在哪)

常用命令

使用oprofile进行cpu使用情况检测,需要经过初始化、启动检测、导出检测数据、查看检测结果等步骤,以下为常用的oprofile命令。

初始化

  • opcontrol --no-vmlinux : 指示oprofile启动检测后,不记录内核模块、内核代码相关统计数据
  • opcontrol --init : 加载oprofile模块、oprofile驱动程序

检测控制

  • opcontrol --start : 指示oprofile启动检测
  • opcontrol --dump : 指示将oprofile检测到的数据写入文件
  • opcontrol --reset : 清空之前检测的数据记录
  • opcontrol -h : 关闭oprofile进程

查看检测结果

  • opreport : 以镜像(image)的角度显示检测结果,进程、动态库、内核模块属于镜像范畴
  • opreport -l : 以函数的角度显示检测结果
  • opreport -l test : 以函数的角度,针对test进程显示检测结果
  • opannotate -s test : 以代码的角度,针对test进程显示检测结果
  • opannotate -s /lib64/libc-2.4.so : 以代码的角度,针对libc-2.4.so库显示检测结果

linux # opreport
CPU: Core 2, speed 2128.07 MHz (estimated) Counted CPU_CLK_UNHALTED events (Clock cycles when not halted) with a unit mask of 0x00 (Unhalted core cycles) count 100000CPU_CLK_UNHAL
T.........|   samples |           %| ------------------------   31645719     87.6453      no-vmlinux       4361113     10.3592      libend.so       7683      0.1367      libpython2.4.so.1.0        7046      0.1253      op_test

valgrind(检查内存错误)

使用步骤:

1、官网下载并安装valgrind。

2、-g编译的程序都可以使用。

官网的示例代码test.c

#include 
void f(void){
  int* x = malloc(10 * sizeof(int));
  x[10] = 0;        // problem 1: heap block overrun
}                    // problem 2: memory leak -- x not freed

int main(void){
  f();
  return 0;
}

编译程序gcc -Wall -g -o test test.c

3、valgrind启动程序,屏幕输出结果。

valgrind --tool=memcheck --leak-check=full ./test

注意:

valgrind只能查找堆内存的访问错误,对栈上的对象和静态对象没办法。

valgrind会影响进程性能,据说可能慢20倍,所以在性能要求高的情况下,只能使用mtrace这种轻量级的工具了(但是mtrace只能识别简单的内存错误)。

如果程序生成的core的堆栈是错乱的,那么基本上是stackoverflow了。这种情况,可以通过在编译的时候,加上 –fstack-protector-all 和 -D_FORTIFY_SOURCE=2 来检测。Stack-protector-all 会在每个函数里加上堆栈保护的代码,并在堆栈上留上指纹。(记录下,没用过)

因为valgrind 查不了栈和静态对象的内存访问越界,这类问题,可以通过使用gcc的-fmudflap –lmudflap 来检测。(记录下,没用过)

全局变量的类型不一致的问题,现在还找到比较好的方法,这从另一个方面说明全局对象不是个好的设计,这给调试带来了麻烦。

mtrace(检查内存错误)

mtrace是glibc內提供的工具,原理很简单,就是把你程序中malloc()和free()的位置全部下來,最后两辆配对,沒有配对到的就是memory leak。

使用的步骤如下:

1、代码中添加mtrace()

#include 
#include 
int main(void){
  int *p;
  int i;
#ifdef DEBUG
  setenv("MALLOC_TRACE", "./memleak.log", 1);
  mtrace();
#endif
  p=(int *)malloc(1000);
  return 0;
}

这段代码malloc了一个空间,却沒有free掉。我们添加9-12行的mtrace调用。

2、编译gcc -g -DDEBUG -o test1 test1.c

3、执行./test1,在目录里会发现./memleak.log

4、使用mtrace memleak.log 查看信息。

# mtrace test1 memleak.log
- 0x0804a008 Free 3 was never alloc'd 0xb7e31cbe
- 0x0804a100 Free 4 was never alloc'd 0xb7ec3e3f
- 0x0804a120 Free 5 was never alloc'd 0xb7ec3e47
Memory not freed:
-----------------
Address     Size     Caller
0x0804a4a8    0x3e8  at /home/illidanliu/test1.c:14

可以看到test1.c没有对应的free()。

04 其他

proc文件系统

内核的窗口。

proc文件系统是一个伪文件系统,它存在内存当中,而不占用外存空间。

用户和应用程序可以通过proc得到系统的信息,并可以改变内核的某些参数。

proc/目录结构(部分):

  • cmdline                 内核命令行
  • cpuinfo                  关于Cpu信息
  • devices                 可以用到的设备(块设备/字符设备)
  • filesystems           支持的文件系统
  • interrupts               中断的使用
  • ioports                  I/O端口的使用
  • kcore                    内核核心映像
  • kmsg                    内核消息
  • meminfo     内存信息
  • mounts                 加载的文件系统
  • stat                       全面统计状态表
  • swaps                   对换空间的利用情况
  • version                  内核版本
  • uptime                  系统正常运行时间
  • net                        网络信息
  • sys                       可写,可以通过它来访问或修改内核的参数

proc//目录结构(部分):

  • cmdline                 命令行参数
  • environ                  环境变量值
  • fd                         一个包含所有文件描述符的目录
  • mem                     进程的内存被利用情况
  • stat                       进程状态
  • status                   Process status in human readable form
  • cwd                      当前工作目录的链接
  • exe                       Link to the executable of this process
  • maps                    内存映像
  • statm                    进程内存状态信息
  • root                       链接此进程的root目录

系统日志

/var/log/下的日志文件:

  • /var/log/messages        整体系统信息,其中也包含系统启动期间的日志。此外,mail、cron、daemon、kern和auth等内容也记录在var/log/messages日志中。
  • /var/log/auth.log            系统授权信息,包括用户登录和使用的权限机制等。
  • /var/log/boot.log            系统启动时的日志。
  • /var/log/daemon.log       各种系统后台守护进程日志信息。
  • /var/log/lastlog                     记录所有用户的最近信息。这不是一个ASCII文件,因此需要用lastlog命令查看内容。
  • /var/log/user.log            记录所有等级用户信息的日志。
  • /var/log/cron                 每当cron进程开始一个工作时,就会将相关信息记录在这个文件中。
  • /var/log/wtmp或utmp    登录信息。
  • /var/log/faillog               用户登录失败信息。此外,错误登录命令也会记录在本文件中。
免责声明:整理文章为传播相关技术知识&行业趋势,版权归原作者所有。如有侵权请联系删除或授权事宜。

d3773177fc16fd2098a644e27e4022b1.gif 

b004bcbcfc4655dd1feaf4d6180c33ee.gif

4882f21d2a6ed63aa7948ec927d42412.png

点下在看,你就是最靓的仔儿!




推荐阅读
  • 本文详细探讨了Zebra路由软件中的线程机制及其实际应用。通过对Zebra线程模型的深入分析,揭示了其在高效处理网络路由任务中的关键作用。文章还介绍了线程同步与通信机制,以及如何通过优化线程管理提升系统性能。此外,结合具体应用场景,展示了Zebra线程机制在复杂网络环境下的优势和灵活性。 ... [详细]
  • 在 Linux 环境下,多线程编程是实现高效并发处理的重要技术。本文通过具体的实战案例,详细分析了多线程编程的关键技术和常见问题。文章首先介绍了多线程的基本概念和创建方法,然后通过实例代码展示了如何使用 pthreads 库进行线程同步和通信。此外,还探讨了多线程程序中的性能优化技巧和调试方法,为开发者提供了宝贵的实践经验。 ... [详细]
  • 深入解析 ELF 文件格式与静态链接技术
    本文详细探讨了ELF文件格式及其在静态链接过程中的应用。在C/C++代码转化为可执行文件的过程中,需经过预处理、编译、汇编和链接等关键步骤。最终生成的可执行文件不仅包含系统可识别的机器码,还遵循了严格的文件结构规范,以确保其在操作系统中的正确加载和执行。 ... [详细]
  • 对于以压缩包形式发布的软件,其目录中通常包含一个配置脚本 `configure`。该脚本的主要功能是确定编译所需的各项参数,如头文件的位置和链接库的路径,并生成相应的 `Makefile` 以供编译使用。通过运行此脚本,开发者可以确保软件在不同环境下的正确编译与安装。此外,该脚本还能够检测系统依赖项,进一步提高编译过程的可靠性和兼容性。 ... [详细]
  • MATLAB字典学习工具箱SPAMS:稀疏与字典学习的详细介绍、配置及应用实例
    SPAMS(Sparse Modeling Software)是一个强大的开源优化工具箱,专为解决多种稀疏估计问题而设计。该工具箱基于MATLAB,提供了丰富的算法和函数,适用于字典学习、信号处理和机器学习等领域。本文将详细介绍SPAMS的配置方法、核心功能及其在实际应用中的典型案例,帮助用户更好地理解和使用这一工具箱。 ... [详细]
  • 数字图书馆近期展出了一批精选的Linux经典著作,这些书籍虽然部分较为陈旧,但依然具有重要的参考价值。如需转载相关内容,请务必注明来源:小文论坛(http://www.xiaowenbbs.com)。 ... [详细]
  • 如何利用正则表达式(regexp)实现高效的模式匹配?本文探讨了正则表达式在编程中的应用,并分析了一个示例程序中存在的问题。通过具体的代码示例,指出该程序在定义和使用正则表达式时的不当之处,旨在帮助读者更好地理解和应用正则表达式技术。 ... [详细]
  • 在CentOS上部署和配置FreeSWITCH
    在CentOS系统上部署和配置FreeSWITCH的过程涉及多个步骤。本文详细介绍了从源代码安装FreeSWITCH的方法,包括必要的依赖项安装、编译和配置过程。此外,还提供了常见的配置选项和故障排除技巧,帮助用户顺利完成部署并确保系统的稳定运行。 ... [详细]
  • 在Linux环境下编译安装Heartbeat时,常遇到依赖库缺失的问题。为确保顺利安装,建议预先通过yum安装必要的开发库,如glib2-devel、libtool-ltdl-devel、net-snmp-devel、bzip2-devel和ncurses-devel等。这些库是编译过程中不可或缺的组件,能够有效避免编译错误,确保Heartbeat的稳定运行。 ... [详细]
  • ESP32 IRAM 内存优化策略与实践总结
    本文总结了针对ESP32 IRAM内存溢出问题的优化策略与实践经验。通过详细分析ESP32的内存结构和IRAM分配机制,提出了一系列有效的解决方案,包括代码优化、内存管理技巧和编译器配置调整,旨在帮助开发者有效解决`.espressif/tools/xtensa-esp32-elf/esp-2`等类似错误,提升系统性能和稳定性。 ... [详细]
  • 在 Linux 系统中,`/proc` 目录实现了一种特殊的文件系统,称为 proc 文件系统。与传统的文件系统不同,proc 文件系统主要用于提供内核和进程信息的动态视图,通过文件和目录的形式呈现。这些信息包括系统状态、进程细节以及各种内核参数,为系统管理员和开发者提供了强大的诊断和调试工具。此外,proc 文件系统还支持实时读取和修改某些内核参数,增强了系统的灵活性和可配置性。 ... [详细]
  • 安装过程:(环境:Kubuntu7.10)从其oracle公司官网http:www.oracle.comtechnologysoftwareproduc ... [详细]
  • 为了在Hadoop 2.7.2中实现对Snappy压缩和解压功能的原生支持,本文详细介绍了如何重新编译Hadoop源代码,并优化其Native编译过程。通过这一优化,可以显著提升数据处理的效率和性能。此外,还探讨了编译过程中可能遇到的问题及其解决方案,为用户提供了一套完整的操作指南。 ... [详细]
  • 在本地环境中部署了两个不同版本的 Flink 集群,分别为 1.9.1 和 1.9.2。近期在尝试启动 1.9.1 版本的 Flink 任务时,遇到了 TaskExecutor 启动失败的问题。尽管 TaskManager 日志显示正常,但任务仍无法成功启动。经过详细分析,发现该问题是由 Kafka 版本不兼容引起的。通过调整 Kafka 客户端配置并升级相关依赖,最终成功解决了这一故障。 ... [详细]
  • Vue应用预渲染技术详解与实践 ... [详细]
author-avatar
wjb201212
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有