【Linux】嵌入式C语言段错误的3种调试方法

Linux

发布日期: 2022-06-29

文章字数: 1.6k

阅读时长: 7 分

阅读次数:

大家好，我是杂烩君。

嵌入式C开发，或多或少都遇到段错误（segmentation fault ）。之前我们有分享总线错误的例子：Linux软件开发中，总线错误的坑？替大家先踩一步

段错误相比于总线错误，是一种更常见的错误。

段错误是怎么产生的呢？

段错误是因为访问不可访问的内存产生的。

下面是一些典型的段错误产生的原因：

访问不存在的内存地址
访问只读的内存地址
栈溢出
内存越界
……

段错误实例

1、实例1：访问不存在的内存地址

#include <stdio.h>

int main(int argc, char **argv)
{
    printf("==================segmentation fault test==================\n");

    int *p = NULL;
    *p = 1234;

    return 0;
}

2、实例2：访问只读的内存地址

#include <stdio.h>

int main(int argc, char **argv)
{
    printf("==================segmentation fault test1==================\n");

    char *str = "hello";
    str[0] = 'H';

    return 0;
}

3、实例3：栈溢出

#include <stdio.h>

static void test(void)
{
    char buf[1024 * 1024] = {0};
    static int i = 0;
    i++;
    printf("i = %d\n", i);
    test();
}

int main(int argc, char **argv)
{
    printf("==================segmentation fault test2==================\n");

    test();

    return 0;
}

4、实例4：内存越界

#include <stdio.h>

int main(int argc, char **argv)
{
    printf("==================segmentation fault test3==================\n");

    static char arr[5] = {0, 1, 2, 3, 4};

    printf("arr[10000] = %d\n", arr[10000]);

    return 0;
}

段错误调试方法

从上面的几个例子中，我们应该对段错误有了一定的认识，但实际项目中，实际中，段错误可能没有上面的例子那么明显看出。如果之前没有这方面的经验，可能一时半会也定位不到问题。下面分享段错误的3种调试方法供大家参考。

我们依旧使用例子来说明，例子：

#include <stdio.h>

static void func0(void)
{
    printf("This is func0\n");
    int *p = NULL;
    *p = 1234;
}

static void func1(void)
{
    printf("This is func1\n");
    func0();
}

int main(int argc, char **argv)
{
    printf("==================segmentation fault test4==================\n");

    func1();

    return 0;
}

1、gdb一步步运行

使用gdb调试，打一些断点、按流程运行下去，运行到段错误的地方会直接提示报错。

或者使用命令行直接gdb调试：

这里我们是在x86上运行，如果是定位arm嵌入式Linux程序，我们怎么做的？

同样也是可以使用gdb的，可以参考我们之前分享的文章：VSCode+gdb+gdbserver远程调试ARM程序

2、通过core文件

Linux下，一个程序崩溃时，它一般会在指定目录下生成一个core文件。core文件仅仅是一个内存映象(同时加上调试信息)，主要是用来调试的。

core文件可打开与关闭。相关命令：

ulimit -c   # 查看core文件是否打开
ulimit -c 0 # 禁止产生core文件
ulimit -c unlimited  #设置core文件大小为不限制大小
ulimit -c 1024   #限制产生的core文件的大小不能超过1024KB

0代表关闭。下面我们打开它：

运行程序时，程序崩溃时，在程序目录下会生成core文件，如：

调试core文件：

gdb test core

3、利用backtrace进行分析

#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
#include <execinfo.h>

void func0(void)
{
    printf("This is func0\n");
    int *p = NULL;
    *p = 1234;
}

void func1(void)
{
    printf("This is func1\n");
    func0();
}

void func2(void)
{
    printf("This is func2\n");
    func1();
}

void dump(int signo)
{
    void *array[100];
    size_t size;
    char **strings;

    size = backtrace(array, 100);
    strings = backtrace_symbols(array, size);

    printf("Obtained %zd stacks.\n", size);
    for(int i = 0; i < size; i++)
    {
        printf("%s\n", strings[i]);
    }
        
    free(strings);
    exit(0);
}

int main(int argc, char **argv)
{
    printf("==================segmentation fault test5==================\n");
    signal(SIGSEGV, &dump);
    func2();

    return 0;
}

当程序发生段错误时，内核会向程序发送SIGSEGV信号。dump为SIGSEGV信号处理函数，其实现用到了execinfo.h里的两个函数：

int backtrace(void **buffer,int size);
char ** backtrace_symbols (void *const *buffer, int size);

backtrace函数用于获取当前线程的调用堆栈，获取的信息将会被存放在buffer中,它是一个指针列表。参数 size 用来指定buffer中可以保存多少个void* 元素。函数返回值是实际获取的指针个数，最大不超过size大小在buffer中的指针实际是从堆栈中获取的返回地址，每一个堆栈框架有一个返回地址。

backtrace_symbols将从backtrace函数获取的信息转化为一个字符串数组。参数buffer应该是从backtrace函数获取的指针数组,size是该数组中的元素个数(backtrace的返回值)。函数返回值是一个指向字符串数组的指针，它的大小同buffer相同。

每个字符串包含了一个相对于buffer中对应元素的可打印信息。它包括函数名，函数的偏移地址，和实际的返回地址。注意：该函数的返回值是通过malloc函数申请的空间，因此调用者必须使用free函数来释放指针。如果不能为字符串获取足够的空间函数的返回值将会为NULL。

以上就是本次介绍的三种定位段错误问题的方法，可以定位不同程度的问题。

如果觉得文章有帮助，麻烦帮忙点赞、转发，谢谢！