三、Set-UID 特..

五、竞态条件

雪城大学计算机与网络安全讲义

四、缓冲区溢出漏洞和攻击

原文：Buffer-Overﬂow Vulnerabilities and Attacks

译者：飞龙

1 内存

这个讲义的“区域”（Area）和“段”（Segment）与多数教程正好相反，译文中已更正。

在 PC 架构中，程序中有四个基本读写段：栈、数据、BSS 和堆。数据、BSS 以及堆区可统称为“数据区域”。在“内存布局和栈”的教程中，Peter Jay Salzman 详细描述了内存布局。

栈：栈通常在内存的高地址。通常“向下增长”：从高地址到低地址。无论何时进行函数调用，栈都会使用。
数据区域
- 数据段：包含程序所用的全局变量，它们不被初始化为 0。例如，字符串hello world由char s[] = "hello world"定义，它在 C 中存在于数据段。
- BSS 段：起始于数据段的末尾，并包含所有初始化为 0 的全局变量。例如，变量声明为static int，会包含在 BSS 段中。
- 堆段：起始于 BSS 段的末尾，向高地址增长。堆段由malloc库管理。堆段由程序中所有共享库以及动态加载模块共享。

2 栈缓冲区溢出

2.1 栈的背景

栈布局：下面的图片展示了在执行流进入函数func之后，栈的布局。
栈方向：栈从高地址向低地址增长（而缓冲区正好相反）。
返回地址：函数返回后所执行的地址。
- 在进入函数之前，程序需要记住从函数返回之后，应该返回到哪里。也就是需要记住返回地址。
- 返回地址是函数调用下一条指令的地址。
- 返回地址会储存在栈上。在 x86 中，指令call func会将call语句下一条指令的地址压入栈中（返回地址区域），之后跳到func的代码处。
帧指针（FP）：用于引用局部变量和函数参数。这个指针储存在寄存器中（例如 x86 中是ebp寄存器）。下面，我们使用$FP来表示FP寄存器的值。
- variable_a被引用为$FP-16。
- buffer被引用为$FP-12。
- str被引用为$FP+8。
缓冲区溢出问题：上面的程序拥有缓冲区溢出问题。
- 函数strcpy(buffer, str)将内存从str复制到buffer。
- str指向的字符串多于 12 个字符，但是buffer的大小只为 12。
- 函数strcpy不检查buffer是否到达了边界。它值在看到字符串末尾\0时停止。
- 所以，str末尾的字符会覆盖buffer上面的内存中的内容。

2.2 漏洞程序

现在，让我们来看一个更复杂的程序。不像前面的程序，用于覆盖返回地址的字符串不是静态字符串，它通常由用户提供。换句话说，用户可以决定字符串中包含什么。

/* stack.c */
/* This program has a buffer overflow vulnerability. */ 
/* Our task is to exploit this vulnerability */ 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h>
int func (char *str) { 
    char buffer[12];
    /* The following statement has a buffer overflow problem */ 
    strcpy(buffer, str);
    return 1;
}
int main(int argc, char **argv) { 
    char str[517]; 
    FILE *badfile;
    badfile = fopen("badfile", "r"); 
    fread(str, sizeof(char), 517, badfile); 
    func (str); 
    printf("Returned Properly\n"); 
    return 1;
}

我们并不难以看到上面的程序拥有缓冲区溢出问题。这个程序首先从badfile文件读取输入，之后将输入传递给bof中另一个缓冲区。原始输入最大为 517 个字节，但是bof中的缓冲区只有 12 个字节。因为strcpy不检查边界，会发生缓冲区溢出。如果这个程序是 Set-Root-UID 程序，普通用户就可以利用这个缓冲区溢出漏洞，并得到 Root 权限。

2.3 利用缓冲区溢出漏洞

为了完全利用栈缓冲区溢出漏洞，我们需要解决几个挑战性的问题。

注入恶意代码：我们需要能够像目标进程的内存中注入恶意代码。如果我们可以控制目标程序中，缓冲区的内存，就可以完成它。例如，在上面的例子中，程序从文件获取输入。我们可以将恶意代码保存到文件中，并且目标程序会将其读入内存。
跳到恶意代码：使用内存中已有的恶意代码，如果目标程序可以跳到恶意代码的起始点，攻击者就能控制它。
编写恶意代码：编写恶意代码并不犊砸，我们就展示一种特定类型的恶意代码，Shellcode，如何编写。

2.4 注入恶意代码

使用程序中的缓冲区溢出漏洞，我们可以轻易向运行的程序的内存中注入恶意代码。让我们假设恶意代码已经编写好了（我们会在稍后讨论如何编写恶意代码）。

在上面的漏洞程序中，程序从文件badfile读取内存，并且将内存复制到buffer。之后，我们可以简单将恶意代码（二进制形式）储存在badfile中，漏洞程序会将恶意代码复制到栈上的buffer（它会溢出buffer）。

2.5 跳到恶意代码

为了跳到我们已经注入到目标程序栈上的恶意代码，我们需要知道代码的绝对地址，如果我们事先知道地址，在溢出缓冲区时，我们就可以使用这个地址来覆盖存放返回地址的内存。因此，当函数返回时，他就会返回到我们的恶意代码。
下面就是寻找恶意代码从哪里开始的挑战。
如果目标程序是个 Set-UID 程序，你可以复制这个程序，并使用你自己的权限来执行。你可以用这个方式来调试程序（要逐级你不能调试 Set-UID 程序）。在调试器中，你可以弄清楚buffer的地址，因此计算出恶意代码的起始点。buffer的地址可能和你运行 Set-UID 副本时不同，但已经很接近了。你可以尝试多个值。
如果目标程序远程运行，并且你可能不能依赖调试器来寻找地址。但是，你可以始终猜测它。下面的事实是的猜测变得可行：
- 栈通常起始于相同地址。
- 栈通常不是很深：多数程序不会一次性压入成百上千字节。
- 因此我们需要猜测的栈的范围实际非常小。
提升几率：为了提升成功的几率，我们可以向恶意代码的顶部添加许多 NOP 指令。NOP 是个特殊的指令，除了步进到下一条指令之外，不做任何事情。因此，只要猜测的地址指向了 NOP 指令之一，攻击就成功了。使用这些 NOP，猜测指向恶意代码的正确地址的几率就会显著增加。

2.6 恶意代码：Shellcode

在前面的讨论中，我们假设恶意代码已经是可用的。这个章节中，我们会讨论如何编写这种恶意代码。

如果我们可以让特权程序执行我们的代码，我们想要它执行什么代码呢？最强大的代码就是调用 Shell，所以我们可以在其中执行任何我们想要执行的代码。目标为加载 Shell 的程序就叫做 Shellcode。为了了解如何编写 Shellcode，让我们来看看下面的 C 程序：

#include <stdio.h>
int main( ) { 
    char *name[2];
    name[0] = "/bin/sh"; 
    name[1] = NULL; 
    execve(name[0], name, NULL);
}

在我们将上面的程序编译为二进制代码之后，我们可以在缓冲区溢出工集中，直接使用二进制代码作为 Shellcode 嘛？事情并不是那么容易。如果我们直接使用上面的代码，就会有几个问题：

首先，为了调用系统调用execve，我们需要知道/bin/sh的地址。字符串保存在哪里，以及如何获取字符串位置，并不是复杂的问题。
其次，代码中有一些空字符。这会使strcpy停止，如果漏洞由strcpy导致，我们就会有问题。

为了解决第一个问题，我们可以将字符串/bin/sh压入栈中，之后使用栈指针esp获取字符串位置。为了解决第二个问题，我们可以将包含 0 的指令转换为另一条不包含 0 的指令，例如，为了将 0 储存到寄存器中，我们可以使用 XOR 指令，而不是直接将寄存器赋为 0。下面是个用汇编语言编写的 Shellcode 的例子：

Line 1: xorl %eax,%eax 
Line 2: pushl %eax        # push 0 into stack (end of string) 
Line 3: pushl $0x68732f2f # push "//sh" into stack 
Line 4: pushl $0x6e69622f # push "/bin" into stack 
Line 5: movl %esp,%ebx    # %ebx = name[0] 
Line 6: pushl %eax        # name[1] 
Line 7: pushl %ebx        # name[0] 
Line 8: movl %esp,%ecx    # %ecx = name 
Line 9: cdq               # %edx = 0 
Line 10: movb $0x0b,%al 
Line 11: int $0x80        # invoke execve(name[0], name, 0)

Shellcode 中的一些地方需要注意：

首先，第三条指令将/sh压入到栈中。这是因为我们需要一个 32 位数值，/sh只有 24 位，幸运的是，//等价于/，所以我们可以使用两个斜杠字符。
其次，在调用execve系统调用之前，我们需要将name[0]（字符串地址），name（数组地址），以及NULL储存到%ebx、%ecx以及%edx寄存器。
- 第五行将name[0]储存到`%ebx。
- 第八行将name储存到%ecx。
- 第九行将%edx设为 0。有其他将它设为 0 的办法（例如xorl %edx, %edx）。这里使用的cdq是个简单的指令，将 EAX 最高位（第 31 位）复制到 EDX 寄存器的每一位，也就是将%edx设为 0。
再者，execve系统调用在我们将%al设为 11 并执行int $0x80时调用。

如果我们将上面的代码转换为二进制，并将其储存在数组中，我们就行可以在 C 程序中调用：

#include <stdlib.h> 
#include <stdio.h>

const char code[] = 
    "\x31\xc0" /* Line 1: xorl %eax,%eax */ 
    "\x50" /* Line 2: pushl %eax */ 
    "\x68""//sh" /* Line 3: pushl $0x68732f2f */ 
    "\x68""/bin" /* Line 4: pushl $0x6e69622f */ 
    "\x89\xe3" /* Line 5: movl %esp,%ebx */ 
    "\x50" /* Line 6: pushl %eax */ 
    "\x53" /* Line 7: pushl %ebx */ 
    "\x89\xe1" /* Line 8: movl %esp,%ecx */ 
    "\x99" /* Line 9: cdq */ 
    "\xb0\x0b" /* Line 10: movb $0x0b,%al */ 
    "\xcd\x80" /* Line 11: int $0x80 */ ;

int main(int argc, char **argv) { 
    char buf[sizeof(code)]; 
    strcpy(buf, code); 
    ((void(*)( ))buf)( ); 
}

上面main函数中的((void(*)( ))buf)( )语句会调用 Shell，因为执行了 Shellcode。

3 对抗措施

3.1 应用安全工程原则

使用强类型语言，例如 Java、C#，以及其他。使用这些语言，可以避免缓冲区溢出。
使用安全的库函数
- 可能拥有缓冲区溢出问题的函数：gets、strcpy、strcat、sprintf。
- 这些函数更加安全：fgets、strncpy、strncat以及snprintf。

3.2 系统化代码修改

StackShield：分离控制（返回地址）和数据。
- 它是保护返回地址的 GCC 编译器扩展。
- 当函数调用时，StackShield 将返回地址复制到不能覆盖的区域。
- 从函数返回时，返回地址被存储。因此，即使栈上的返回地址发生改变，也没有效果，因为原始的返回地址在返回地址用于跳转之前复制了回来。

StackGuard：标记缓冲区的边界

观察：一个人需要覆盖返回地址之前的内存，来覆盖返回地址。换句话说，攻击者很难治修改返回地址，而不修改返回地址之前的栈内存。
无论函数什么时候调用，都可以将一个哨兵值放在返回地址的旁边。
如果函数返回值，哨兵值发生改变，就代表发生了缓冲区溢出。
StackGuard 也内建于 GCC。
我们可以理解 StackGuard 如何工作，通过下面的程序（我们模拟了编译器，手动将保护代码添加到函数中）。处于明显的原因，我们在这个例子中使用整数作为哨兵值，它还不够强大。我们可以使用多个整数作为哨兵值。

/* This program has a buffer overflow vulnerability. */ 
/* However, it is protected by StackGuard */ 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h>
int func (char *str) {
    int canaryWord = secret; 
    char buffer[12];
    /* The following statement has a buffer overflow problem */ 
    strcpy(buffer, str);
    if (canaryWord == secret) // Return address is not modified 
        return 1; 
    else { // Return address is potentially modified 
        ... error handling ... 
    }
}
static int secret; // a global variable
int main(int argc, char **argv) { 
    // getRandomNumber will return a random number 
    secret = getRandomNumber();
    char str[517]; 
    FILE *badfile;
    badfile = fopen("badfile", "r"); 
    fread(str, sizeof(char), 517, badfile); 
    func (str); 
    printf("Returned Properly\n"); 
    return 1;
}

3.3 操作系统方法

地址空间随机化（ASLR）：猜测恶意代码的地址空间是一个缓冲区溢出的关键步骤。如果我们可以使恶意代码的地址难以预测，攻击就能变得更困难。多种 Linux 发行版都已经使用了 ASLR 来随机化堆和栈的起始地址。这使得猜测准确地址变得困难。下面的命令（只能由 Root 运行）开启或禁用 ASLR：
```
# sysctl -w kernel.randomize_va_space=2 // Enable Randomization 
# sysctl -w kernel.randomize_va_space=0 // Disable Randomization
```
不幸的是，在 32 位机器上，即使地址空间随即化了，熵依然不是非常大，来放置猜测。实际上，如果你尝试多次，你的成功率就会非常高。我们的经验表明，几分钟的尝试足以成功利用 Intel 2GHz 的机器。
不可执行栈：从攻击中，我们可以观察到，攻击者将恶意代码放置在栈上，并跳转到它。由于栈是数据而不是代码的地方，我们可以将栈配置为不可执行，因此防止了恶意代码的执行。

这个保护机制叫做 ExecShield，多种 Linux 发行版已经实现了该机制。ExecShield 本质上禁止了储存在栈上的任意代码的执行。下面的代码（只能由 Root 执行）开启或禁用了 ExecShield。
```
# sysctl -w kernel.exec-shield=1 // Enable ExecShield 
# sysctl -w kernel.exec-shield=0 // Disable ExecShield
```
在下一节中，我们可以看到，这种保护模式并没有解决缓冲区溢出问题，因为另一种类型的攻击，叫做 Return-to-Libc 攻击不需要可执行的栈。

4 不可执行栈和 Return-to-Libc 攻击

为了利用基于栈的缓冲区溢出漏洞，攻击者需要将代码段注入到用户的栈上，之后执行栈上的代码。如果我们使栈的内存段不可执行，即使代码注入到了栈中，代码也不能够执行。这样，我们就可以放置缓冲区溢出攻击。严格来说，这易于实现，因为现代 CPU 架构（例如 x86）的确允许操作系统来将一块内存变为不可执行。但是，还是没有那么简单：许多操作系统，例如 Linux，将代码保存到栈中，因此需要可执行的栈。例如，Linux 为了处理信号，需要在用户栈中放置代码序列。这个序列会在处理信号时执行。

新版本的 Linux 已经使栈只存放数据了。因此，栈可以配置成不可执行。在 Fedora 中，我们可以执行下列命令来使栈不可执行：

# /sbin/sysctl -w kernel.exec-shield=1

不幸的是，使栈不可执行不能完全放置缓冲区溢出。它使运行栈上的代码变得不可能，但是还有其它方法来利用缓冲区溢出漏洞，不需要执行栈上的任意代码。Return-to-Libc 攻击就是这种攻击。

为了理解这种新型攻击，让我们回忆从栈中执行恶意代码的主要目的。我们知道它为了调用 Shell。问题就是，我们是否能够不实用输入的代码来调用 Shell？这实际上是可行的：我们可以使用操作系统自身的代码来调用 Shell。更加具体来讲，我们可以使用操作系统的库函数来完成我们的目标。在类 Unix 系统中，叫做 Libc 的共享库提供了 C 运行时。这个库是多数 C 程序的基础，因为它定义了系统调用，以及其他基本的设施，例如open、malloc、printf、system，以及其他。Libc 的代码已经作为共享运行时库在内存中了，并且他可以被所有应用访问。

函数system是 Libc 中的函数之一。如果我们可以使用参数/bin/sh调用这个函数，我们就可以获得 Shell。这是 Return-to-Libc 攻击的基本原理。攻击的第一部分类似于使用 Shellcode 的攻击，它溢出了缓冲区，并修改了栈上的返回地址。第二部分所有不同。不像 Shellcode 方式，返回地址不指向任何注入的代码。它指向 Libc 中函数system的入口。如果我们执行正确，我们就可以强迫目标程序执行system("/bin/sh")，它会加载 Shell。

挑战：为了完成 Return-to-Libc 攻击，我们需要客服如下困难：

如何寻找system的位置？
如何寻找字符串/bin/sh的位置？
如何将字符串/bin/sh的地址传递给system函数？

4.1 寻找`system`函数的位置

在多数 Unix 操作系统中， Libc 库始终加载到固定内存地址中。为了寻找 Libc 函数的地址，我们可以使用下面的 GDB 命令（假设a.out是任意程序）：

$ gdb a.out 
(gdb) b main 
(gdb) r 
(gdb) p system 
    $1 = {<text variable, no debug info>} 0x9b4550 <system> 
(gdb) p exit 
    $2 = {<text variable, no debug info>} 0x9a9b70 <exit>

从上面的 GDB 命令，我们可以发现，system函数的地址是0x9b4550，函数exit的返回地址是0x9a9b70。你系统中的实际地址可能不同。

我们也可以调用函数dlopen和dlsym来寻找 Libc 中函数的地址。

#include <dlfcn.h>

#define LIBCPATH "/lib/libc.so.6" /* on Fedora */

void *libh, *sys;

if ((libh = dlopen(LIBCPATH, RTLD_NOW)) == NULL){ 
    // report error 
}

if (( sys = dlsym (libh, "system")) == NULL){ 
    // report error 
} 
printf("system @ %p\n", sys);

4.2 寻找`/bin/sh`的地址

有几种方式来寻找这种字符串的地址：

使用缓冲区溢出问题，直接将地址插入栈中，之后猜测它的地址。
在执行漏洞程序之前，创建环境变量，值为/bin/sh。当 C 程序从 Shell 执行时，它就会从 Shell 继承所有环境变量。下面，我们定义了新的 Shell 变量MYSHELL，并使它的值为/bin/sh。
```
$ export MYSHELL=/bin/sh
```
我们使用这个变量的地址作为system调用的参数。这个变量在内存中的位置可以使用下面的程序轻易在内存中找到：
```
void main() { 
    char* shell = getenv("MYSHELL"); 
    if (shell) 
        printf("%x\n", shell); 
}
```
如果站地址没有随机化，我们会发现打印出了相同地址。但是，当我们运行另一个程序时，环境变量的地址可能和你刚刚运行的程序不一样。这种地址在你修改程序名称时就可能改变（因为文件名称的字符数量不同了）。好消息是，Shell 的地址会很接近你是用上一个程序打印出来的东西。因此，你可能需要尝试几次直到成功。
我们也知道，函数system在自己的代码中使用/bin/sh。因此，字符串必然存在于 Libc。如果我们能够寻找字符串的位置，我们就可以直接使用这个字符串。你可以在 LIBC 库文件（/lib/libc.so.6）中搜索字符串rodata：
```
$ readelf -S /lib/lib.so.6 | egrep ’rodata’ 
[15] .rodata PROGBITS 009320e0 124030 ......
```
上面命令的结果表明，.rodata段起始于0x009320e0。.rodata段用于储存不变数据，字符串常量/bin/sh应该储存在这一段内。你可以编写程序来在起始于0x00932030的内存中搜索字符串。

4.3 将`/bin/sh`的地址传给`system`

为了让system执行命令/bin/sh，我们需要将命令字符串的地址作为参数传给system。就像调用任何函数那样，我们需要通过栈传递参数。因此，我们需要将参数放到栈上的正确位置。为了执行正确，我们需要清晰理解调用函数的时候，函数的栈帧如何构建。我们使用小型的 C 程序来理解函数调用在栈上的影响：

/* foobar.c */ 
#include<stdio.h> 
void foo(int x) { 
    printf("Hello world: %d\n", x);
}
int main() { 
    foo(1); 
    return 0; 
}

我们可以使用gcc -S foobar.c来将这个程序编译为汇编代码。产生的文件foobar.s像这样：

   ...... 
 8 foo: 
 9 pushl %ebp 
10 movl %esp, %ebp 
11 subl $8, %esp 
12 movl 8(%ebp), %eax 
13 movl %eax, 4(%esp) 
14 movl $.LC0, (%esp) : string "Hello world: %d\n" 
15 call printf 
16 leave 
17 ret 
   ...... 
21 main: 
22 leal 4(%esp), %ecx 
23 andl $-16, %esp 
24 pushl -4(%ecx) 
25 pushl %ebp 
26 movl %esp, %ebp 
27 pushl %ecx 
28 subl $4, %esp 
29 movl $1, (%esp) 
30 call foo 
31 movl $0, %eax 
32 addl $4, %esp 
33 popl %ecx 
34 popl %ebp 
35 leal -4(%ecx), %esp 
36 ret

调用和进入foo。让我们专注于调用foo时的栈。我们可以忽略之前的栈。要注意，行号而不是指令地址用于解释。

28~29 行：两个语句将值 1，也就是foo的参数压入栈。这个操作使%esp增加了 4。两个豫剧之后的栈由图 3(a) 描述：

图 3：foo的进入的返回
30 行：call foo：这个语句将call语句的下一条语句的地址压入了栈（也就是返回地址），并跳到foo的代码。当前的栈由图 3(b) 描述。
9~10 行：函数foo的第一行将%ebp压入了栈，来保存上一个帧指针。第二行让%ebp指向当前的帧。当前的栈由图 3(c) 描述。
11 行：subl $8, %esp：栈指针发生改变，来为局部变量和两个传给printf的参数分配空间（8 个字节）。所以函数foo中没有局部变量，8 字节全部用于参数。请见图 3(d)。

离开foo：现在控制流传给了函数foo。让我们看看当函数返回时，栈上发生了什么。

16 行：leave：这个指令隐式执行两条指令（在早期 x86 发行版中它是一个宏，但是后来做成了一个指令）：
```
mov %ebp, %esp 
pop %ebp
```
第一条语句释放了为函数分配的栈空间，之后跳到了返回地址。当前的栈由图 3(e) 描述。
17 行：ret：这个指令只是弹出栈的返回地址，之后跳到返回地址，当前的栈图 3(f) 描述。

4.4 `/bin/bash`中的保护

如果/bin/sh指向了/bin/bash，即使我们可以在权限的 Set-UID 程序中调用 Shell，我们也不能获得 Root 权限。这是因为 Bash 会自动降低它的权限，如果它执行在 Set-UID Root 上下文中。

但是，有几种方式来绕过这个保护模式。虽然/bin/bash限制了 Set-UID 程序的运行，它的确允许以真实的 Root 权限运行 Shell。所以，如果我们可以将当前的 Set-UID 进程转换为真实的 Root 进程，在我们调用/bin/bash之前，我们就可以绕过这个 Bash 的限制。setuid(0)系统调用可以帮助你实现它。因此，我们首先需要调用setuid(0)，之后调用system("/bin/sh")。所有这些可以使用 Return-to-Libc 机制来实现。

基本上，我们需要两次 Return-to-Libc。我们首先让目标程序返回到 Libc 的setuid函数。当这个函数返回时，它会从栈上抓取返回地址，并跳到该地址。如果我们可以让这个返回地址指向system，我们就可以让函数setuid强制返回到system的入口。在执行这个过程时，我们需要十分小心，因为我们需要将合理的参数放到栈的正确位置。

5 堆或 BSS 的缓冲区溢出

堆或 BSS 的内容
- 字符串常量
- 全局变量
- 静态变量
- 动态分配的内存
示例：覆盖文件指针
```
/* The following variables are stored in the BSS region */ 
static char buf[BUFSIZE], *tmpfile;

tmpfile = "/tmp/vulprog.tmp"; 
gets(buf); /* buffer overflow can happen here */

... Open tmpfile, and write to it ...
```
- Set-UID 程序的文件指针指向了/tmp/vulprog.tmp。
- 程序需要在执行期间，使用用户输入写入文件、
- 如果我们可以使文件指针指向/etc/shadow，我们就可以使程序写入它。
- 我们可以使用缓冲区溢出来改变变量tmpfile的内存。通常，它指向了/tmp/vluprog.tmp字符串。使用缓冲区溢出漏洞，我们就可以将tmpfile的内容修改为0x903040，它就是字符串/etc/shadow的地址。之后，当程序使用tmpfile变量打开文件来写入时，它实际上打开了shadow文件。
- 如何寻找/etc/shadow？
  - 我们可将字符串作为参数传入程序，这样字符串/etc/shadow就储存在内存中。我们现在需要猜测它在哪里。
示例：覆盖函数指针：
```
int main(int argc, char **argv) { 
    static char buf[16]; /* in BSS */ 
    static int (*funcptr)(const char *str); /* in BSS */

    funcptr = (int (*)(const char *str))goodfunc;

    /* We can cause buffer overflow here */ 
    strncpy(buf, argv[1], strlen(argv[1]));

    (void)(*funcptr)(argv[2]); 
    return 0;
}
/* This is what funcptr would point to if we didn’t overflow it */ 
int goodfunc(const char *str) { 
    ... ... 
}
```
- 函数指针（例如int (*funcptr)(char *str)）允许程序员动态修改被调用的函数。我们可以通过覆盖它的地址来覆盖函数指针，使之在执行时，它调用我们指向的函数。
- argv[]方式：将 Shellcode 储存在程序的参数中。这会使 Shellcode 储存在栈上。之后我们需要猜测它的地址（就像我们在栈溢出中那样）。这个方式需要可执行的栈。
- 堆方式：将 Shellcode 储存在堆或 BSS 中（通过使用溢出）。之后我们需要猜测它的地址，并将估算的地址赋给函数指针。这个方式需要可执行的堆（比可执行的栈概率更大）。
函数指针
- 函数指针可以通过多种手段储存在堆或 BSS 中。这不需要由程序员定义。
- 如果程序调用了atexit，函数指针就会由atexit储存在堆上，并且会在程序终止前调用。
- svc/rpc注册函数（librpc, libnsl以及其他）将回调函数储存在堆上。
其它示例
- BSDIcrontab基于堆的溢出：长文件名的传递会溢出静态缓冲区。在内存中的缓冲区上面，我们拥有pwd结构，它储存用户名、密码、UID、GID，以及其他。通过覆盖pwd的 UID/GID 字段，我们可以修改权限，使crond使用它执行我们的crontab（只要他尝试执行我们的crontab）。这个脚本之后可以产生 Suid Root Shell，因为我们的脚本会使用 UID/GID 0 来执行。

参考

P. J. Salzman. Memory Layout And The Stack. In Book Using GNU’s GDB Debugger. URL: http://dirac.org/linux/gdb/02a-Memory_Layout_And_The_Stack.php.

雪城大学计算机与网络安全讲义

四、缓冲区溢出漏洞和攻击

1 内存

2 栈缓冲区溢出

2.1 栈的背景

2.2 漏洞程序

2.3 利用缓冲区溢出漏洞

2.4 注入恶意代码

2.5 跳到恶意代码

2.6 恶意代码：Shellcode

3 对抗措施

3.1 应用安全工程原则

3.2 系统化代码修改

3.3 操作系统方法

4 不可执行栈和 Return-to-Libc 攻击

4.1 寻找`system`函数的位置

4.2 寻找`/bin/sh`的地址

4.3 将`/bin/sh`的地址传给`system`

4.4 `/bin/bash`中的保护

5 堆或 BSS 的缓冲区溢出

参考

命令行的艺术

软件开发平台及语言笔记大全(超详细)

Shell脚本编程30分钟入门

Go语言标准库

分布式 Java

更先进的Java - Java 8指南

雪城大学计算机与网络安全讲义

四、缓冲区溢出漏洞和攻击

1 内存

2 栈缓冲区溢出

2.1 栈的背景

2.2 漏洞程序

2.3 利用缓冲区溢出漏洞

2.4 注入恶意代码

2.5 跳到恶意代码

2.6 恶意代码：Shellcode

3 对抗措施

3.1 应用安全工程原则

3.2 系统化代码修改

3.3 操作系统方法

4 不可执行栈和 Return-to-Libc 攻击

4.1 寻找system函数的位置

4.2 寻找/bin/sh的地址

4.3 将/bin/sh的地址传给system

4.4 /bin/bash中的保护

5 堆或 BSS 的缓冲区溢出

参考

命令行的艺术

软件开发平台及语言笔记大全(超详细)

Shell脚本编程30分钟入门

Go语言标准库

分布式 Java

更先进的Java - Java 8指南

4.1 寻找`system`函数的位置

4.2 寻找`/bin/sh`的地址

4.3 将`/bin/sh`的地址传给`system`

4.4 `/bin/bash`中的保护