NEMU PA 3-2 实验报告

一、实验目的

在上一章节我们完成了Cache的实现，但是这只是在速度上提高了取指和存取操作数的效率，而在访问的安全性上没有得到有效提升。

在PA3-2中我们要完成的，就是在NEMU中实现分段机制。

首先老规矩，我们来了解一下分段机制是啥，以及它的作用：

为啥需要“分段机制”？

代码、数据都放在内存里，没有任何限制和保护。会导致很多问题，如数组越界覆盖了代码，恶意程序故意修改代码和数据。也就是说我们如果不做对代码的分段，不把它分开一个个段并明确每个段的作用的话，那么我随便改了改EIP，就可以跳转到任意我想要跳转的地方去执行。内存可以随意读写是非常危险的。
分段机制的直接阐释：将内存划分为具有不同功能的内存区域，把同一种功能和访问控制类型的数据归类放在一起，统一提供保护，为不同的程序规定不同的访问权限
分段机制的实现需要：段表（GDT和LDT），NEMU中指的是全局描述符表GDT。

好了，我们了解了分段机制，那么回到访存机制上，我们要把访存和分段机制结合起来，就需要在访存时提供三个信息，以及要怎么得到这些信息：

要实现这一套保护的机制，需要操作系统和计算机双方的配合。其中，各个段的段基址，界限和权限要求等信息，由操作系统（即NEMU中的kernel）初始化并保存在内存中一个特别的称为全局描述符表，简称GDT，的数据结构中。GDT中的每一行对应一个表项，称为段描述符。

我们来看看NEMU是怎么具体实现的：

首先，启动时NEMU的访存方式是类似实地址模式，即当前的vaddr和最后的paddr一模一样，没有经过任何的权限检查和转换；（注意这和i386的实地址模式是不同的，区别如下）
x86的机器开机后首先进入实模式，加载操作系统，操作系统初始化段表，拨动一个‘开关’，从实模式切换到保护模式（开启分段机制）；
进入保护模式后，程序给出48位虚拟地址vaddr（16位段选择符 + 32位有效地址），使用段选择符来查段表，然后根据段表信息进行段级地址转换得到线性（现在就是物理）地址laddr。

好的，这就是分段机制开启的大体流程。我们来细看几个要点：

“开关”是什么？

这个开关是CPU中CR0寄存器中的PE位。它控制着实模式和保护模式的转换，当PE置为0时，采用实地址模式；当PE置为1时，采用保护地址模式。
段选择符怎么得到？

段选择符是存储在16bit的段寄存器中的index信息。有六个不同的段寄存器，即CS, SS, DS, ES, FS, GS六个段寄存器，每个寄存器指向某个段描述符，段寄存器的实现格式如下：
段描述符又是啥样子？

一个个64位的段描述符组成了GDT：

为什么描述段基地址的Base以及段大小的Limit字段会被拆成这种丑陋的结构？
因为需要兼容286架构...
要怎么找到GDT？

通过CPU中的GDTR寄存器来找到GDT的首地址和界限，然后根据段寄存器给出的段选择符来找GDT表项（段描述符）。

总体的思路如图：

好，我们现在在NEMU中要做的是：

在include/config.h头文件中添加宏定义IA32_SEG并make clean；
在CPU_STATE中添加对GDTR、CR0的模拟以及在init_cpu()中进行初始化为0；
在CPU_STATE中添加对6个段寄存器的模拟在init_cpu()中进行初始化为0，注意除了要模拟其16位的可见部分，还要模拟其隐藏部分，顺序不能有错；
实现包括lgdt、针对控制寄存器和段寄存器的特殊mov以及ljmp指令；
实现segment_translate()、loag_sreg()函数，并在vaddr_read()和vaddr_write()函数中添加保护模式下的虚拟地址向线性地址转换的过程；
通过make test_pa-3-2执行并通过各测试用例。

我们在实现NEMU的分段机制前观察了开启SEG宏后kernel的变化。其中有两条语句的意义要了解的：

lgdt va_to_pa(gdtdesc)在干什莫？

va_to_pa是一个地址转换的宏，lgdt指令是“Load Global Descriptor Table Register”，即装载GDTR。
ljmp $GDT_ENTRY(1), $va_to_pa(start_cond)又在干什莫？

GDT_ENTRY也是一个宏：

而ljmp指令的意义在于装载CS和EIP寄存器。

要注意的一个点是，汇编中的ljmp指令是AT&T的格式，在i386手册上是找不到这条指令的。而用objdump反汇编出来对照后看，ljmp对应的指令是JMP ptr16:16即一个 far jump。（详细看博文：https://blog.csdn.net/weixin_39677203/article/details/111268072）