(一):与内核通信
系统调用在用户空间和硬件设备之间添加了一个中间层。该层主要有三个作用:
1:他为用户空间提供了一种硬件的抽象接口2:系统调用保证了系统的稳定和安全。3:每个进程都运行在虚拟系统中,而在用户空间和系统的其余部分提供这样一层公共接口,也是出于这种考虑。
在Linux中,系统调用是用户空间访问内核的唯一手段。
(二):API,POSIX,C库
一般情况下,应用程序通过在用户空间实现的应用编程接口(API)而不是直接通过系统调用来编程。一个API定义了一组应用程序使用的编程接口。
下面我们看一下POSIX,API,和C库以及系统调用之间的联系。
(三):系统调用
首先我们先看一下一个比较简单的系统调用的实现:
SYSCALL_DEFINE0(getpid){ return task_tgrid_vnr(current);}
注意,定义中并没有规定他要如何实现。
其中SYSCALL_DFINE0只是一个宏,他定义一个无参数的系统调用,尾展开后的代码为:
asmlinkage long sys_getpid(void)
那么我们来看一下如何定义系统调用:
首先,注意函数声明中的asmlinkage限定词,这是一个编译指令,通知编译器仅仅从栈中提取该函数的参数。所有的系统调用都需要这个限定词。 其次,函数返回long。为了保证32位和64位系统的兼容,系统调用在用户空间和内核空间有不同的返回值类型,在用户空间为int,在内核空间为long。 最后,注意系统调用get_pid()在内核中被定义成sys_getpid()。这是一个命名规则。1:系统调用号
在Linux中,每一个系统调用被赋予一个系统调用号。这样的话,每一个系统调用都会关联一个系统调用。
系统调用号非常重要,一旦分配就不能再有任何改变,否则编译好的应用程序就会崩溃。此外,如果一个系统调用被删除,他所占用的系统调用号也不允许被回收利用,否则,以前编译过的代码会调用这个系统调用,但事实上却调用的是另外一个系统调用。在Linux中有一个”未实现“的系统调用sys_ni_syscall(),他除了返回-ENOSYS之外不做任何事情,这个系统调用就是专门针对无效的系统调用而设的。如果一个系统调用被删除或者是变为不可用,这个系统调用就负责”填空补缺“。
在sys_call_table中,是内核记录的所有的已注册过的系统调用的列表。在x84-64中,定义在文件arch/i386/kernel/syscall_64.c中。这个表为没一个有效的系统调用指定了唯一的系统调用号。
现在我们来看一下:
const sys_call_ptr_t sys_call_table[__NR_syscall_max+1] = { /* *Smells like a like a compiler bug -- it doesn't work *when the & below is removed. * * 看上去像是一个编译器bug -- 当下面的&移除之后,他就不能工作了 */ [0 ... __NR_syscall_max] = &sys_ni_syscall,#include};
2:系统调用的性能
Linux系统调用比其他操作系统执行的要快。Linux很短的上下文切换时间是一个重要的原因,进出内核都被优化的简介高效。同时,系统调用处理函数和每个系统调用本身也都非常简洁。
(四):系统调用处理函数
由于用户空间的程序是无法执行内核程序的,所有需要一个机制来通知内核执行某个系统调用。通知内核的机制是通过软中断来实现的:通过引发一个异常来促使系统切换到内核态去执行异常处理程序。此时的一场处理程序就是系统调用处理程序。有关于中断,会在后面详细学习。
1:指定恰当的系统调用
由于所有的系统调用陷入内核的方式都是一样的,所以,需要将系统调用号一并传给内核。在x86上,系统调用号是通过eax寄存器来传递给内核的。在陷入内核之前,用户空间就把相应的系统调用所对应的号传入eax中。
system_call()函数通过将给定的系统调用号与NR_syscalls做比较来检查其有效性。如果大于或等于NR_syscalls,该函数就返回-ENOSYS。否则,就执行相应的系统调用:
call *sys_call_table(,%rax,8)
由于系统调用表中的表项是以63位类型存放的,所以内核需要将给定的系统调用号乘以4,然后用所得的结果在该表中查询位置。
2:参数传递
同系统调用号一样,进行参数传递的时候,也可以通过寄存器将参数传递到内核中。在x86-32系统上,ebx,ecx,edx,esi,edi按照顺序存放前5个参数,此外,应该用一个单独的寄存器存放指向所有这些参数在用户空间地址的指针。
下面我们看一下系统调用的过程:
给用户空间的返回值也是通过寄存器传递的。在x86系统上,他存放在eax寄存器上。