printf底层剖析及可变参数探究
本文前置内容:可变参数列表,函数调用约定
本文参考文章:《你必须知道的495个C语言问题》《Linux内核完全注释》《操作系统真相还原》printf-菜鸟教程
本节对应分支:printk
概览
相信每一位 C 选手写下的第一句代码都是下面这句经典的 Hello World 吧?
1 | int main() |
理所应当的,其中的 printf
函数也成为了咋们认识的第一个函数。对笔者个人而言, printf
是一个熟悉而陌生的函数,说熟悉是因为它伴随了我整个 C 语言的学习生涯;说陌生是因为学习过程中一直对它存疑,模模糊糊,始终没能一探究竟,不知道各位读者是否也是像笔者一样呢?记得 C 语言萌新阶段时,我时常吐槽 printf
中的那些格式符,如 %d
、%s
、%c
、%x
等,乱七八糟的,实在是太难记啦!入门阶段时,我赞叹 printf
强大的格式处理能力,比如左右对齐、输出宽度、输出精度等;进阶阶段时,我又开始疑惑 printf
是如何做到参数可变的,但因为基础不足,就暂时搁浅。现在,天时地利人和,让我们对 printf
一网打尽吧!
本文将从以下几个方向逐个击破 printf
:
- 默认参数提升
- 可变参数的类型检查
- 可变参函数实现原理
- 其他注意事项
- printf源码详解
默认参数提升
注意,默认参数提升仅对可变参数列表有效 ,其规则是:char 和 short 自动提升为 int,float 自动提升为 double 。
比如我们一定知道,%f
用来输出 float,%lf
则用来输出 double;但实际上 %f
可以同时表示 float 和 double 类型,而无需专门指定 %lf
来表示 double(因为 printf 只能看到双精度),如下图:
本操作系统未支持浮点(难度较大,非常麻烦),且笔者对浮点的硬件支持不太了解,所以下面不讨论浮点。
将 char/short 提升为 int 的原因是:可变参函数的原型无法提供参数个数以及参数类型,所以编译器无法针对各个参数生成相应代码,因此只好统一为 int 类型 。
比如
printf
的原型为:
1 int printf(const char * fmt, ...)显然,
...
(即可变参数列表)无法提供参数的个数和类型。值得一提的是,printf
中的f
就是指的format
。
这么说原因大家可能还不太明白什么意思,下面笔者用代码进行解释,先来看普通函数:
1 | void test(int a, short b, char c); |
该文件生成的反汇编为:
1 | 00000000 <main>: |
从第 34~36 行就可以看出参数类型的区别:int、short、char 对应的反汇编分别为 DWORD、WORD、BYTE ,也就是说,编译器为不同的类型生成了不同的代码。
笔者以前想当然地认为函数参数类型影响的是压栈的字节数,比如将 char 压入栈,对应的反汇编就应该为
push BYTE PTR [xxx]
;实际上并非如此,不论是 char、short、int 或是 long、long long,编译器都会压入 4 字节(对于 long long 8 字节,分两次压入) ,这点从 15~17 行就能体现。所以参数类型影响的不是压栈,而影响的是从栈中取值或赋值。
那么对于可变参数列表,默认参数提升是如何体现的呢?待会讲解 printf
源码时再回过头来说这点。
可变参数的类型检查
还是由于可变参数列表无法提供参数类型,所以编译器无法对参数进行类型检查,换句话说,编译器不能执行默认的类型转换,通常也不会报错 。对于普通函数而言,如果实参和形参类型不匹配,编译器会将实参隐式转换为形参类型,如下:
而对于可变参数函数,编译器则无法将实参隐式转换为形参类型,如下:
所以程序员必须自己确保参数类型的匹配或手动强制转换。
可变参数函数实现原理
想要实现可变参数,最重要的是明白其函数的调用方式,如果没有特定的函数调用约定,可变参数将无从谈起。可变参数函数的调用方式必须满足以下两个条件:
-
从右向左压栈
为什么要从右往左入栈? 因为如果从左向右,编译器就不知道用户传入了多少实参。参数的信息是由第一个参数
fmt...
确定的(如printf (“% s % s”,str1 ,str2)
的参数信息是通过检测两个%s
来获取的)。若从左向右压栈,fmt...
就被放入了栈底,而 esp 由于不清楚参数个数和类型,就无法跨过这些参数来指向fmt...
,因此无法获取各个参数的信息。相反,若从右向左压栈,fmt...
就存放在栈顶,这样就可以直接通过它得知参数的个数和类型,进而准确从栈中取得各个参数。 -
外平栈(调用者平栈)
必须由调用者平栈的原因是:只有调用者才知道压入了几个参数,所以也只能由调用者进行平栈。读者可能感到疑惑,为什么只有调用者才知道压入了几个参数?仍然拿
printf
举例,是这样的:printf
作为库函数,是提前被编译好了的(一般作为动态链接库),最后直接与我们自己编写生成的可重定位文件链接在一起,从而生成可执行文件;所以printf
完全不知道实际压入了多少个参数(因为压参是由我们的编译器进行的)!因此也就无法由printf
自己来完成平栈。相反,如果是调用方本身来调用的printf
,理所应当地,调用方就知道自己向栈中压入了多少个参数,所以调用方就可以承担平栈任务,如下代码:1
2
3
4
5
6
7
8
9
10
11
12int main()
{
printf("%d %c", 1, 2);
}
//对应汇编:
//......省略
00BF17E1 push 2
00BF17E3 push 1
00BF17E5 push offset string "%d\n" (0BF7BD8h)
00BF17EA call _printf
00BF17EF add esp,0Ch
//......省略call 之前,编译器 push 了三次,所以它当然知道平栈需要 add esp,0xC !而 printf 是已经编好的库,它就不知道 push 了几次。
而 __cdel 调用约定就符合以上两个规则,所以可变参函数必须使用此方式。值得一提的是,__cdel 是 C/C++ 默认方式。
有了以上两种条件的支持,现在无非就是处理 fmt...
获取参数信息,然后从栈中取得参数即可。这就是咋们接下来要干的事。
其他注意事项
需要打印%咋办?
这点相信大部分读者都清楚,打印百分号需要再加个百分号,如下:
1 | printf("这是百分号%%"); |
很多小白会在 %
前加 \
,即 printf("\%")
来输出百分号。出现这种想法是因为没有理解转义字符的意义,要知道,\n
是一个 ASCII 码(10),由编译器负责将 \n
转为 10 。而 \%
可不是转义字符,对 %
的处理是由我们的代码负责,而不是由编译器负责!
printf实参问题
很多读者应该都像下面这种方式调用过 printf 吧:
1 | printf("%d",110); |
这种方式有什么不对吗?结果正确,但这种调用方式十分危险。这是因为,110
没有指明类型,所以根据前面的默认参数提升,110
被视为 int,这符合 %d
,所以能够正确输出。但是碰到下面这种情况呢?
1 | printf("%lld",110); |
结果就变得诡异,输出如下:
这是因为 110
被编译器视为 int(4字节),但 printf 内部代码根据 %lld
将 110
视为 long long(8字节),在定位参数时,将 long long* 指针指向 110
所在的位置,那么用该指针解释数据的时候,将会把 110
后面的四字节包含进去,而这四字节中的数据是未定义的,所以造成以上错误。再来看下面的调用:
怎么这种情况又能够正确显示呢?这是因为编译器判定 0xfffffffff
无法用 int 装下,所以该值的类型就变为了 long long,因此能够正确输出。正确的调用方式需要加上强制转换:
1 | printf("%lld",(long long)110); |
看完 printf 源码后,你会对上述行为有深刻理解。
printf源码剖析
说明:
- 以下源码来自 Linux 0.11 ,也就是 Linus Torvalds 编写的初代 Linux ,所以其功能肯定不如现在的 printf 强大,这点读者需要清楚。
- printk(print kernel)和 printf 的功能完全相同,只不过前者是在内核中使用的打印函数,而后者是在用户态中使用的打印函数。
- 为了契合咋们的操作系统,笔者会将 printk 作轻微修改,使其能够在用户态下使用(此时也就变成了 printf ),这不会影响对 printf 的理解。
以下是原版的 printk
:
1 | static char buf[1024]; |
提供原版的 printk 只是为了与下面咋们改进后的 printf 形成对比,大家无需纠结上面的代码。以下是我们操作系统的 printf
:
1 | static char buf[1024]; |
- 可见,除了第 9 行外,其他完全相同。实际上,第 9 行将最终的字符串传给我们之前实现的系统调用 write,由 write 进行打印。另外,正因为 write 是系统调用,所以该 printf 既可以供内核使用,也可以供用户使用 。
printf
返回字符个数。
接下来重点说明处理可变参数的四个宏: va_list
、va_start
、va_end
和 va_arg
。
可变参数宏
首先要破除大家的先入为主,别以为这四个宏是用来处理可变参数的,就觉得它们高大上,有什么特异功能,实际上这四个家伙的本质就普普通通:
1 | typedef char* va_list; |
-
va_list
就是 char 指针类型,该指针(args)用来在栈中依次遍历各个参数* 。 -
va_start
的作用是将 args 指针指向参数列表(即...
)中的第一个参数 。p = (char*)&fmt + sizeof(char*)
就是令 p 跳过栈中的 fmt ,指向栈中的下一个参数,即参数列表中的第一个参数。注意必须对 fmt 取地址,得到该指针的地址,也就是该指针在栈中的位置,&fmt
为二级指针,还需要强制转换为一级指针 char* 。 -
va_end
的作用是将 args 指针置 NULL 。 -
va_arg
出现在下面的vsprintf
函数中,va_arg
的作用是返回当前 args 指向的参数的值,然后 args 向后移动,指向下一个参数 。__va_rounded_size(type)
也是一个宏,用来得到取整后的 type 类型的大小,是 int 的整数倍 ,比如 type 为 char,则返回 4;type 为 long long,则返回 8 ,其实现如下:1
2注意,va_arg 宏定义是一个逗号表达式,第一个表达式根据目前所指参数 A 的大小,将指针 p 移向了下一个参数 B(+=,p的值已经被改变);接着将 A 的值返回(逗号表达式中的最后一个式子作为返回值)。顺便提一下,如果按照《操作系统真相还原》中的代码,将无法应对 long long 的情况。
接着来看 vsprintf 。
vsprintf
vsprintf 的作用是格式化字符串,也就是将参数列表中的所有参数值填入到 fmt 中的对应位置,并将最终的字符串存入 buf 。fmt
中的格式符,如 %d
、%s
等都在此函数中进行处理。在讲解该函数代码前,有必要先复习 printf 的用法,否则看代码时将一头雾水。
我们将 %s
这样的格式称之为一个 format 标签,format 标签的完整格式如下:
1 | %[flags][width][.precision][length]specifier |
比如下面这样的 printf 调用:
1 | printf("%-10ld"); |
其中的 -
为 flags,即指明左对齐;10
为 width,即指明输出宽度;l
为长度,对于 d
而言,即输出长整型 long;d
为 specifier,指明输出整型。
具体规则如下:
flags | 描述 |
---|---|
- | 在给定的字段宽度内左对齐,默认是右对齐 |
+ | 强制在结果之前显示加号或减号(+ 或 -),即正数前面会显示 + 号。默认情况下,只有负数前面会显示一个 - 号。 |
空格 | 如果没有写入任何符号,则在该值前面插入一个空格。 |
# | 与 o、x 或 X 说明符一起使用时,非零值前面会分别显示 0、0x 或 0X。由于本操作系统暂不支持小数,所以不说明 # 对 f、e、g 等说明符的影响。 |
0 | 在左边填充零,而不是空格 |
width | 描述 |
---|---|
number | 要输出的字符的最小数目。如果输出的值短于该数,结果会用空格填充;如果输出的值长于该数,结果不会被截断。 |
* | 宽度在 format 字符串中未指定,但是会作为附加整数值参数放置于可变参数列表中,由该参数指定宽度。 |
.precision(精度) | 描述 |
---|---|
.number | 对于整数说明符(d、i、o、u、x、X):precision 指定了要写入的数字的最小位数。如果写入的值短于该数,结果会用前导零来填充。如果写入的值长于该数,结果不会被截断。精度为 0 意味着不写入任何字符。 对于 s:要输出的最大字符数。默认情况下,所有字符都会被输出,直到遇到末尾的空字符。 对于 c:没有任何影响。 当未指定任何精度时,默认为 1。 |
.* | 精度在 format 字符串中未指定,但是会作为附加整数值参数放置于可变参数列表中,由该参数指定精度。 |
length | 描述 |
---|---|
h | 参数被解释为短整型或无符号短整型 short(仅适用于整数说明符:i、d、o、u、x 和 X)。 |
l | 参数被解释为长整型或无符号长整型 long,适用于整数说明符(i、d、o、u、x 和 X)及说明符 c(表示一个宽字符)和 s(表示宽字符字符串)。 |
L | 参数被解释为长双精度型(仅适用于浮点数说明符:e、E、f、g 和 G)。本操作系统不支持。 |
ll | 本操作系统中,ll 仅被解释为 无符号 long long,适用于整数说明符。 |
格式字符 | 意义 |
---|---|
d | 以十进制形式输出带符号整数(正数不输出符号) |
i | 和 d 完全相同 |
o | 以八进制形式输出无符号整数(不输出前缀0) |
x,X | 以十六进制形式输出无符号整数(不输出前缀Ox) |
u | 以十进制形式输出无符号整数 |
c | 输出单个字符 |
s | 输出字符串 |
p | 输出指针地址 |
n | 到目前为止成功写入缓冲区的字符数,此值存储在指定的整数中,其地址作为参数给出。 |
下面做几个示范:
了解以上格式后,再来看 vsprintf 就十分轻松啦,总的来说,该函数就是在依次处理 flags --> width --> .precision --> length --> specifier 。代码如下:
1 | //定义成2的倍数,是因为我们将flag变量视为位图,将属性保存到各个二进制位上 |
注释得比较清楚,对照之前的规则来看代码就很容易理清其中的逻辑,不再详细说明。提一点,看第 90 行,va_arg(args, int)
,这说明从栈中取字符时,是以 int 大小来取的( 这里就体现了默认参数提升 ),然后再被强制转换为 char 。为什么不能 va_arg(args,char)
呢?实际上这样完全能够准确获取栈中字符的值,但如果这样的话,下一次使用 va_arg 宏取参数时,args 指针就指向了该字符的下一字节,但下一个参数应该是在该字符的四字节后,这无疑将引发错误,图示如下:
代码中还用到了 skip_atoi() 和 number() 函数,代码如下:
1 |
|
注释详尽,不再说明。
值得一提的是,该版 printf 有许多不足,例如不支持 %hd
(short),%lld
(long long) ,下节printf加强版中我们会增加这两个功能。
本文结束。