putchar('');
}
if(nflg==0)
putchar('\n');
return0;
}
上面代码中,加亮区域仔细研究一下,会发现很有趣。
echo程序中,对于命令行参数的解析是手动实现的。
很久以前,Unix支持小组为了简化对于命令行参数的解析,开发了getopt()函数,同时提供了几个外部变量,使得编写遵守POSIX的代码变得更加容易了。
5、命令行参数解析函数——getopt()
getopt()函数声明如下:
#include
intgetopt(intargc,char*constargv[],constchar*optstring);
externchar*optarg;
externintoptind,opterr,optopt;
该函数的argc和argv参数通常直接从main()的参数直接传递而来。
optstring是选项字母组成的字串。
如果该字串里的任一字符后面有冒号,那么这个选项就要求有选项参数。
当给定getopt()命令参数的数量(argc)、指向这些参数的数组(argv)和选项字串(optstring)后,getopt()将返回第一个选项,并设置一些全局变量。
使用相同的参数再次调用该函数时,它将返回下一个选项,并设置相应的全局变量。
如果不再有可识别的选项,将返回-1,此任务就完成了。
getopt()所设置的全局变量包括:
char*optarg——当前选项参数字串(如果有)。
intoptind——argv的当前索引值。
当getopt()在while循环中使用时,循环结束后,剩下的字串视为操作数,在argv[optind]至argv[argc-1]中可以找到。
intopterr——这个变量非零时,getopt()函数为“无效选项”和“缺少参数选项,并输出其错误信息。
intoptopt——当发现无效选项字符之时,getopt()函数或返回'?
'字符,或返回':
'字符,并且optopt包含了所发现的无效选项字符。
下面就用getopt()来写个小程序,体验一下命令行解析的快乐。
程序描述:
程序名:
opt_parse_demo
选项:
-n——显示我的名字。
-g——显示我女朋友的名字。
-l——带参数的选项.
清单2:
#include
#include
intmain(intargc,char**argv)
{
intoc;/*选项字符*/
char*b_opt_arg;/*选项参数字串*/
while((oc=getopt(argc,argv,"ngl:
"))!
=-1)
{
switch(oc)
{
case'n':
printf("MynameisLyong.\n");
break;
case'g':
printf("HernameisXxiong.\n");
break;
case'l':
b_opt_arg=optarg;
printf("Ourloveis%s\n",optarg);
break;
}
}
return0;
}
运行结果:
$./opt_parse_demo-n
MynameisLyong.
$./opt_parse_demo-g
HernameisXxiong.
$./opt_parse_demo-lforever
Ourloveisforever
$./opt_parse_demo-nglforever
MynameisLyong.
HernameisXxiong.
Ourloveisforever
6、改变getopt()对错误命令行参数信息的输出行为
不正确的调用程序在所难免,这种错误要么是命令行选项无效,要么是缺少选项参数。
正常情况下,getopt()会为这两种情况输出自己的出错信息,并且返回'?
'。
为了验证此事,可以修改一下上面的清单2中的代码。
清单3:
#include
#include
intmain(intargc,char**argv)
{
intoc;/*选项字符*/
char*b_opt_arg;/*选项参数字串*/
while((oc=getopt(argc,argv,"ngl:
"))!
=-1)
{
switch(oc)
{
case'n':
printf("MynameisLyong.\n");
break;
case'g':
printf("HernameisXxiong.\n");
break;
case'l':
b_opt_arg=optarg;
printf("Ourloveis%s\n",optarg);
break;
case'?
':
printf("argumentserror!
\n");
break;
}
}
return0;
}
输入一个错误的命令行,结果如下:
$./opt_parse_demo-l
./opt_parse_demo:
optionrequiresanargument--l
argumentserror!
很多时候,我们不希望输出任何错误信息,或更希望输出自己定义的错误信息。
可以采用以下两种方法来更改getopt()函数的出错信息输出行为:
在调用getopt()之前,将opterr设置为0,这样就可以在getopt()函数发现错误的时候强制它不输出任何消息。
如果optstring参数的第一个字符是冒号,那么getopt()函数就会保持沉默,并根据错误情况返回不同字符,如下:
“无效选项”——getopt()返回'?
',并且optopt包含了无效选项字符(这是正常的行为)。
“缺少选项参数”——getopt()返回':
',如果optstring的第一个字符不是冒号,那么getopt()返回'?
',这会使得这种情况不能与无效选项的情况区分开。
多说无益,动手测试一下。
清单4:
#include
#include
intmain(intargc,char**argv)
{
intoc;/*选项字符*/
charec;/*无效的选项字符*/
char*b_opt_arg;/*选项参数字串*/
while((oc=getopt(argc,argv,":
ngl:
"))!
=-1)
{
switch(oc)
{
case'n':
printf("MynameisLyong.\n");
break;
case'g':
printf("HernameisXxiong.\n");
break;
case'l':
b_opt_arg=optarg;
printf("Ourloveis%s\n",optarg);
break;
case'?
':
ec=(char)optopt;
printf("无效的选项字符\'%c\'!
\n",ec);
break;
case':
':
printf("缺少选项参数!
\n");
break;
}
}
return0;
}
测试结果:
$./opt_parse_demo-a
无效的选项字符'a'!
$./opt_parse_demo-l
缺少选项参数!
7、GNU提供的getopt()函数的特点
上面所设计的getopt()函数是UNIX支持小组提供的,其执行时一碰到不以'-'开始的命令行参数就停止寻找选项。
而GNU提供的getopt()函数与之不同,它会扫描整个命令行来寻找选项。
当调用GNUgetopt()函数并处理命令行参数的时候,它重新排列argv中的元素,这样当重排结束时,所有选项都被移动到前面并且那些继续检查argv[optind]至argv[argc-1]中剩余参数的代码仍正常工作,但在任何情况下,碰到特殊参数'--'就结束对选项的扫描。
可以输入一个乱序的命令行,查看opt_parse_demo的输出:
$./opt_parse_demo-lforeverabcd-g-n
Ourloveisforever
HernameisXxiong.
MynameisLyong.
GNUgetopt()第二个特点是可以在optstring中使用特殊的首字符改变getopt()的默认行为:
optstring[0]='+',这样就与UNIX支持小组提供的getopt()很相近了。
optstring[0]='-',会在optarg中得到命令行中的每个参数。
以上两种情况下,':
'可以作为第二个字符使用。
GNUgetopt()第三个特点是optstring中的选项字符后面接两个冒号,就允许该选项有可选的选项参数。
在选项参数不存在的情况下,GNUgetopt()返回选项字符并将optarg设置为NULL。
8、GNU长选项命令行解析
20世纪90年代,UNIX应用程序开始支持长选项,即一对短横线、一个描述性选项名称,还可以包含一个使用等号连接到选项的参数。
GNU提供了getopt-long()和getopt-long-only()函数支持长选项的命令行解析,其中,后者的长选项字串是以一个短横线开始的,而非一对短横线。
getopt_long()是同时支持长选项和短选项的getopt()版本。
下面是它们的声明:
#include
intgetopt_long(intargc,char*constargv[],constchar*optstring,conststructoption*longopts,int*longindex);
intgetopt_long_only(intargc,char*constargv[],constchar*optstring,conststructoption*longopts,int*longindex);
getopt_long()的前三个参数与上面的getopt()相同,第4个参数是指向option结构的数组,option结构被称为“长选项表”。
longindex参数如果没有设置为NULL,那么它就指向一个变量,这个变量会被赋值为寻找到的长选项在longopts中的索引值,这可以用于错误诊断。
option结构在getopt.h中的声明如下:
structoption{
constchar*name;
inthas_arg;
int*flag;
intval;
};
对结构中的各元素解释如下:
constchar*name
这是选项名,前面没有短横线。
譬如"help"、"verbose"之类。
inthas_arg
描述了选项是否有选项参数。
如果有,是哪种类型的参数,此时,它的值一定是下表中的一个。
符号常量数值含义
no_argument0选项没有参数
required_argument1选项需要参数
optional_argument2选项参数可选
int*flag
如果这个指针为NULL,那么getopt_long()返回该结构val字段中的数值。
如果该指针不为NULL,getopt_long()会使得它所指向的变量中填入val字段中的数值,并且getopt_long()返回0。
如果flag不是NULL,但未发现长选项,那么它所指向的变量的数值不变。
intval
这个值是发现了长选项时的返回值,或者flag不是NULL时载入*flag中的值。
典型情况下,若flag不是NULL,那么val是个真/假值,譬如1或0;另一方面,如果flag是NULL,那么val通常是字符常量,若长选项与短选项一致,那么该字符常量应该与optstring中出现的这个选项的参数相同。
每个长选项在长选项表中都有一个单独条目,该条目里需要填入正确的数值。
数组中最后的元素的值应该全是0。
数组不需要排序,getopt_long()会进行线性搜索。
但是,根据长名字来排序会使程序员读起来更容易。
以上所说的flag和val的用法看上去有点混乱,但它们很有实用价值,因此有必要搞透彻了。
大部分时候,程序员会根据getopt_long()发现的选项,在选项处理过程中要设置一些标记变量,譬如在使用getopt()时,经常做出如下的程序格式:
intdo_name,do_gf_name,do_love;/*标记变量*/
char*b_opt_arg;
while((c=getopt(argc,argv,":
ngl:
"))!
=-1)
{
switch(c){
case'n':
do_name=1;
case'g':
do_gf_name=1;
break;
break;
case'l':
b_opt_arg=optarg;
……
}
}
当flag不为NULL时,getopt_long*()会为你设置标记变量。
也就是说上面的代码中,关于选项'n'、'l'的处理,只是设置一些标记,如果flag不为NULL,时,getopt_long()可以自动为各选项所对应的标记变量设置标记,这样就能够将上面的switch语句中的两种种情况减少到了一种。
下面给出一个长选项表以及相应处理代码的例子。
清单5:
#include
#include
intdo_name,do_gf_name;
char*l_opt_arg;
structoptionlongopts[]={
{"name",no_argument,&do_name,1},
{"gf_name",no_argument,&do_gf_name,1},
{"love",required_argument,NULL,'l'},
{0,0,0,0},
};
intmain(intargc,char*argv[])
{
intc;
while((c=getopt_long(argc,argv,":
l:
",longopts,NULL))!
=-1){
switch(c){
case'l':
l_opt_arg=optarg;
printf("Ourloveis%s!
\n",l_opt_arg);
break;
case0:
printf("getopt_long()设置变量:
do_name=%d\n",do_name);
printf("getopt_long()设置变量:
do_gf_name=%d\n",do_gf_name);
break;
}
}
return0;
}
在进行测试之前,再来回顾一下有关option结构中的指针flag的说明吧。
如果这个指针为NULL,那么getopt_long()返回该结构val字段中的数值。
如果该指针不为NULL,getopt_long()会使得它所指向的变量中填入val字段中的数值,并且getopt_long()返回0。
如果flag不是NULL,但未发现长选项,那么它所指向的变量的数值不变。
下面测试一下:
$./long_opt_demo--name
getopt_long()设置变量:
do_name=1
getopt_long()设置变量:
do_gf_name=0
$./long_opt_demo--gf_name
getopt_long()设置变量:
do_name=0
getopt_long()设置变量:
do_gf_name=1
$./long_opt_demo--loveforever
Ourloveisforever!
$./long_opt_demo-lforever
Ourloveisforever!
测试过后,应该有所感触了。
关于flag和val的讨论到此为止。
下面总结一下get_long()的各种返回值的含义:
返回值含义
0getopt_long()设置一个标志,它的值与option结构中的val字段的值一样
1每碰到一个命令行参数,optarg都会记录它
'?
'无效选项
':
'缺少选项参数
'x'选项字符'x'
-1选项解析结束
从实用的角度来说,我们更期望每个长选项都对应一个短选项,这种情况下,在option结构中,只要将flag设置为NULL,并将val设置为长选项所对应的短选项字符即可。
譬如上面清单5中的程序,我们修改如下。
清单6:
#include
#include
intdo_name,do_gf_name;
char*l_opt_arg;
structoptionlongopts[]={
{"name",no_argument,NULL,'n'},
{"gf_name",no_argument,NULL,'g'},
{"love",required_argument,NULL,'l'},
{0,0,0,0},
};
intmain(intargc,char*argv[])
{
intc;
while((c=getopt_long(argc,argv,":
l:
",longopts,NULL))!
=-1){
switch(c){
case'n':
printf("MynameisLYR.\n");
break;
case'g':
printf("HernameisBX.\n");
break