String类函数用法总结3Word文档下载推荐.docx
《String类函数用法总结3Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《String类函数用法总结3Word文档下载推荐.docx(10页珍藏版)》请在冰豆网上搜索。
输出信息
你可以用C++或者C语言去实现这个流程。
如果一个人的主要工作就是处理这种类似的文本(例如做apache的日志统计和分析),你说他会喜欢C/C++么?
当然,有了STL,这些处理会得到很大的简化。
我们可以使用fstream来代替麻烦的fopenfreadfclose,用vector来代替数组。
最重要的是用string来代替char*数组,使用sort排序算法来排序,用unique函数来去重。
听起来好像很不错。
看看下面代码(例程1):
#include<
string>
iostream>
algorithm>
vector>
fstream>
usingnamespacestd;
intmain(){
ifstreamin("
name.txt"
);
stringstrtmp;
vector<
vect;
while(getline(in,strtmp,'
\n'
))
vect.push_back(strtmp.substr(0,strtmp.find('
'
)));
sort(vect.begin(),vect.end());
:
iteratorit=unique(vect.begin(),vect.end());
copy(vect.begin(),it,ostream_iterator<
(cout,"
\n"
));
return0;
}
也还不错吧,至少会比想象得要简单得多!
(代码里面没有对错误进行处理,只是为了说明问题,不要效仿).
当然,在这个文本格式中,不用vector而使用map会更有扩充性,例如,还可通过人名找电话号码等等,但是使用了map就不那么好用sort了。
你可以用map试一试。
这里string的作用不只是可以存储字符串,还可以提供字符串的比较,查找等。
在sort和unique函数中就默认使用了less和equal_to函数,上面的一段代码,其实使用了string的以下功能:
存储功能,在getline()函数中
查找功能,在find()函数中
子串功能,在substr()函数中
stringoperator<
默认在sort()函数中调用
stringoperator==,默认在unique()函数中调用
总之,有了string后,C++的字符文本处理功能总算得到了一定补充,加上配合STL其他容器使用,其在文本处理上的功能已经与perl,shell,php的距离缩小很多了。
因此掌握string会让你的工作事半功倍。
其实,string并不是一个单独的容器,只是basic_string模板类的一个typedef而已,相对应的还有wstring,你在string头文件中你会发现下面的代码:
extern"
C++"
{
typedefbasic_string<
char>
string;
wchar_t>
wstring;
}//extern"
由于只是解释string的用法,如果没有特殊的说明,本文并不区分string和basic_string的区别。
string其实相当于一个保存字符的序列容器,因此除了有字符串的一些常用操作以外,还有包含了所有的序列容器的操作。
字符串的常用操作包括:
增加、删除、修改、查找比较、链接、输入、输出等。
详细函数列表参看附录。
不要害怕这么多函数,其实有许多是序列容器带有的,平时不一定用的上。
如果你要想了解所有函数的详细用法,你需要查看basic_string,或者下载STL编程手册。
这里通过实例介绍一些常用函数。
string重载了许多操作符,包括+,+=,<
=,,[],<
<
>
>
等,正式这些操作符,对字符串操作非常方便。
先看看下面这个例子:
tt.cpp(例程2)
stringstrinfo="
Pleaseinputyourname:
"
;
cout<
strinfo;
cin>
strinfo;
if(strinfo=="
winter"
)
"
youarewinter!
endl;
elseif(strinfo!
="
wende"
youarenotwende!
elseif(strinfo<
)
yournameshouldbeaheadofwinter"
else
yournameshouldbeafterofwinter"
strinfo+="
WelcometoChina!
strinfo<
Yournameis:
stringstrtmp="
Howareyou?
+strinfo;
for(inti=0;
i<
strtmp.size();
i++)
cout<
strtmp[i];
下面是程序的输出
-bash-2.05b$makett
c++-O-pipe-march=pentiumprott.cpp-ott
-bash-2.05b$./tt
Hero
Hero,WelcometoChina!
Hero,WelcometoChina!
有了这些操作符,在STL中仿函数都可以直接使用string作为参数,例如less,great,equal_to等,因此在把string作为参数传递的时候,它的使用和int或者float等已经没有什么区别了。
例如,你可以使用:
map<
string,int>
mymap;
//以上默认使用了less<
有了operator+以后,你可以直接连加,例如:
Winter"
stringstrlast="
Hello"
+strinfo+"
!
//你还可以这样:
stringstrtest="
Welcome"
+"
toChina"
!
看见其中的特点了吗?
只要你的等式里面有一个string对象,你就可以一直连续"
+"
,但有一点需要保证的是,在开始的两项中,必须有一项是string对象。
其原理很简单:
系统遇到"
号,发现有一项是string对象。
系统把另一项转化为一个临时string对象。
执行operator+操作,返回新的临时string对象。
如果又发现"
号,继续第一步操作。
由于这个等式是由左到右开始检测执行,如果开始两项都是constchar*,程序自己并没有定义两个constchar*的加法,编译的时候肯定就有问题了。
有了操作符以后,assign(),append(),compare(),at()等函数,除非有一些特殊的需求时,一般是用不上。
当然at()函数还有一个功能,那就是检查下标是否合法,如果是使用:
stringstr="
//下面一行有可能会引起程序中断错误
str[100]='
'
//下面会抛出异常:
throws:
out_of_range
str.at(100)<
了解了吗?
如果你希望效率高,还是使用[]来访问,如果你希望稳定性好,最好使用at()来访问。
由于查找是使用最为频繁的功能之一,string提供了非常丰富的查找函数。
其列表如下:
函数名描述find查找rfind反向查找find_first_of查找包含子串中的任何字符,返回第一个位置find_first_not_of查找不包含子串中的任何字符,返回第一个位置find_last_of查找包含子串中的任何字符,返回最后一个位置find_last_not_of查找不包含子串中的任何字符,返回最后一个位置以上函数都是被重载了4次,以下是以find_first_of函数为例说明他们的参数,其他函数和其参数一样,也就是说总共有24个函数:
size_typefind_first_of(constbasic_string&
s,size_typepos=0)
size_typefind_first_of(constcharT*s,size_typepos,size_typen)
size_typefind_first_of(constcharT*s,size_typepos=0)
size_typefind_first_of(charTc,size_typepos=0)
所有的查找函数都返回一个size_type类型,这个返回值一般都是所找到字符串的位置,如果没有找到,则返回string:
npos。
有一点需要特别注意,所有和string:
npos的比较一定要用string:
size_type来使用,不要直接使用int或者unsignedint等类型。
其实string:
npos表示的是-1,看看头文件:
template<
class_CharT,class_Traits,class_Alloc>
constbasic_string<
_CharT,_Traits,_Alloc>
size_type
basic_string<
npos
=basic_string<
size_type)-1;
find和rfind都还比较容易理解,一个是正向匹配,一个是逆向匹配,后面的参数pos都是用来指定起始查找位置。
对于find_first_of和find_last_of就不是那么好理解。
find_first_of是给定一个要查找的字符集,找到这个字符集中任何一个字符所在字符串中第一个位置。
或许看一个例子更容易明白。
有这样一个需求:
过滤一行开头和结尾的所有非英文字符。
看看用string如何实现:
//*---HelloWord!
......------"
stringstrset="
ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz"
intfirst=strinfo.find_first_of(strset);
if(first==string:
npos){
notfindanycharacters"
return-1;
intlast=strinfo.find_last_of(strset);
if(last==string:
strinfo.substr(first,last-first+1)<
这里把所有的英文字母大小写作为了需要查找的字符集,先查找第一个英文字母的位置,然后查找最后一个英文字母的位置,然后用substr来的到中间的一部分,用于输出结果。
下面就是其结果:
HelloWord
前面的符号和后面的符号都没有了。
像这种用法可以用来查找分隔符,从而把一个连续的字符串分割成为几部分,达到shell命令中的awk的用法。
特别是当分隔符有多个的时候,可以一次指定。
例如有这样的需求:
张三|3456123,湖南
李四,4564234|湖北
王小二,4433253|北京
我们需要以"
|"
"
为分隔符,同时又要过滤空格,把每行分成相应的字段。
可以作为你的一个家庭作业来试试,要求代码简洁。
1.3stringinsert,replace,erase
了解了string的操作符,查找函数和substr,其实就已经了解了string的80%的操作了。
insert函数,replace函数和erase函数在使用起来相对简单。
下面以一个例子来说明其应用。
string只是提供了按照位置和区间的replace函数,而不能用一个string字串来替换指定string中的另一个字串。
这里写一个函数来实现这个功能:
voidstring_replace(string&
strBig,conststring&
strsrc,conststring&
strdst){
string:
size_typepos=0;
size_typesrclen=strsrc.size();
size_typedstlen=strdst.size();
while((pos=strBig.find(strsrc,pos))!
=string:
npos){
strBig.replace(pos,srclen,strdst);
pos+=dstlen;
}看看如何调用:
intmain(){
ThisisWinter,Winterisaprogrammer.DoyouknowWinter?
Orignstringis:
strinfo<
string_replace(strinfo,"
"
AfterreplaceWinterwithwende,thestringis:
}其输出结果:
Thisiswende,wendeisaprogrammer.Doyouknowwende?
如果不用replace函数,则可以使用erase和insert来替换,也能实现string_replace函数的功能:
strBig.erase(pos,srclen);
strBig.insert(pos,strdst);
}当然,这种方法没有使用replace来得直接。
2string和C风格字符串
现在看了这么多例子,发现constchar*可以和string直接转换,例如我们在上面的例子中,使用
来代用
strdst)在C语言中只有char*和constchar*,为了使用起来方便,string提供了三个函数满足其要求:
constcharT*c_str()const
constcharT*data()const
size_typecopy(charT*buf,size_typen,size_typepos=0)const其中:
c_str直接返回一个以\0结尾的字符串。
data直接以数组方式返回string的内容,其大小为size()的返回值,结尾并没有\0字符。
copy把string的内容拷贝到buf空间中。
你或许会问,c_str()的功能包含data(),那还需要data()函数干什么?
看看源码:
constcharT*c_str()const
{if(length()==0)return"
terminate();
returndata();
}原来c_str()的流程是:
先调用terminate(),然后在返回data()。
因此如果你对效率要求比较高,而且你的处理又不一定需要以\0的方式结束,你最好选择data()。
但是对于一般的C函数中,需要以constchar*为输入参数,你就要使用c_str()函数。
对于c_str()data()函数,返回的数组都是由string本身拥有,千万不可修改其内容。
其原因是许多string实现的时候采用了引用机制,也就是说,有可能几个string使用同一个字符存储空间。
而且你不能使用sizeof(string)来查看其大小。
详细的解释和实现查看EffectiveSTL的条款15:
小心string实现的多样性。
另外在你的程序中,只在需要时才使用c_str()或者data()得到字符串,每调用一次,下次再使用就会失效,如:
stringstrinfo("
thisisWinter"
//最好的方式是:
foo(strinfo.c_str());
//也可以这么用:
constchar*pstr=strinfo.c_str();
foo(pstr);
//不要再使用了pstr了,下面的操作已经使pstr无效了。
Hello!
//错误!
会遇到什么错误?
当你幸运的时候pstr可能只是指向"
thisisWinterHello!
的字符串,如果不幸运,就会导致程序出现其他问题,总会有一些不可遇见的错误。
总之不会是你预期的那个结果。
了解了string的用法,该详细看看string的真相了。
前面提到string只是basic_string的一个typedef。
看看basic_string的参数:
classcharT,classtraits=char_traits<
charT>
classAllocator=allocator<
>
classbasic_string
{
//...
}char_traits不仅是在basic_string中有用,在basic_istream和basic_ostream中也需要用到。
就像SteveDonovan在过度使用C++模板中提到的,这些确实有些过头了,要不是系统自己定义了相关的一些属性,而且用了个typedef,否则还真不知道如何使用。
但复杂总有复杂道理。
有了char_traits,你可以定义自己的字符串类型。
当然,有了char_traits<
char>
和char_traits<
wchar_t>
你的需求使用已经足够了,为了更好的理解string,咱们来看看char_traits都有哪些要求。
如果你希望使用你自己定义的字符,你必须定义包含下列成员的结构:
表达式描述
char_type字符类型
int_typeint类型
pos_type位置类型
off_type表示位置之间距离的类型
state_type表示状态的类型
assign(c1,c2)把字符c2赋值给c1
eq(c1,c2)判断c1,c2是否相等
lt(c1,c2)判断c1是否小于c2
length(str)判断str的长度
compare(s1,s2,n)比较s1和s2的前n个字符
copy(s1,s2,n)把s2的前n个