Beej网络socket编程指南.docx
《Beej网络socket编程指南.docx》由会员分享,可在线阅读,更多相关《Beej网络socket编程指南.docx(53页珍藏版)》请在冰豆网上搜索。
Beej网络socket编程指南
Beej网络socket编程指南0
BSDSocket简易入门手册
BSDSocket简易入门手册翻译:
WilburLang介绍类比(什么是socket?
)装上你的新电话(怎样侦听?
)拨号(如何调用socket)谈话(如何通过sockets交谈)挂起(结束)世界语(交流的语言很重要)未来在你的掌握了(下一步?
)介绍当你进入UNIX的神秘世界后,立刻会发现越来越多的东西难以理解。
对于大多数人来说,BSDsocket的概念就是其中一个。
这是一个很短的教程来解释他们是什么、他们如何工作并给出一些简单的代码来解释如何使用他们。
类比(什么是socket?
)socket是进行程序间通讯(IPC)的BSD方法。
这意味着socket用来让一个进程和其他的进程互通信息,就象我们用电话来和其他的人交流一样。
用电话来比喻是很恰当的,我们在后面将一直用电话这个概念来描叙socket。
装上你的新电话(怎样侦听?
)一个人要能够收到别人打给他的电话,首先他要装上一门电话。
同样,你必须先建立socket以侦听线路。
这个过程包含几个步骤。
首先,你要建立一个新的socket,就象先装上电话一样。
socket()命令就完成这个工作。
因为sockets有几种类型,你要注明你要建立什么类型的。
你要做一个选择是socket的地址格式。
如同电话有音频和脉冲两种形式一样,socket有两个最重要的选项是AF_UNIX和IAF_INET。
AF_UNIX就象UNIX路径名一样识别sockets。
这种形式对于在同一台机器上的IPC很有用。
而AF_INET使用象192.9.200.10这样被点号隔开的四个十进制数字的地址格式。
除了机器地址以外,还可以利用端口号来允许每台机器上的多个AF_INETsocket。
我们这里将着重于AF_INET方式,因为他很有用并广泛使用。
另外一个你必须提供的参数是socket的类型。
两个重要的类型是SOCK_STREAM和SOCK_DGRAM。
SOCK_STREAM表明数据象字符流一样通过socket。
而SOCK_DGRAM则表明数据将是数据报(datagrams)的形式。
我们将讲解SOCK_STREAMsockets,他很常见并易于使用。
在建立socket后,我们就要提供socket侦听的地址了。
就象你还要个电话号码来接电话一样。
bind()函数来处理这件事情。
SOCK_STREAMsockets让连接请求形成一个队列。
如果你忙于处理一个连接,别的连接请求将一直等待到该连接处理完毕。
listen()函数用来设置最大不被拒绝的请求数(一般为5个)。
一般最好不要使用listen()函数。
下面的代码说明如何利用socket()、bind()和listen()函数建立连接并可以接受数据。
/*codetoestablishasocket;originallyfrombzs@bu-cs.bu.edu*/intestablish(unsignedshortportnum){charmyname[MAXHOSTNAME+1];ints;structsockaddr_insa;structhostent*hp;memset(&sa,0,sizeof(structsockaddr_in));/*clearouraddress*/gethostname(myname,MAXHOSTNAME);/*whoarewe?
*/hp=gethostbyname(myname);/*getouraddressinfo*/if(hp==NULL)/*wedon'texist!
?
*/return(-1);sa.sin_family=hp->h_addrtype;/*thisisourhostaddress*/sa.sin_port=htons(portnum);/*thisisourportnumber*/if((s=socket(AF_INET,SOCK_STREAM,0))<0)/*createsocket*/return(-1);if(bind(s,&sa,sizeof(structsockaddr_in))<0){close(s);return(-1);/*bindaddresstosocket*/}listen(s,3);/*max#ofqueuedconnects*/return(s);}在建立完socket后,你要等待对该socket的调用了。
accept()函数为此目的而来。
调用accept()如同在电话铃响后提起电话一样。
Accept()返回一个新的连接到调用方的socket。
下面的代码演示使用是个演示。
/*waitforaconnectiontooccuronasocketcreatedwithestablish()*/intget_connection(ints){intt;/*socketofconnection*/if((t=accept(s,NULL,NULL))<0)/*acceptconnectionifthereisone*/return(-1);return(t);}和电话不同的是,在你处理先前的连接的时候,你还可以接受调用。
为此,一般用fork来处理每个连接。
下面的代码演示如何使用establish()和get_connection()来处理多个连接。
#include/*obligatoryincludes*/#include#include#include#include#include#include#include#include#definePORTNUM50000/*randomportnumber,weneedsomething*/voidfireman(void);voiddo_something(int);main(){ints,t;if((s=establish(PORTNUM))<0){/*pluginthephone*/perror("establish");exit
(1);}signal(SIGCHLD,fireman);/*thiseliminateszombies*/for(;{/*loopforphonecalls*/if((t=get_connection(s))<0){/*getaconnection*/if(errno==EINTR)/*EINTRmighthappenonaccept(),*/continue;/*tryagain*/perror("accept");/*bad*/exit
(1);}switch(fork()){/*trytohandleconnection*/case-1:
/*badnews.screamanddie*/perror("fork");close(s);close(t);exit
(1);case0:
/*we'rethechild,dosomething*/close(s);do_something(t);exit(0);default:
/*we'retheparentsolookfor*/close(t);/*anotherconnection*/continue;}}}/*aschildrendieweshouldgetcatchtheirreturnsorelseweget*zombies,ABadThing.fireman()catchesfallingchildren.*/voidfireman(void){while(waitpid(-1,NULL,WNOHANG)>0);}/*thisisthefunctionthatplayswiththesocket.itwillbecalled*aftergettingaconnection.*/voiddo_something(ints){/*doyourthingwiththesockethere:
:
*/}拨号(如何调用socket)现在你应该知道如何建立socket来接受调用了。
那么如何调用呢?
和电话一样,你要先有个电话。
用socket()函数来完成这件事情,就象建立侦听的socket一样。
在给socket地址后,你可以用connect()函数来连接侦听的socket了。
下面是一段代码。
intcall_socket(char*hostname,unsignedshortportnum){structsockaddr_insa;structhostent*hp;inta,s;if((hp=gethostbyname(hostname))==NULL){/*doweknowthehost's*/errno=ECONNREFUSED;/*address?
*/return(-1);/*no*/}memset(&sa,0,sizeof(sa));memcpy((char*)&sa.sin_addr,hp->h_addr,hp->h_length);/*setaddress*/sa.sin_family=hp->h_addrtype;sa.sin_port=htons((u_short)portnum);if((s=socket(hp->h_addrtype,SOCK_STREAM,0))<0)/*getsocket*/return(-1);if(connect(s,&sa,sizeofsa)<0){/*connect*/close(s);return(-1);}return(s);}这个函数返回一个可以流过数据的socket。
谈话(如何通过sockets交谈)好了,你在要传输数据的双方建立连接了,现在该传输数据了。
read()和write()函数来处理吧。
除了在socket读写和文件读写中的一个区别外,和处理一般的文件一样。
区别是你一般不能得到你所要的数目的数据。
所以你要一直循环到你需要的数据的到来。
一个简单的例子:
将一定的数据读到缓存。
intread_data(ints,/*connectedsocket*/char*buf,/*pointertothebuffer*/intn/*numberofcharacters(bytes)wewant*/){intbcount;/*countsbytesread*/intbr;/*bytesreadthispass*/bcount=0;br=0;while(bcount0){bcount+=br;/*incrementbytecounter*/buf+=br;/*movebufferptrfornextread*/}elseif(br<0)/*signalanerrortothecaller*/return(-1);}return(bcount);}相同的函数也可以写数据,留给我们的读者吧。
挂起(结束)和你通过电话和某人交谈后一样,你要在socket间关闭连接。
一般close()函数用来关闭每边的socket连接。
如果一边的已经关闭,而另外一边却在向他写数据,则返回一个错误代码。
世界语(交流的语言很重要)现在你可以在机器间联络了,可是要小心你所说的话。
许多机器有自己的方言,如ASCII和EBCDIC。
更常见的问题是字节顺序问题。
除非你一直传输的都是文本,否则你一定要注意这个问题。
幸运的是,人们找出了解决的办法。
在很久以前,人们争论哪种顺序更“正确”。
现在必要时有相应的函数来转换。
其中有htons()、ntohs()、htonl()和ntohl()。
在传输一个整型数据前,先转换一下。
i=htonl(i);write_data(s,&i,sizeof(i));在读数据后,再变回来。
read_data(s,&i,sizeof(i));i=ntohl(i);如果你一直坚持这个习惯,你将比别人少出错的机会。
未来在你的掌握了(下一步?
)就用我们刚才讨论的东西,你就可以写自己的通讯程序了。
和对待所有的新生事物一样,最好还是看看别人已经做了些什么。
这里有许多关于BSDsocket的东西可以参考。
请注意,例子中没有错误检查,这在“真实”的程序中是很重要
Beej网络socket编程指南[Version1.5.5][http:
//www.ecst.csuchico.edu/~beej/guide/net/]--------------------------------------------------------------------------------介绍 Socket编程让你沮丧吗?
从manpages中很难得到有用的信息吗?
你想跟上时代去编Internet相关的程序,但是为你在调用connect()前的bind()的结构而不知所措?
等等…好在我已经将这些事完成了,我将和所有人共享我的知识了。
如果你了解C语言并想穿过网络编程的沼泽,那么你来对地方了。
--------------------------------------------------------------------------------读者对象 这个文档是一个指南,而不是参考书。
如果你刚开始socket编程并想找一本入门书,那么你是我的读者。
但这不是一本完全的socket编程书。
--------------------------------------------------------------------------------平台和编译器 这篇文档中的大多数代码都在Linux平台PC上用GNU的gcc成功编译过。
而且它们在HPUX平台上用gcc也成功编译过。
但是注意,并不是每个代码片段都独立测试过。
--------------------------------------------------------------------------------目录:
1)什么是套接字?
2)Internet套接字的两种类型3)网络理论4)结构体5)本机转换6)IP地址和如何处理它们7)socket()函数8)bind()函数9)connect()函数10)listen()函数11)accept()函数12)send()和recv()函数13)sendto()和recvfrom()函数14)close()和shutdown()函数15)getpeername()函数16)gethostname()函数17)域名服务(DNS)18)客户-服务器背景知识19)简单的服务器20)简单的客户端21)数据报套接字Socket22)阻塞23)select()--多路同步I/O24)参考资料--------------------------------------------------------------------------------什么是socket?
你经常听到人们谈论着“socket”,或许你还不知道它的确切含义。
现在让我告诉你:
它是使用标准Unix文件描述符(filedescriptor)和其它程序通讯的方式。
什么?
你也许听到一些Unix高手(hacker)这样说过:
“呀,Unix中的一切就是文件!
”那个家伙也许正在说到一个事实:
Unix程序在执行任何形式的I/O的时候,程序是在读或者写一个文件描述符。
一个文件描述符只是一个和打开的文件相关联的整数。
但是(注意后面的话),这个文件可能是一个网络连接,FIFO,管道,终端,磁盘上的文件或者什么其它的东西。
Unix中所有的东西就是文件!
所以,你想和Internet上别的程序通讯的时候,你将要使用到文件描述符。
你必须理解刚才的话。
现在你脑海中或许冒出这样的念头:
“那么我从哪里得到网络通讯的文件描述符呢?
”,这个问题无论如何我都要回答:
你利用系统调用socket(),它返回套接字描述符(socketdescriptor),然后你再通过它来进行send()和recv()调用。
“但是...”,你可能有很大的疑惑,“如果它是个文件描述符,那么为什么不用一般调用read()和write()来进行套接字通讯?
”简单的答案是:
“你可以使用!
”。
详细的答案是:
“你可以,但是使用send()和recv()让你更好的控制数据传输。
”存在这样一个情况:
在我们的世界上,有很多种套接字。
有DARPAInternet地址(Internet套接字),本地节点的路径名(Unix套接字),CCITTX.25地址(你可以将X.25套接字完全忽略)。
也许在你的Unix机器上还有其它的。
我们在这里只讲第一种:
Internet套接字。
--------------------------------------------------------------------------------Internet套接字的两种类型 什么意思?
有两种类型的Internet套接字?
是的。
不,我在撒谎。
其实还有很多,但是我可不想吓着你。
我们这里只讲两种。
除了这些,我打算另外介绍的"RawSockets"也是非常强大的,很值得查阅。
那么这两种类型是什么呢?
一种是"StreamSockets"(流格式),另外一种是"DatagramSockets"(数据包格式)。
我们以后谈到它们的时候也会用到"SOCK_STREAM"和"SOCK_DGRAM"。
数据报套接字有时也叫“无连接套接字”(如果你确实要连接的时候可以用connect()。
)流式套接字是可靠的双向通讯的数据流。
如果你向套接字按顺序输出“1,2”,那么它们将按顺序“1,2”到达另一边。
它们是无错误的传递的,有自己的错误控制,在此不讨论。
有什么在使用流式套接字?
你可能听说过telnet,不是吗?
它就使用流式套接字。
你需要你所输入的字符按顺序到达,不是吗?
同样,WWW浏览器使用的HTTP协议也使用它们来下载页面。
实际上,当你通过端口80telnet到一个WWW站点,然后输入“GETpagename”的时候,你也可以得到HTML的内容。
为什么流式套接字可以达到高质量的数据传输?
这是因为它使用了“传输控制协议(TheTransmissionControlProtocol)”,也叫“TCP”(请参考RFC-793获得详细资料。
)TCP控制你的数据按顺序到达并且没有错误。
你也许听到“TCP”是因为听到过“TCP/IP”。
这里的IP是指“Internet协议”(请参考RFC-791。
)IP只是处理Internet路由而已。
那么数据报套接字呢?
为什么它叫无连接呢?
为什么它是不可靠的呢?
有这样的一些事实:
如果你发送一个数据报,它可能会到达,它可能次序颠倒了。
如果它到达,那么在这个包的内部是无错误的。
数据报也使用IP作路由,但是它不使用TCP。
它使用“用户数据报协议(UserDatagramProtocol)”,也叫“UDP”(请参考RFC-768。
)为什么它们是无连接的呢?
主要是因为它并不象流式套接字那样维持一个连接。
你只要建立一个包,构造一个有目标信息的IP头,然后发出去。
无需连接。
它们通常使用于传输包-包信息。
简单的应用程序有:
tftp,bootp等等。
你也许会想:
“假如数据丢失了这些程序如何正常工作?
”我的朋友,每个程序在UDP上有自己的协议。
例如,tftp协议每发出的一个被接受到包,收到者必须发回一个包来说“我收到了!
”(一个“命令正确应答”也叫“ACK”包)。
如果在一定时间内(例如5秒),发送方没有收到应答,它将重新发送,直到得到ACK。
这一ACK过程在实现SOCK_DGRAM应用程序的时候非常重要。
--------------------------------------------------------------------------------网络理论 既然我刚才提到了协议层,那么现在是讨论网络究竟如何工作和一些关于SOCK_DGRAM包是如何建立的例子。
当然,你也可以跳过这一段,如果你认为已经熟悉的话。
现在是学习数据封装(DataEncapsulation)的时候了!
它非常非常重要。
它重要性重要到你在网络课程学(图1:
数据封装)习中无论如何也得也得掌握它。
主要的内容是:
一个包,先是被第一个协议(在这里是TFTP)在它的报头(也许是报尾)包装(“封装”),然后,整个数据(包括TFTP头)被另外一个协议(在这里是UDP)封装,然后下一个(IP),一直重复下去,直到硬件(物理)层(这里是以太网)。
当另外一台机器接收到包,硬件先剥去以太网头,内核剥去IP和UDP头,TFTP程序再剥去TFTP头,最后得到数据。
现在我们终于讲到声名狼藉的网络分层模型(LayeredNetworkModel)。
这种网络模型在描述网络系统上相对其它模型有很多优点。
例如,你可以写一个套接字程序而不用关心数据的物理传输(串行口,以太网,连接单元接口(AUI)还是其它介质),因为底层的程序会为你处理它们。
实际的网络硬件和拓扑对于程序员来说是透明的。
不说其它废话了,我现在列出整个层次模型。
如果你要参加网络考试,可一定要记住:
应用层(Application) 表示层(Presentation)会话层(Session) 传输层(Transport) 网络层(Network) 数据链路层(DataLink) 物理层(Physical)物理层是硬件(串口,以太网等等)。
应用层是和硬件层相隔最远的--它是用户和网络交互的地方。
这个模型如此通用,如果你想,你可以把它作为修车指南。
把它对应到Unix,结果是:
应用层(ApplicationLayer