Beej网络socket编程指南.docx

资源描述

Beej网络socket编程指南.docx

《Beej网络socket编程指南.docx》由会员分享，可在线阅读，更多相关《Beej网络socket编程指南.docx（53页珍藏版）》请在冰豆网上搜索。

Beej网络socket编程指南.docx

Beej网络socket编程指南

Beej网络socket编程指南0

BSDSocket简易入门手册

BSDSocket简易入门手册翻译：

WilburLang介绍类比（什么是socket？

）装上你的新电话（怎样侦听？

）拨号（如何调用socket）谈话（如何通过sockets交谈）挂起（结束）世界语（交流的语言很重要）未来在你的掌握了（下一步？

）介绍当你进入UNIX的神秘世界后，立刻会发现越来越多的东西难以理解。

对于大多数人来说，BSDsocket的概念就是其中一个。

这是一个很短的教程来解释他们是什么、他们如何工作并给出一些简单的代码来解释如何使用他们。

类比（什么是socket？

）socket是进行程序间通讯（IPC）的BSD方法。

这意味着socket用来让一个进程和其他的进程互通信息，就象我们用电话来和其他的人交流一样。

用电话来比喻是很恰当的，我们在后面将一直用电话这个概念来描叙socket。

装上你的新电话（怎样侦听？

）一个人要能够收到别人打给他的电话，首先他要装上一门电话。

同样，你必须先建立socket以侦听线路。

这个过程包含几个步骤。

首先，你要建立一个新的socket，就象先装上电话一样。

socket（）命令就完成这个工作。

因为sockets有几种类型，你要注明你要建立什么类型的。

你要做一个选择是socket的地址格式。

如同电话有音频和脉冲两种形式一样，socket有两个最重要的选项是AF_UNIX和IAF_INET。

AF_UNIX就象UNIX路径名一样识别sockets。

这种形式对于在同一台机器上的IPC很有用。

而AF_INET使用象192.9.200.10这样被点号隔开的四个十进制数字的地址格式。

除了机器地址以外，还可以利用端口号来允许每台机器上的多个AF_INETsocket。

我们这里将着重于AF_INET方式，因为他很有用并广泛使用。

另外一个你必须提供的参数是socket的类型。

两个重要的类型是SOCK_STREAM和SOCK_DGRAM。

SOCK_STREAM表明数据象字符流一样通过socket。

而SOCK_DGRAM则表明数据将是数据报（datagrams）的形式。

我们将讲解SOCK_STREAMsockets，他很常见并易于使用。

在建立socket后，我们就要提供socket侦听的地址了。

就象你还要个电话号码来接电话一样。

bind（）函数来处理这件事情。

SOCK_STREAMsockets让连接请求形成一个队列。

如果你忙于处理一个连接，别的连接请求将一直等待到该连接处理完毕。

listen（）函数用来设置最大不被拒绝的请求数（一般为5个）。

一般最好不要使用listen（）函数。

下面的代码说明如何利用socket（）、bind（）和listen（）函数建立连接并可以接受数据。

/*codetoestablishasocket;originallyfrombzs@bu-cs.bu.edu*/intestablish（unsignedshortportnum）{charmyname[MAXHOSTNAME+1];ints;structsockaddr_insa;structhostent*hp;memset（&sa,0,sizeof（structsockaddr_in））;/*clearouraddress*/gethostname（myname,MAXHOSTNAME）;/*whoarewe?

*/hp=gethostbyname（myname）;/*getouraddressinfo*/if（hp==NULL）/*wedon'texist!

*/return（-1）;sa.sin_family=hp->h_addrtype;/*thisisourhostaddress*/sa.sin_port=htons（portnum）;/*thisisourportnumber*/if（（s=socket（AF_INET,SOCK_STREAM,0））<0）/*createsocket*/return（-1）;if（bind（s,&sa,sizeof（structsockaddr_in））<0）{close（s）;return（-1）;/*bindaddresstosocket*/}listen（s,3）;/*max#ofqueuedconnects*/return（s）;}在建立完socket后，你要等待对该socket的调用了。

accept（）函数为此目的而来。

调用accept（）如同在电话铃响后提起电话一样。

Accept（）返回一个新的连接到调用方的socket。

下面的代码演示使用是个演示。

/*waitforaconnectiontooccuronasocketcreatedwithestablish（）*/intget_connection（ints）{intt;/*socketofconnection*/if（（t=accept（s,NULL,NULL））<0）/*acceptconnectionifthereisone*/return（-1）;return（t）;}和电话不同的是，在你处理先前的连接的时候，你还可以接受调用。

为此，一般用fork来处理每个连接。

下面的代码演示如何使用establish（）和get_connection（）来处理多个连接。

#include/*obligatoryincludes*/#include#include#include#include#include#include#include#include#definePORTNUM50000/*randomportnumber,weneedsomething*/voidfireman（void）;voiddo_something（int）;main（）{ints,t;if（（s=establish（PORTNUM））<0）{/*pluginthephone*/perror（"establish"）;exit

（1）;}signal（SIGCHLD,fireman）;/*thiseliminateszombies*/for（;{/*loopforphonecalls*/if（（t=get_connection（s））<0）{/*getaconnection*/if（errno==EINTR）/*EINTRmighthappenonaccept（）,*/continue;/*tryagain*/perror（"accept"）;/*bad*/exit

（1）;}switch（fork（））{/*trytohandleconnection*/case-1:

/*badnews.screamanddie*/perror（"fork"）;close（s）;close（t）;exit

（1）;case0:

/*we'rethechild,dosomething*/close（s）;do_something（t）;exit（0）;default:

/*we'retheparentsolookfor*/close（t）;/*anotherconnection*/continue;}}}/*aschildrendieweshouldgetcatchtheirreturnsorelseweget*zombies,ABadThing.fireman（）catchesfallingchildren.*/voidfireman（void）{while（waitpid（-1,NULL,WNOHANG）>0）;}/*thisisthefunctionthatplayswiththesocket.itwillbecalled*aftergettingaconnection.*/voiddo_something（ints）{/*doyourthingwiththesockethere:

*/}拨号（如何调用socket）现在你应该知道如何建立socket来接受调用了。

那么如何调用呢？

和电话一样，你要先有个电话。

用socket（）函数来完成这件事情，就象建立侦听的socket一样。

在给socket地址后，你可以用connect（）函数来连接侦听的socket了。

下面是一段代码。

intcall_socket（char*hostname,unsignedshortportnum）{structsockaddr_insa;structhostent*hp;inta,s;if（（hp=gethostbyname（hostname））==NULL）{/*doweknowthehost's*/errno=ECONNREFUSED;/*address?

*/return（-1）;/*no*/}memset（&sa,0,sizeof（sa））;memcpy（（char*）&sa.sin_addr,hp->h_addr,hp->h_length）;/*setaddress*/sa.sin_family=hp->h_addrtype;sa.sin_port=htons（（u_short）portnum）;if（（s=socket（hp->h_addrtype,SOCK_STREAM,0））<0）/*getsocket*/return（-1）;if（connect（s,&sa,sizeofsa）<0）{/*connect*/close（s）;return（-1）;}return（s）;}这个函数返回一个可以流过数据的socket。

谈话（如何通过sockets交谈）好了，你在要传输数据的双方建立连接了，现在该传输数据了。

read（）和write（）函数来处理吧。

除了在socket读写和文件读写中的一个区别外，和处理一般的文件一样。

区别是你一般不能得到你所要的数目的数据。

所以你要一直循环到你需要的数据的到来。

一个简单的例子：

将一定的数据读到缓存。

intread_data（ints,/*connectedsocket*/char*buf,/*pointertothebuffer*/intn/*numberofcharacters（bytes）wewant*/）{intbcount;/*countsbytesread*/intbr;/*bytesreadthispass*/bcount=0;br=0;while（bcount0）{bcount+=br;/*incrementbytecounter*/buf+=br;/*movebufferptrfornextread*/}elseif（br<0）/*signalanerrortothecaller*/return（-1）;}return（bcount）;}相同的函数也可以写数据，留给我们的读者吧。

挂起（结束）和你通过电话和某人交谈后一样，你要在socket间关闭连接。

一般close（）函数用来关闭每边的socket连接。

如果一边的已经关闭，而另外一边却在向他写数据，则返回一个错误代码。

世界语（交流的语言很重要）现在你可以在机器间联络了，可是要小心你所说的话。

许多机器有自己的方言，如ASCII和EBCDIC。

更常见的问题是字节顺序问题。

除非你一直传输的都是文本，否则你一定要注意这个问题。

幸运的是，人们找出了解决的办法。

在很久以前，人们争论哪种顺序更“正确”。

现在必要时有相应的函数来转换。

其中有htons（）、ntohs（）、htonl（）和ntohl（）。

在传输一个整型数据前，先转换一下。

i=htonl（i）;write_data（s,&i,sizeof（i））;在读数据后，再变回来。

read_data（s,&i,sizeof（i））;i=ntohl（i）;如果你一直坚持这个习惯，你将比别人少出错的机会。

未来在你的掌握了（下一步？

）就用我们刚才讨论的东西，你就可以写自己的通讯程序了。

和对待所有的新生事物一样，最好还是看看别人已经做了些什么。

这里有许多关于BSDsocket的东西可以参考。

请注意，例子中没有错误检查，这在“真实”的程序中是很重要

Beej网络socket编程指南[Version1.5.5][http:

//www.ecst.csuchico.edu/~beej/guide/net/]--------------------------------------------------------------------------------介绍　　Socket编程让你沮丧吗？

从manpages中很难得到有用的信息吗？

你想跟上时代去编Internet相关的程序，但是为你在调用connect（）前的bind（）的结构而不知所措？

等等…好在我已经将这些事完成了，我将和所有人共享我的知识了。

如果你了解C语言并想穿过网络编程的沼泽，那么你来对地方了。

--------------------------------------------------------------------------------读者对象　　这个文档是一个指南，而不是参考书。

如果你刚开始socket编程并想找一本入门书，那么你是我的读者。

但这不是一本完全的socket编程书。

--------------------------------------------------------------------------------平台和编译器　　这篇文档中的大多数代码都在Linux平台PC上用GNU的gcc成功编译过。

而且它们在HPUX平台上用gcc也成功编译过。

但是注意，并不是每个代码片段都独立测试过。

--------------------------------------------------------------------------------目录：

1）什么是套接字？

2）Internet套接字的两种类型3）网络理论4）结构体5）本机转换6）IP地址和如何处理它们7）socket（）函数8）bind（）函数9）connect（）函数10）listen（）函数11）accept（）函数12）send（）和recv（）函数13）sendto（）和recvfrom（）函数14）close（）和shutdown（）函数15）getpeername（）函数16）gethostname（）函数17）域名服务（DNS）18）客户-服务器背景知识19）简单的服务器20）简单的客户端21）数据报套接字Socket22）阻塞23）select（）--多路同步I/O24）参考资料--------------------------------------------------------------------------------什么是socket？

　　你经常听到人们谈论着“socket”，或许你还不知道它的确切含义。

现在让我告诉你：

它是使用标准Unix文件描述符（filedescriptor）和其它程序通讯的方式。

什么？

你也许听到一些Unix高手（hacker）这样说过：

“呀，Unix中的一切就是文件！

”那个家伙也许正在说到一个事实：

Unix程序在执行任何形式的I/O的时候，程序是在读或者写一个文件描述符。

一个文件描述符只是一个和打开的文件相关联的整数。

但是（注意后面的话），这个文件可能是一个网络连接，FIFO，管道，终端，磁盘上的文件或者什么其它的东西。

Unix中所有的东西就是文件！

所以，你想和Internet上别的程序通讯的时候，你将要使用到文件描述符。

你必须理解刚才的话。

现在你脑海中或许冒出这样的念头：

“那么我从哪里得到网络通讯的文件描述符呢？

”，这个问题无论如何我都要回答：

你利用系统调用socket（），它返回套接字描述符（socketdescriptor），然后你再通过它来进行send（）和recv（）调用。

“但是...”，你可能有很大的疑惑，“如果它是个文件描述符，那么为什么不用一般调用read（）和write（）来进行套接字通讯？

”简单的答案是：

“你可以使用！

”。

详细的答案是：

“你可以，但是使用send（）和recv（）让你更好的控制数据传输。

”存在这样一个情况：

在我们的世界上，有很多种套接字。

有DARPAInternet地址（Internet套接字），本地节点的路径名（Unix套接字），CCITTX.25地址（你可以将X.25套接字完全忽略）。

也许在你的Unix机器上还有其它的。

我们在这里只讲第一种：

Internet套接字。

--------------------------------------------------------------------------------Internet套接字的两种类型　　什么意思？

有两种类型的Internet套接字？

是的。

不，我在撒谎。

其实还有很多，但是我可不想吓着你。

我们这里只讲两种。

除了这些,我打算另外介绍的"RawSockets"也是非常强大的，很值得查阅。

那么这两种类型是什么呢？

一种是"StreamSockets"（流格式），另外一种是"DatagramSockets"（数据包格式）。

我们以后谈到它们的时候也会用到"SOCK_STREAM"和"SOCK_DGRAM"。

数据报套接字有时也叫“无连接套接字”（如果你确实要连接的时候可以用connect（）。

）流式套接字是可靠的双向通讯的数据流。

如果你向套接字按顺序输出“1，2”，那么它们将按顺序“1，2”到达另一边。

它们是无错误的传递的，有自己的错误控制，在此不讨论。

有什么在使用流式套接字？

你可能听说过telnet，不是吗？

它就使用流式套接字。

你需要你所输入的字符按顺序到达，不是吗？

同样，WWW浏览器使用的HTTP协议也使用它们来下载页面。

实际上，当你通过端口80telnet到一个WWW站点，然后输入“GETpagename”的时候，你也可以得到HTML的内容。

为什么流式套接字可以达到高质量的数据传输？

这是因为它使用了“传输控制协议（TheTransmissionControlProtocol）”，也叫“TCP”（请参考RFC-793获得详细资料。

）TCP控制你的数据按顺序到达并且没有错误。

你也许听到“TCP”是因为听到过“TCP/IP”。

这里的IP是指“Internet协议”（请参考RFC-791。

）IP只是处理Internet路由而已。

那么数据报套接字呢？

为什么它叫无连接呢？

为什么它是不可靠的呢？

有这样的一些事实：

如果你发送一个数据报，它可能会到达，它可能次序颠倒了。

如果它到达，那么在这个包的内部是无错误的。

数据报也使用IP作路由，但是它不使用TCP。

它使用“用户数据报协议（UserDatagramProtocol）”，也叫“UDP”（请参考RFC-768。

）为什么它们是无连接的呢？

主要是因为它并不象流式套接字那样维持一个连接。

你只要建立一个包，构造一个有目标信息的IP头，然后发出去。

无需连接。

它们通常使用于传输包-包信息。

简单的应用程序有：

tftp,bootp等等。

你也许会想：

“假如数据丢失了这些程序如何正常工作？

”我的朋友，每个程序在UDP上有自己的协议。

例如，tftp协议每发出的一个被接受到包，收到者必须发回一个包来说“我收到了！

”（一个“命令正确应答”也叫“ACK”包）。

如果在一定时间内（例如5秒），发送方没有收到应答，它将重新发送，直到得到ACK。

这一ACK过程在实现SOCK_DGRAM应用程序的时候非常重要。

--------------------------------------------------------------------------------网络理论　　既然我刚才提到了协议层，那么现在是讨论网络究竟如何工作和一些关于SOCK_DGRAM包是如何建立的例子。

当然，你也可以跳过这一段，如果你认为已经熟悉的话。

现在是学习数据封装（DataEncapsulation）的时候了！

它非常非常重要。

它重要性重要到你在网络课程学（图1：

数据封装）习中无论如何也得也得掌握它。

主要的内容是：

一个包，先是被第一个协议（在这里是TFTP）在它的报头（也许是报尾）包装（“封装”），然后，整个数据（包括TFTP头）被另外一个协议（在这里是UDP）封装，然后下一个（IP），一直重复下去，直到硬件（物理）层（这里是以太网）。

当另外一台机器接收到包，硬件先剥去以太网头，内核剥去IP和UDP头，TFTP程序再剥去TFTP头，最后得到数据。

现在我们终于讲到声名狼藉的网络分层模型（LayeredNetworkModel）。

这种网络模型在描述网络系统上相对其它模型有很多优点。

例如，你可以写一个套接字程序而不用关心数据的物理传输（串行口，以太网，连接单元接口（AUI）还是其它介质），因为底层的程序会为你处理它们。

实际的网络硬件和拓扑对于程序员来说是透明的。

不说其它废话了，我现在列出整个层次模型。

如果你要参加网络考试，可一定要记住：

应用层（Application）　　表示层（Presentation）会话层（Session）　　传输层（Transport）　　网络层（Network）　　数据链路层（DataLink）　　物理层（Physical）物理层是硬件（串口，以太网等等）。

应用层是和硬件层相隔最远的--它是用户和网络交互的地方。

这个模型如此通用，如果你想，你可以把它作为修车指南。

把它对应到Unix，结果是：

应用层（ApplicationLayer

展开阅读全文