Windows Socket IO 模型.docx

资源描述

Windows Socket IO 模型.docx

《Windows Socket IO 模型.docx》由会员分享，可在线阅读，更多相关《Windows Socket IO 模型.docx（18页珍藏版）》请在冰豆网上搜索。

Windows Socket IO 模型.docx

WindowsSocketIO模型

套接字架构

应用程序使用Winsock与传输协议驱动沟通时AFD.SYS负责缓冲区的管理。

这就意味着当一个程序调用send或者WSASend发送数据时，数据将被复制到AFD.SYS它自己的内部缓冲区中（依赖SO_SNDBUF的设置）WSASend调用立即返回。

然后AFD.SYS在程序后台将数据发送出去。

当然，如果程序想要处理一个比SO_SNDBUF设置的缓冲区需求更大的发送请求，WSASend的调用就会阻塞直到所有的数据都被发送出去。

类似的，从远程客户端接收数据时，只要SO_RCVBUF设置的缓冲区还没有满，AFD.SYS就会将数据复制进它自己的缓冲区直到所有的发送都已完成。

当程序调用recv或者是WSARecv，数据就从AFD.SYS的缓冲区复制到了程序提供的缓冲区中了。

使用Winsock的时候还会间接碰到另外两种资源的限制。

第一个页面锁定的限制。

注意重叠操作可能偶然性地以ERROR_INSUFFICIENT_RESOURCES调用失败，这基本上意味着有太多的发送和接收操作在等待中。

另外一个限制是操作系统的非分页池（non-pagedpool）的限制。

阻塞模型

int recv（

SOCKET s,

char* buf,

int len,

int flags

）;

int send（

SOCKET s,

const char* buf,

int len,

int flags

）;

这种方式最为大家熟悉，Socket默认的就是阻塞模式。

在recv的时候，Socket会阻塞在那里，直到连接上有数据可读，把数据读到buffer里后recv函数才会返回，不然就会一直阻塞在那里。

如果在主线程中被阻塞，而数据迟迟没有过来，那么程序就会被锁死。

这样的问题可以用多线程解决，但是在有多个套接字连接的情况下，这不是一个好的选择，扩展性很差，而且也容易有锁的问题。

线程过多，也导致上下文切换过于频繁，导致系统变慢，而且大部分线程是处于非活动状态的话，这就大大浪费了系统的资源。

非阻塞模型

int ioctlsocket（

IN SOCKET s,

IN long cmd,

IN OUT u_long FAR * argp

）;

#defineFIONBIO /*set/clearnon-blockingi/o*/

调用ioctlsocket函数设置FIONBIO为1就转为非阻塞模式。

当recv和send函数没有准备好数据时，函数不会阻塞，立即返回错误值，用GetLastError返回的错误码为WSAEWOULDBLOCK，中文解释为“无法立即完成一个非阻挡性套接字的操作”。

当然，这里你可以用非阻塞模拟阻塞模式，就是用while循环不停调用recv，直到recv返回成功为止。

这样的效率也不高，但好处在于你能在没接收到数据时，有空进行其他操作，或者直接Sleep。

Select模型

int select（

int nfds,

fd_set* readfds,

fd_set* writefds,

fd_set* exceptfds,

const struct timeval* timeout

）;

Select模型是非阻塞的，函数内部自动检测WSAEWOULDBLOCK状态，还能有超时设定。

对read，write，except三种事件进行分别检测，except指带外数据可读取，read和write的定义是广义的，accept，close等消息也纳入到read。

Select函数使用fd_set结构，它的结构非常的简单，只有一个数组和计数器。

Timeval结构里可以设置超时的时间。

Select函数返回值表示集合中有事件触发的sock总数，其余操作使用fd_set的宏来完成。

#ifndefFD_SETSIZE

#defineFD_SETSIZE 64

#endif /*FD_SETSIZE*/

typedef struct fd_set {

u_int fd_count; /*howmanyareSET?

SOCKET fd_array[FD_SETSIZE]; /*anarrayofSOCKETs*/

} fd_set;

FD_CLR（s, *set）

FD_ISSET（s, *set）

FD_SET（s, *set）

FD_ZERO（*set）

Select模型流程如下：

fd_set fdread;

timeval tv = {1, 0};

while

（1） {

//初始化fd_set

FD_ZERO（&fdread）;

for （int i = 0; i < nSock; i ++）

FD_SET（socks[i], &fdread）;

//等待事件触发，或超时返回

int ret = select（0, &fdread, NULL, NULL, &tv）;

for （int i = 0; ret > 0 && i < nSock; i ++）

//检测哪个sock有事件触发

if （FD_ISSET（socks[i], &fdread）） {

read_buf（socks[i]）;

ret –;

}

其实select的原理就是对sock集合进行扫描，有事件或者超时则退出，所以select的效率也是和sock数量成线性关系，而且需要我们自己循环检查哪个sock有事件发生。

它的优点是模型简单，过程清晰，容易管理，支持多个sock服务。

缺点也很明显，本质还是个循环的改进版本，而且fd_set里最多只能放64个sock，还有它无法很好的支持sock事件的先后顺序。

WSAAsynSelect模型

WSAAsynSelect是Windows特有的，可以在一个套接字上接收以Windows消息为基础的网络事件通知。

该模型的实现方法是通过调用WSAAsynSelect函数自动将套接字设置（转变）为非阻塞模式，并向Windows注册一个或多个网络事件lEvent，并提供一个通知时使用的窗口句柄hWnd。

当注册的事件发生时，对应的窗口将收到一个基于消息的通知wMsg。

int WSAAsyncSelect（

SOCKET s,

HWND hWnd,

unsigned int wMsg,

long lEvent

）;

WSAAsyncSelect模型流程如下：

#defineWM_SOCKETWM_USER+1

int WINAPI WinMain（HINSTANCE hINstance, HINSTANCE hPrevInstance, LPSTR lpCmdLine, int nCmdShow） {

SOCKET Listen;

HWND Window;

//创建窗口，绑定上WinProc

//创建sock

WSAStartup（…）;

Listen = Socket（）;

bind（…）;

WSAAsyscSelect（Listen, Window, WM_SOCKET, FD_ACCEPT | FD_CLOSE）;

listen（Listen, 5）;

}

BOOL CALLBACK WinProc（HWND hDlg, WORD wMsg, WORD wParam, DWORD lParam） {

SOCKET Accept;

switch（wMsg） {

case WM_SOCKET:

//lParam的高字节包含了可能出现的任何的错误代码

//lParam的低字节指定已经发生的网络事件

//发生错误

if（WSAGETSELECTERROR（lParam）） {

closesocket…

}

//事件触发

switch（ WSAGETSELECTEVENT（lParam）） {

case FD_ACCEPT:

case FD_READ:

case FD_WRITE:

}

WSAAsyncSelect是模仿Windows消息机制来实现的，使用起来很方便，仅仅只是在消息处理中加入了对WM_SOCKET的处理，这样就能严格得按先后顺序处理sock事件。

MFC中的CSOCKET也采用了这个模型。

lEvent事件表：

FD_READ

应用程序想要接收有关是否可读的通知，以便读入数据

FD_WRITE

应用程序想要接收有关是否可写的通知，以便写入数据

FD_OOB

应用程序想接收是否有带外（OOB）数据抵达的通知

FD_ACCEPT

应用程序想接收与进入连接有关的通知

FD_CONNECT

应用程序想接收与一次连接或者多点join操作完成的通知

FD_CLOSE

应用程序想接收与套接字关闭有关的通知

FD_QOS

应用程序想接收套接字“服务质量”（QoS）发生更改的通知

FD_GROUP_QOS

应用程序想接收套接字组“服务质量”发生更改的通知（现在没什么用处，为未来套接字组的使用保留）

FD_ROUTING_INTERFACE_CHANGE

应用程序想接收在指定的方向上，与路由接口发生变化的通知

FD_ADDRESS_LIST_CHANGE

应用程序想接收针对套接字的协议家族，本地地址列表发生变化的通知

只有在以下3种条件下，会发送FD_WRITE事件：

1.使用connect。

连接首次被建立。

2.使用accept。

套接字被接受。

3.使用send，sendto。

它的缺点就是，每个sock事件处理需要一个窗口句柄，如果sock很多的情况下，资源和性能可想而知了。

WSAEventSelect模型

WSAEventSelect模型类似WSAAsynSelect模型，但最主要的区别是网络事件发生时会被发送到一个Event对象句柄，而不是发送到一个窗口。

这样你就可以使用Event对象的特性了。

但WSAEventSelect模型明显复杂很多。

它需要由以下函数一起完成。

//1.创建事件对象来接收网络事件：

WSAEVENT WSACreateEvent（ void ）;

//2.将事件对象与套接字关联，同时注册事件，使事件对象的工作状态从未传信转变未已传信。

int WSAEventSelect（ SOCKET s,WSAEVENT hEventObject,long lNetworkEvents ）;

//3.I/O处理后，设置事件对象为未传信

BOOL WSAResetEvent（ WSAEVENT hEvent ）;

//4.等待网络事件来触发事件句柄的工作状态：

DWORD WSAWaitForMultipleEvents（ DWORD cEvents,const WSAEVENT FAR * lphEvents, BOOL fWaitAll,DWORD dwTimeout, BOOLfAlertable ）;

//5. 获取网络事件类型

int WSAEnumNetworkEvents（ SOCKET s, WSAEVENT hEventObject, LPWSANETWORKEVENTS lpNetworkEvents ）;

WSACreateEvent其实跟CreateEvent的效果类似，返回的WSAEVENT类型其实就是HANDLE类型，所以可以直接使用CreateEvent创建特殊的Event。

sock和Event对象是对应的，当一个套接字有事件发生，WSAWaitForMultipleEvents返回相应的值，通过这个值来索引这个套接字。

但它也和select一样，在Event数组大小上也有限制，MAXIMUM_WAIT_OBJECTS的值为64。

有了Event对象的支持，signaled/non-signaled和manualreset/autoreset的概念也就可以应用到程序里，这样能使sock事件处理的方式比较丰富灵活。

而且它也能严格按先后顺序处理sock事件。

闪电邮PushMail的处理就是WSAEventSelect模型。

Over-LappedIO模型

它和之前模型不同的是，使用重叠模型的应用程序通知缓冲区收发系统直接使用数据，也就是说，如果应用程序投递了一个10KB大小的缓冲区来接收数据，且数据已经到达套接字，则该数据将直接被拷贝到投递的缓冲区。

之前的模型都是在套接字的缓冲区中，当通知应用程序接收后，在把数据拷贝到程序的缓冲区。

这种模型适用于除WindowsCE外的其他Windows平台，该模型是以Windows的重叠IO机制为基础，通过ReadFile和WriteFile，针对设备执行IO操作。

早先这种机制是用于文件IO，在SocketIO和文件IO统一接口之后，这种机制也被引入SocketIO。

但这类模型的实现就相对复杂多了。

有两个方法可以实现重叠IO请求的完成情况（接到重叠操作完成的通知）：

1.事件对象通知（eventobjectnotification）。

2.完成例程（completionroutines）。

注意，这里并不是完成端口。

WSAOVERLAPPED

重叠结构是不得不提的，之后的完成端口模型也需要用到。

这个结构等同于OVERLAPPED。

typedef struct _WSAOVERLAPPED {

DWORD Internal;

DWORD InternalHigh;

DWORD Offset;

DWORD OffsetHigh;

WSAEVENT hEvent; //只关注这个参数，用来关联WSAEvent对象

} WSAOVERLAPPED, *LPWSAOVERLAPPED;

使用重叠结构，我们常用的send,sendto,recv,recvfrom也都要被WSASend,WSASendto,WSARecv,WSARecvFrom替换掉了，是因为它们的参数中都有一个Overlapped参数。

int WSARecv（

SOCKET s, //[in]套接字

LPWSABUF lpBuffers, //[in,out]接收缓冲区，WSABUF的数组

DWORD dwBufferCount, //[in]数组中WSABUF的数量

LPDWORD lpNumberOfBytesRecvd, //[out]此刻函数所接收到的字节数

LPDWORD lpFlags, //[in,out]这里设置为0即可

LPWSAOVERLAPPED lpOverlapped, //[in]绑定重叠结构

LPWSAOVERLAPPED_COMPLETION_ROUTINE lpCompletionRoutine

//[in]完成例程中将会用到的参数

）;

没有错误且收取立刻完成时，返回值为0，否则是SOCKET_ERROR。

常见的错误码是WSA_IO_PENDING，表示重叠操作正在进行。

相应的其他函数也是类似参数，具体参考MDSN。

获取重叠操作的结果，由WSAWaitForMultipleEvents函数来完成。

BOOL WSAGetOverlappedResult（

SOCKET s, //[in]套接字

LPWSAOVERLAPPED lpOverlapped, //[in]要查询的重叠结构的指针

LPDWORD lpcbTransfer,//[out]本次重叠操作的实际接收（或发送）的字节数

BOOL fWait,//[in]设置为TRUE，除非重叠操作完成，否则函数不会返回

//设置FALSE，而且操作仍处于挂起状态，那么函数就会返回FALSE，错误为WSA_IO_INCOMPLETE

LPDWORD lpdwFlags //[out]负责接收结果标志

）;

事件通知

事件等待函数和WaitForMultipleObjects类似。

DWORD WSAWaitForMultipleEvents（

DWORD cEvents, //[in]等候事件的总数量

const WSAEVENT* lphEvents, //[in]事件数组的指针

BOOL fWaitAll, //[in]是否等待所有事件

DWORD dwTimeout, //[in]超时时间

BOOL fAlertable //[in]在完成例程中会用到这个参数

）;

返回值有这么几个：

WSA_WAIT_TIMEOUT

超时，我们要继续Wait

WSA_WAIT_FAILED

出现错误

WAIT_IO_COMPLETION

一个或多个完成例程入队列执行

WSA_WAIT_EVENT_0~（WSA_WAIT_EVENT_0+cEvents–1）

触发的事件下标

事件通知的重叠IO模型大致流程如下：

//1.建立并初始化buf和overlap

WSAOVERLAPPED Overlap;

WSABUF DataBuf;

char* SendBuf = new char[BufLen];

DWORD Flags = 0;

DataBuf.len = BufLen;

DataBuf.buf = SendBuf;

Overlap.hEvent = EventArray[dwEventTotal ++] = WSACreateEvent（）;

//2.在套接字上投递WSARecv请求

int ret = WSARecv（Sock, &DataBuf, 1, &NumberOfBytesRecvd,

&Flags, &Overlap, NULL）;

if （ret == SOCKET_ERROR && WSAGetLastError（） !

= WSA_IO_PENDING）

error_handle（…）;

//3.等待事件通知

DWORD dwIndex = WSAWaitForMultipleEvents（dwEventTotal,EventArray, FALSE, WSA_INFINITE, FALSE）;

if （dwIndex == WSA_WAIT_FAILED || dwIndex == WSA_WAIT_TIMEOUT）

error_handle（…）;

dwIndex -= WSA_WAIT_EVENT_0;

//4.重置事件对象

WSAResetEvent（EventArray[dwIndex]）;

//5.取得重叠调用的返回状态

DWORD dwBytesTransferred;

WSAGetOverlappedResult（Sock, Overlap, &dwBytesTransferred, TRUE, &Flags）;

if （dwBytesTransferred == 0）

closesocket（Sock）;

dosomething（…）;

如果是服务端使用事件通知模型，则需要再起一个线程来循环Wait事件通知，主线程则接受请求的连接。

实际编码过程中，要注意缓冲区不要搞错，因为全都需要自己来管理，稍有不慎就容易写脏数据和越界。

还要注意WSARecv时，可能立即有数据返回的情况，即返回值为0且NumberOfBytesRecvd>0。

完成例程

完成例程（CompletionRoutine），不是完成端口。

它是使用APC（AsynchronousProcedureCalls）异步回调函数来实现，大致流程和事件通知模型差不多，只不过WSARecv注册时，加上了lpCompletionRoutine参数。

Void CALLBACK CompletionROUTINE（

DWORD dwError, //[in]标志咱们投递的重叠操作完成的状态

DWORD cbTransferred, //[in]重叠操作期间，实际传输的字节量是多大

LPWSAOVERLAPPED lpOverlapped, //[in]传递到最初IO调用的重叠结构

DWORD dwFlags //[in]返回操作结束时可能用的标志（一般没用）

）;

但完成例程有一个比较隐晦的地方，就是APC机制本身。

APC机制

ReadFileEx/WriteFileEx在发出IO请求的同时，提供一个回调函数（APC过程），当IO请求完成后，一旦线程进入可告警状态，回调函数将会执行。

以下五个函数能够使线程进入告警状态：

SleepEx

WaitForSingleObjectEx

WaitForMultipleObjectsEx

SignalObjectAndWait

MsgWaitForMultipleObjectsEx

线程进入告警状态时，内核将会检查线程的APC队列，如果队列中有APC，将会按FIFO方式依次执行。

如果队列为空，线程将会挂起等待事件对象。

以后的某个时刻，一旦APC进入队列，线程将会被唤醒执行APC，同时等待函数返回WAIT_IO_COMPLETION。

回到完成例程的话题上。

需要一个辅助线程，辅助线程的工作是判断有没有新的客户端连接被建立，如果有，就为那个客户端套接字激活一个异步的WSARecv操作，然后调用SleepEx使线程处于一种可警告的等待状态，以使得I/O完成后CompletionROUTINE可以被内核调用，而CompletionROUTINE会在当初激活WSARecv异步操作的代码的同一个线程之内！

而且调用SleepEx时，需要把bAlertable参数设为TRUE，这样当有APC唤醒时立即调用完成例程，否则例程就不会被执行。

当然也可以使用WSAWaitForMultipleEvents函数，但这样就需要一个事件对象。

从图中就能看到CompletionROUTINE是在辅助线程（调用过WSARecv）里执行的。

CompletionPort模型

“完成端口”模型是迄今为止最为复杂的一种I/O模型。

假若一个应用程序同时需要管理为数众多的套接字，那么采用这种模型，往往可以达到最佳的系统性能！

它能最大限度的减少上下文切换的同时最大限度的提高系统并发量。

但不幸的是，该模型只适用于WindowsNT和Windows2000操作系统。

因其设计的复杂性，只有在你的应用程序需要同时管理数百乃至上千个套接字的时候，而且希望随着系统内安装的CPU数量的增多，应用程序的性能也可以线性提升，才应考虑采用“完成端口”模型。

要记住的一个基本准则是，假如要为WindowsNT或Windows2000开发高性能的服务器应用，同时希望为大量套接字I/O请求提供服务（Web服务器便是这方面的典型例子），那么I/O完成端口模型便是最佳选择！

完成端口是一种WINDOWS内核对象。

完成端口用于异步方式的重叠I/O。

简单地，可以把完成端口看成系统维护的一个队列，操作系统把重叠IO操作完成的事件通知放到该队列里，由于是暴露“操作完成”的事件通知，所以命名为“完成端口”（CompletionPorts）。

完成端口内部提供了线程池的管理，可以避免反复创建线程的开销，同时可以根据CPU的个数灵活的决定线程个数，而且可以让减少线程调度的次数从而提高性

展开阅读全文