各位老铁们好,相信很多人对socket closed都不是特别的了解,因此呢,今天就来为大家分享下关于socket closed以及socketclosed异常的问题知识,还望可以帮助大家,解决大家的一些困惑,下面一起来看看吧!
epoll编程,如何实现高并发服务器开发
在linux没有实现epoll事件驱动机制之前,我们一般选择用select或者poll等IO多路复用的方法来实现并发服务程序。在大数据、高并发、集群等一些名词唱得火热之年代,select和poll的用武之地越来越有限,风头已经被epoll占尽。
本文便来介绍epoll的实现机制,并附带讲解一下select和poll。通过对比其不同的实现机制,真正理解为何epoll能实现高并发。
select()和poll()IO多路复用模型
select的缺点:
单个进程能够监视的文件描述符的数量存在最大限制,通常是1024,当然可以更改数量,但由于select采用轮询的方式扫描文件描述符,文件描述符数量越多,性能越差;(在linux内核头文件中,有这样的定义:#define__FD_SETSIZE1024)内核/用户空间内存拷贝问题,select需要复制大量的句柄数据结构,产生巨大的开销;select返回的是含有整个句柄的数组,应用程序需要遍历整个数组才能发现哪些句柄发生了事件;select的触发方式是水平触发,应用程序如果没有完成对一个已经就绪的文件描述符进行IO操作,那么之后每次select调用还是会将这些文件描述符通知进程。相比select模型,poll使用链表保存文件描述符,因此没有了监视文件数量的限制,但其他三个缺点依然存在。
拿select模型为例,假设我们的服务器需要支持100万的并发连接,则在__FD_SETSIZE为1024的情况下,则我们至少需要开辟1k个进程才能实现100万的并发连接。除了进程间上下文切换的时间消耗外,从内核/用户空间大量的无脑内存拷贝、数组轮询等,是系统难以承受的。因此,基于select模型的服务器程序,要达到10万级别的并发访问,是一个很难完成的任务。
因此,该epoll上场了。
epollIO多路复用模型实现机制
由于epoll的实现机制与select/poll机制完全不同,上面所说的select的缺点在epoll上不复存在。
设想一下如下场景:有100万个客户端同时与一个服务器进程保持着TCP连接。而每一时刻,通常只有几百上千个TCP连接是活跃的(事实上大部分场景都是这种情况)。如何实现这样的高并发?
在select/poll时代,服务器进程每次都把这100万个连接告诉操作系统(从用户态复制句柄数据结构到内核态),让操作系统内核去查询这些套接字上是否有事件发生,轮询完后,再将句柄数据复制到用户态,让服务器应用程序轮询处理已发生的网络事件,这一过程资源消耗较大,因此,select/poll一般只能处理几千的并发连接。
epoll的设计和实现与select完全不同。epoll通过在Linux内核中申请一个简易的文件系统(文件系统一般用什么数据结构实现?B+树)。把原先的select/poll调用分成了3个部分:
1)调用epoll_create()建立一个epoll对象(在epoll文件系统中为这个句柄对象分配资源)
2)调用epoll_ctl向epoll对象中添加这100万个连接的套接字
3)调用epoll_wait收集发生的事件的连接
如此一来,要实现上面说是的场景,只需要在进程启动时建立一个epoll对象,然后在需要的时候向这个epoll对象中添加或者删除连接。同时,epoll_wait的效率也非常高,因为调用epoll_wait时,并没有一股脑的向操作系统复制这100万个连接的句柄数据,内核也不需要去遍历全部的连接。
下面来看看Linux内核具体的epoll机制实现思路。
当某一进程调用epoll_create方法时,Linux内核会创建一个eventpoll结构体,这个结构体中有两个成员与epoll的使用方式密切相关。eventpoll结构体如下所示:
[cpp]viewplaincopystructeventpoll{..../*红黑树的根节点,这颗树中存储着所有添加到epoll中的需要监控的事件*/structrb_rootrbr;/*双链表中则存放着将要通过epoll_wait返回给用户的满足条件的事件*/structlist_headrdlist;....};每一个epoll对象都有一个独立的eventpoll结构体,用于存放通过epoll_ctl方法向epoll对象中添加进来的事件。这些事件都会挂载在红黑树中,如此,重复添加的事件就可以通过红黑树而高效的识别出来(红黑树的插入时间效率是lgn,其中n为树的高度)。
而所有添加到epoll中的事件都会与设备(网卡)驱动程序建立回调关系,也就是说,当相应的事件发生时会调用这个回调方法。这个回调方法在内核中叫ep_poll_callback,它会将发生的事件添加到rdlist双链表中。
在epoll中,对于每一个事件,都会建立一个epitem结构体,如下所示:
[cpp]viewplaincopystructepitem{structrb_noderbn;//红黑树节点structlist_headrdllink;//双向链表节点structepoll_filefdffd;//事件句柄信息structeventpoll*ep;//指向其所属的eventpoll对象structepoll_eventevent;//期待发生的事件类型}当调用epoll_wait检查是否有事件发生时,只需要检查eventpoll对象中的rdlist双链表中是否有epitem元素即可。如果rdlist不为空,则把发生的事件复制到用户态,同时将事件数量返回给用户。
epoll数据结构示意图
从上面的讲解可知:通过红黑树和双链表数据结构,并结合回调机制,造就了epoll的高效。
OK,讲解完了Epoll的机理,我们便能很容易掌握epoll的用法了。一句话描述就是:三步曲。
第一步:epoll_create()系统调用。此调用返回一个句柄,之后所有的使用都依靠这个句柄来标识。
第二步:epoll_ctl()系统调用。通过此调用向epoll对象中添加、删除、修改感兴趣的事件,返回0标识成功,返回-1表示失败。
第三部:epoll_wait()系统调用。通过此调用收集收集在epoll监控中已经发生的事件。
最后,附上一个epoll编程实例。
[cpp]viewplaincopy////asimpleechoserverusingepollinlinux////2009-11-05//2013-03-22:修改了几个问题,1是/n格式问题,2是去掉了原代码不小心加上的ET模式;//本来只是简单的示意程序,决定还是加上recv/send时的buffer偏移//bysparkling//#include<sys/socket.h>#include<sys/epoll.h>#include<netinet/in.h>#include<arpa/inet.h>#include<fcntl.h>#include<unistd.h>#include<stdio.h>#include<errno.h>#include<iostream>usingnamespacestd;#defineMAX_EVENTS500structmyevent_s{intfd;void(*call_back)(intfd,intevents,void*arg);intevents;void*arg;intstatus;//1:inepollwaitlist,0notincharbuff[128];//recvdatabufferintlen,s_offset;longlast_active;//lastactivetime};//seteventvoidEventSet(myevent_s*ev,intfd,void(*call_back)(int,int,void*),void*arg){ev->fd=fd;ev->call_back=call_back;ev->events=0;ev->arg=arg;ev->status=0;bzero(ev->buff,sizeof(ev->buff));ev->s_offset=0;ev->len=0;ev->last_active=time(NULL);}//add/modaneventtoepollvoidEventAdd(intepollFd,intevents,myevent_s*ev){structepoll_eventepv={0,{0}};intop;epv.data.ptr=ev;epv.events=ev->events=events;if(ev->status==1){op=EPOLL_CTL_MOD;}else{op=EPOLL_CTL_ADD;ev->status=1;}if(epoll_ctl(epollFd,op,ev->fd,&epv)<0)printf("EventAddfailed[fd=%d],evnets[%d]\n",ev->fd,events);elseprintf("EventAddOK[fd=%d],op=%d,evnets[%0X]\n",ev->fd,op,events);}//deleteaneventfromepollvoidEventDel(intepollFd,myevent_s*ev){structepoll_eventepv={0,{0}};if(ev->status!=1)return;epv.data.ptr=ev;ev->status=0;epoll_ctl(epollFd,EPOLL_CTL_DEL,ev->fd,&epv);}intg_epollFd;myevent_sg_Events[MAX_EVENTS+1];//g_Events[MAX_EVENTS]isusedbylistenfdvoidRecvData(intfd,intevents,void*arg);voidSendData(intfd,intevents,void*arg);//acceptnewconnectionsfromclientsvoidAcceptConn(intfd,intevents,void*arg){structsockaddr_insin;socklen_tlen=sizeof(structsockaddr_in);intnfd,i;//acceptif((nfd=accept(fd,(structsockaddr*)&sin,&len))==-1){if(errno!=EAGAIN&&errno!=EINTR){}printf("%s:accept,%d",__func__,errno);return;}do{for(i=0;i<MAX_EVENTS;i++){if(g_Events[i].status==0){break;}}if(i==MAX_EVENTS){printf("%s:maxconnectionlimit[%d].",__func__,MAX_EVENTS);break;}//setnonblockingintiret=0;if((iret=fcntl(nfd,F_SETFL,O_NONBLOCK))<0){printf("%s:fcntlnonblockingfailed:%d",__func__,iret);break;}//addareadeventforreceivedataEventSet(&g_Events[i],nfd,RecvData,&g_Events[i]);EventAdd(g_epollFd,EPOLLIN,&g_Events[i]);}while(0);printf("newconn[%s:%d][time:%d],pos[%d]\n",inet_ntoa(sin.sin_addr),ntohs(sin.sin_port),g_Events[i].last_active,i);}//receivedatavoidRecvData(intfd,intevents,void*arg){structmyevent_s*ev=(structmyevent_s*)arg;intlen;//receivedatalen=recv(fd,ev->buff+ev->len,sizeof(ev->buff)-1-ev->len,0);EventDel(g_epollFd,ev);if(len>0){ev->len+=len;ev->buff[len]='\0';printf("C[%d]:%s\n",fd,ev->buff);//changetosendeventEventSet(ev,fd,SendData,ev);EventAdd(g_epollFd,EPOLLOUT,ev);}elseif(len==0){close(ev->fd);printf("[fd=%d]pos[%d],closedgracefully.\n",fd,ev-g_Events);}else{close(ev->fd);printf("recv[fd=%d]error[%d]:%s\n",fd,errno,strerror(errno));}}//senddatavoidSendData(intfd,intevents,void*arg){structmyevent_s*ev=(structmyevent_s*)arg;intlen;//senddatalen=send(fd,ev->buff+ev->s_offset,ev->len-ev->s_offset,0);if(len>0){printf("send[fd=%d],[%d<->%d]%s\n",fd,len,ev->len,ev->buff);ev->s_offset+=len;if(ev->s_offset==ev->len){//changetoreceiveeventEventDel(g_epollFd,ev);EventSet(ev,fd,RecvData,ev);EventAdd(g_epollFd,EPOLLIN,ev);}}else{close(ev->fd);EventDel(g_epollFd,ev);printf("send[fd=%d]error[%d]\n",fd,errno);}}voidInitListenSocket(intepollFd,shortport){intlistenFd=socket(AF_INET,SOCK_STREAM,0);fcntl(listenFd,F_SETFL,O_NONBLOCK);//setnon-blockingprintf("serverlistenfd=%d\n",listenFd);EventSet(&g_Events[MAX_EVENTS],listenFd,AcceptConn,&g_Events[MAX_EVENTS]);//addlistensocketEventAdd(epollFd,EPOLLIN,&g_Events[MAX_EVENTS]);//bind&listensockaddr_insin;bzero(&sin,sizeof(sin));sin.sin_family=AF_INET;sin.sin_addr.s_addr=INADDR_ANY;sin.sin_port=htons(port);bind(listenFd,(constsockaddr*)&sin,sizeof(sin));listen(listenFd,5);}intmain(intargc,char**argv){unsignedshortport=12345;//defaultportif(argc==2){port=atoi(argv[1]);}//createepollg_epollFd=epoll_create(MAX_EVENTS);if(g_epollFd<=0)printf("createepollfailed.%d\n",g_epollFd);//create&bindlistensocket,andaddtoepoll,setnon-blockingInitListenSocket(g_epollFd,port);//eventloopstructepoll_eventevents[MAX_EVENTS];printf("serverrunning:port[%d]\n",port);intcheckPos=0;while(1){//asimpletimeoutcheckhere,everytime100,bettertouseamini-heap,andaddtimereventlongnow=time(NULL);for(inti=0;i<100;i++,checkPos++)//doesn'tchecklistenfd{if(checkPos==MAX_EVENTS)checkPos=0;//recycleif(g_Events[checkPos].status!=1)continue;longduration=now-g_Events[checkPos].last_active;if(duration>=60)//60stimeout{close(g_Events[checkPos].fd);printf("[fd=%d]timeout[%d--%d].\n",g_Events[checkPos].fd,g_Events[checkPos].last_active,now);EventDel(g_epollFd,&g_Events[checkPos]);}}//waitforeventstohappenintfds=epoll_wait(g_epollFd,events,MAX_EVENTS,1000);if(fds<0){printf("epoll_waiterror,exit\n");break;}for(inti=0;i<fds;i++){myevent_s*ev=(structmyevent_s*)events[i].data.ptr;if((events[i].events&EPOLLIN)&&(ev->events&EPOLLIN))//readevent{ev->call_back(ev->fd,events[i].events,ev->arg);}if((events[i].events&EPOLLOUT)&&(ev->events&EPOLLOUT))//writeevent{ev->call_back(ev->fd,events[i].events,ev->arg);}}}//freeresourcereturn0;}tcp 断开连接的几种情况
FIN_WAIT_1:主动关闭连接的一方等待对方返回ACK包。若Socket在ESTABLISHED状态下主动关闭连接并向对方发送FIN包(表示己方不再有数据需要发送),则进入FIN_WAIT_1状态,等待对方返回ACK包,此后还能读取数据,但不能发送数据。在正常情况下,无论对方处于何种状态,都应该马上返回ACK包,所以FIN_WAIT_1状态一般很难见到。
FIN_WAIT_2状态下的Socket需要等待对方发送的FIN包,所有常常可以看到。若在FIN_WAIT_1状态下收到对方发送的同时带有FIN和ACK的包时,则直接进入TIME_WAIT状态,无须经过FIN_WAIT_2状态。
TIME_WAIT:主动关闭连接的一方收到对方发送的FIN包后返回ACK包(表示对方也不再有数据需要发送,此后不能再读取或发送数据),然后等待足够长的时间(2MSL)以确保对方接收到ACK包(考虑到丢失ACK包的可能和迷路重复数据包的影响),最后回到CLOSED状态,释放网络资源。
CLOSE_WAIT:表示被动关闭连接的一方在等待关闭连接。当收到对方发送的FIN包后(表示对方不再有数据需要发送),相应的返回ACK包,然后进入CLOSE_WAIT状态。在该状态下,若己方还有数据未发送,则可以继续向对方进行发送,但不能再读取数据,直到数据发送完毕。
LAST_ACK:被动关闭连接的一方在CLOSE_WAIT状态下完成数据的发送后便可向对方发送FIN包(表示己方不再有数据需要发送),然后等待对方返回ACK包。收到ACK包后便回到CLOSED状态,释放网络资源。
关于socket closed的内容到此结束,希望对大家有所帮助。