回 帖 发 新 帖 刷新版面

主题:[原创]TCP通信处理浅谈

                         [b][size=6]TCP通信处理浅谈[/size][/b]

    前段时间实现了一个小型的C/S架构的多人在线即时通信工具,JIGQQ。其中对使用TCP通信有点心得。
    记得在我大学时代,就用VB做过TCP的通信。当然那时候是很初级的,发送的数据量也很小的应用。当时就觉得,有时候发送的数据接收端不能接收到,有时候呢觉得一次性没有接受完毕,总会丢失一些内容。这和我从书本学到的TCP/IP可靠通信协议的知识完全不匹配,这让我疑惑了很久。直到后来接触的东西越来越多,眼界也逐渐开拓才慢慢意识到问题出在哪。
    应用平台:Windows XP
    开发工具:C++ Builder 6.0

[b]问题描述[/b]
    我在使用Socket接收消息时,将会触发一个接收函数。(BCB中的是ClientRead函数)所以我在此函数处接收信息,并做相应处理。那问题来了:由于传输的数据包都是我自定义的,我明确的知道长度为多多少。可实际效果却是,有时候接不够我期待的长度,而甚至有时候一次接收的数据包长度竟然比我预期的要长10个字节。当时只有设定条件将不满足我预期长度的数据包丢弃。

[b]问题分析[/b]
    看了上面描述,想必大家也明白我的错误在哪了吧?实际是我对Socket的接收机制理解有误。TCP/IP只保证发送包按顺序到达目的地,但可能由于网络状况他会自动分包发送,这样就导致接收端的接受函数每次提交时只有若干数据,不一定是我预期的一个完整的包。可以这样理解,发过来的实际是一个‘流’。
    看来要很好的解决这个问题,那就只有先将接收的数据保存起来,再来做处理。

[b]处理模型[/b]
    为了要保存接收数据,我们首先就要建立一个缓冲区。那第一个问题来了:由于我们要接收的信息是不可预知的,那难道这个缓冲区要无限的扩容?
    可我们的实际PC内存肯定是有限的,所以我们必须建立一套内存缓冲区可以被反复利用的机制 —— 环形队列。
    我们用图来说明环形队列的工作原理:
[img]http://p.blog.csdn.net/images/p_blog_csdn_net/JigLoveSmile/EntryImages/20090512/环形队列.JPG[/img]
图1 
蓝色为写入的数据,绿色为已经读取处理的数据

    看上图1,在正常状态下:Write指针在写入数据,而Read指针在Write指针之前,说明缓冲区后端还有空余空间。
    在指针回滚状态下:Write指针在Read指针之前,说明缓冲区的前端已经有空闲的空间。
    除了这两种状态外,我们不得不再考虑一种即将错误状态:
[img]http://p.blog.csdn.net/images/p_blog_csdn_net/JigLoveSmile/EntryImages/20090512/环形队列%20错误.JPG[/img]
图2
蓝色为写入的数据,棕红色为未处理的数据

    看图2,无足够空间:当Write指针回滚,发现无足够空间,将和Read指针发生交集(虚点部分)这显然是不合理的。一部分未处理数据将被覆盖破环。所以我们必须重新调整整个缓冲区。
    重新分配调整:当遇到空间不足,不能实现Write指针回滚的情况,我们只有重新开辟一个更大一点的缓冲区,并把未处理数据(棕红色)和写入数据(蓝色)按顺序复制到新的缓冲区内,并调整好Read和Write指针的位置。最后释放掉原来的缓冲区。
    我们可以看到,经过这样一个过程,我们的缓冲区,将在Read指针处理速度较慢并在处理信息量增大时,逐渐扩容。但是,当扩容到一定程度,将达到一个平衡。因为信息量不可能无限增大,当需处理信息量达到最大值再结合Read指针的不断处理,缓冲区的大小也将稳定下来。
    我们一开头就给此缓冲区命名为‘环形队列’。从以上的图和文字,我们可以形象的理解:由于缓冲区大小最终将稳定,Write和Read指针将无障碍的在缓冲区中不断循环回滚,其运行轨迹,将是一个环形。

其他知识
    为了要实现上述模型,我们必须要具备一些知识。
    首先,Wirte指针部分,应该在Socket接收函数中去实现。他什么都不干,只管将接收到的数据往环形队列中存放就行了。
    再一个,就是我们的Read指针部分。他需要尽可能快的在环形队列中读取已经储存好的数据,并解析数据后进行相关的操作。最重要一点是,这个过程必须是独立的,在主线程之外运行。
    所以,我们的Write指针部分应该是在主线程,而Read指针部分就必须建立一个额外的线程来进行工作。
    下面我们就看看C++ Builder 6.0下如何实现多线程和需注意的相关事宜。
    1. 深浅相关全局或私有变量
        [color=Blue]HANDLE  DealInfHanld;                     //处理各类信息线程句柄
        DWORD   DealInfID;                        //处理各类信息线程ID
        CRITICAL_SECTION    m_csLock;             //用于临界变量互锁[/color]
    2. 编写好一个线程处理函数实体
        [color=Blue]//处理环形队列中各类信息
        DWORD __stdcall DealInf(LPVOID)
        {
            ……
        }[/color]
    3. 利用CreateThread函数创建线程
        在窗体开被创建时就创建好线程处理函数:
        [color=Blue]void __fastcall TForm_Main::FormCreate(TObject *Sender)
        {
            ……
            ::InitializeCriticalSection(&m_csLock);
            //开辟各类信息处理线程
            DealInfHanld = CreateThread(NULL, 0, DealInf, NULL, 0, &DealInfID);
        }[/color]

    进过上面3个步骤,函数 [color=Blue]DealInf(LPVOID)[/color] 将被创建为一个线程函数,他将独立在主线程之外独立运行。
    我们还需要注意一个很重要的问题:由于线程函数中操作的有关内存,很可能也是主线程中要操作的。比如我们的环形队列就是这样。其中Read指针在线程中读取数据进行处理,而Write指针却在主线程中储存数据。所以此两指针应该要是‘不可见’的,即他们不应该同时去操作同一数据区,总不可能要CPU同时对同一个内存地址又读又写吧?所以我们必须利用互锁机制,让Write和Read操作互斥。
    这点很好实现,比如 [color=Blue]DealInf(LPVOID)[/color] 函数,我们只需在函数主体的开始和结束处加锁定和解锁代码即可:
    [color=Blue]//处理环形队列中各类信息
    DWORD __stdcall DealInf(LPVOID)
    {
        ::EnterCriticalSection(&m_csLock);            //锁定
        ……
        ::LeaveCriticalSection(&m_csLock);            //解锁
    }[/color]
    当然我们应该在主线程Sockte接收函数处也这样锁定和解锁。

[b]具体Write部分实现[/b]
    首先我们还需要来讨论下,如何实现自定义数据包能在我们实际编码的时带来便利,并最好做到自定义数据包能无限扩展。
    我个人认为,在自定义数据包时,必须将此数据包的实际长度信息包含进去,这样可以有利于信息在接收时能有判断的依据。
    举例说明:
    [color=Blue]//加为好友命令
    typedef struct QQMAKEFRIEND
    {
        UINT32  BufferLeng;         //本数据包长度
        UINT8   Order;              //命令ID
        UINT32  QQNumMy;            //自己的QQ号码
        UINT32  QQNumFD;           //好友的QQ号码
    } QQMakeFriend;[/color]
    
    如上面的一个加好友命令,我们应该在数据包的最前端4字节用来标记数据包长度。这样我们在信息接收函数时,就可以有效判断我们是否已经将此数据包接收完毕。代码如下:
    [color=Blue]//接收各客户端信息
    UINT32  LengBuffer, LengOff = 0;
    UINT32  ReLeng;
    UINT8   t = 0;
    UINT8   *DealInfMem2;

    //获取此次接收到的全部数据
    do
    {
        t++;
        LengBuffer = Socket->ReceiveLength();             
        Socket->ReceiveBuf(ReadBuffer+LengOff+sizeof(TCustomWinSocket*), LengBuffer);
        LengOff += LengBuffer;                                          //累计接收到的数据长度

        //获取此次数据包长度,并把Soket连接记录在数据包中去
        if (t == 1)
        {
            memcpy(ReadBuffer, &Socket, sizeof(TCustomWinSocket *));
            memcpy(&ReLeng, ReadBuffer+sizeof(TCustomWinSocket *), 4);
        }
    }while (LengOff!=ReLeng);                                     //若此数据包接收完毕,跳出
    LengBuffer = LengOff+sizeof(TCustomWinSocket *);[/color]

    经过上面的代码,我们就可以将每次发送来的数据包完整的记录在字节数组[color=Blue]ReadBuffer[/color]中,以便后面使用。
    而且这样将数据包长度信息加在数据包中,还便于变长数据包的传输。比如当发送聊天信息的时候,由于我们的信息是不定长的,如果知道数据包长度便于我们完整接收数据包。并且这些信息在Read指针读取的时候也发挥巨大作用,后面我们将看到。
    接下来,我们就是将接收到的数据合理的储存到环形队列中。
    通过图1和图2我们清楚的知道在将数据包放入环形队列的时候,有3种情形:
    [color=Sienna]1. 环形队列后面还有足够空余空间
    2. 环形队列后面没有足够空余空间但前端有,这样实现回滚
    3. 环形队列前后都没有足够的空余空间,这样重新开辟更大的缓冲区。复制好数据调整读写指针,并释放原来缓冲区。[/color]

    我们就根据上面三中2情形实现代码如下:
    [color=Blue]//向环形队列填塞信息
    ::EnterCriticalSection(&m_csLock);      //锁定
    if (WriteIndex >= ReadIndex)           //Write指针在Read指针之后
    {
       if ((MemcpySize-WriteIndex) >= LengBuffer) //说明环行队列,后面有空闲位置
        {
        memcpy(DealInfMem + WriteIndex, ReadBuffer, LengBuffer);
            WriteIndex += LengBuffer;
    }
    else                          //后面没有空闲位置,往前面找
          {
            if ((MemcpySize-WriteIndex+ReadIndex) > LengBuffer) //如果前面有空闲位置
        {
        memcpy(DealInfMem + WriteIndex, ReadBuffer, MemcpySize-WriteIndex);
        memcpy(DealInfMem,ReadBuffer+(MemcpySize-WriteIndex), LengBuffer-(MemcpySize-WriteIndex));
        WriteIndex = LengBuffer-(MemcpySize-WriteIndex);
           }
           else     //说明没有空余空间,重新开辟缓冲区     
           {
               while ((DealInfMem2= (UINT8*)malloc
            (MemcpySize+MEMSIZE+LengBuffer)) == NULL);

              memcpy(DealInfMem2, DealInfMem, MemcpySize);
              MemcpySize += (MEMSIZE+LengBuffer);

              free(DealInfMem);
              DealInfMem = DealInfMem2;

              memcpy(DealInfMem + WriteIndex, ReadBuffer, LengBuffer);
              WriteIndex += LengBuffer;
            }
       }
    }
    else       // Write指针在Read指针之前
    {
    if ((ReadIndex-WriteIndex) > LengBuffer)   //有空余空间
    {
        memcpy(DealInfMem+WriteIndex, ReadBuffer, LengBuffer);
             WriteIndex += LengBuffer;
    }
         else                   //无空余空间,重新开辟缓冲区
    {
        while ((DealInfMem2 = (UINT8*)malloc
                (MemcpySize+MEMSIZE+LengBuffer)) == NULL);

            memcpy(DealInfMem2, DealInfMem+ReadIndex, MemcpySize-ReadIndex);
        memcpy(DealInfMem2+MemcpySize-ReadIndex, DealInfMem, WriteIndex);
              memcpy(DealInfMem2+MemcpySize-ReadIndex+WriteIndex, ReadBuffer, 
           LengBuffer);

            WriteIndex = MemcpySize-ReadIndex+WriteIndex+LengBuffer;
            MemcpySize += (MEMSIZE+LengBuffer);
            ReadIndex = 0;

            free(DealInfMem);
            DealInfMem = DealInfMem2;
         }
    } 
    ::LeaveCriticalSection(&m_csLock);    //解定[/color]
    这样,我们就实现了Write指针储存数据的部分。

回复列表 (共19个回复)

11 楼

这怎么看,www.klxx123.cn

12 楼

最近因为自己接的项目的原因,重新独立设计了此通信模块。
我直接使用BCB,多线程类重造了整套多线程环形队列通信模块,使其使用起来相当顺手,也不用再自己去做多线程之间的协调和同步了。
稳定性得到了很大的提升和保证。
我将JIGQQ的通信模块进行了更换,前后花了不到30分钟就把服务器和客户端全部改好,并为了项目需要,连续不间断的测试了13天(开了12个客户端不间断的互相发送信息)。实验结果很满意,没有出任何的异常和问题。(以前的版本发现其稳定性不好,服务端时有'死机'的现象,自从更换了此通信模块也消除了此BUG,所以我还是认为应该是原来的多线程的协调和同步自己做的有缺陷,而直接使用了BCB的线程类,此类问题就得到彻底解决了)
奉上新版本JIGQQ
http://d.namipan.com/d/0c8d81a1abe9029dafaf8f07cfb658a11e2ee07408f81800

13 楼

再容我得瑟一下,贴个此通信模块的使用说明,因为项目原因,源码不便公开,等以后项目完成时机成熟了,也许可以发出来和各位朋友讨论学习。
环形队列多线程模块
应用平台及开发工具
    Windows XP,C++ builder 6.0
代码组成
    头文件:MyThread.h
    Cpp:MyThread.cpp
功能描述
    以环形队列为储存基础和类MyThread为多线程基础的通信模块。由于有环形队列实现,以保证完全无遗漏的接收数据并等待处理。MyThread多线程类由BCB提供的类派生,保证了可操作性和稳定性。
使用要点
    数据写入:用户在自己的数据接收函数处,调用MyThread类成员函数MyThread_WriteData(UINT32 SocketUSAdr, UINT8 *Buffer, UINT32 LengBuffer);即可将数据写入到环形队列中。
    SocketUSAdr:用于接收的Socket控件的地址值
    Buffer:接收到的数据
    LengBuffer:接收到的数据长度
  
    数据摘取使用:MyThread类中的函数指针MyThread_ReadData将被处理线程子自动的调用。所以,用户需要在自己的程序中,声明一个函数实现,并将函数地址赋给MyThread_ReadData。如:
    void __fastcall MyReadData(UINT32 SocketUSAdr, UINT8 *XCBuffer);    //声明的函数
    mythread->MyThread_ReadData = MyReadData; //将函数地址赋给函数指针
    SocketUSAdr:记录了发送此信息的Socket地址
    XCBuffer:实际信息数据包
备注
1.    使用此通信模块,发送的数据包必须满足以下格式:
typedef struct QQMSGHEAD
{
    UINT32  BufferLeng;         //本数据包长度
……
……
} QQMsgHead;
即首4字节必须为此次数据包的长度,以实现报文定界。数据摘取模块就是通过此信息准确提取出每个完整的数据包,并提交给mythread->MyThread_ReadData所指向的函数。
2.    环形队列中数据以以下形式存放:
Socket地址:4字节,是发送此消息的Socket地址。
实际数据:N个字节,建议不超过64K
    数据包字节数:4字节
    有用信息:N-4字节
由于记录了发送消息的Socket地址,所以此通信模块可以很轻易应用于多人即时在线聊天系统。(本人的JIGQQ以成功实现)
注意:环形队列中的数据是不用用户自己操作的,这里给以说明只是为了用户更好的理解本通信模块
3.  数据摘取函数MyThread_ReadData的实际实现不建议申请临时变量,最好不要。如果要用到变量,请将其申请为全局,或申请为所在类模块的内部成员。

14 楼


谢谢,太好的帖子了!

15 楼

mark!

16 楼

鄙视15,16楼在我的帖子里做广告,太TM恶心了

17 楼

下学期 学 TCP/ip协议了  得好好学了,各种招聘单位基本都需要, 看来真的很重要

18 楼

看帖回帖^_^

19 楼

好帖,赞一个!

我来回复

您尚未登录,请登录后再回复。点此登录或注册