主题:[原创]TCP通信处理浅谈
前段时间实现了一个小型的C/S架构的多人在线即时通信工具,JIGQQ。其中对使用TCP通信有点心得。
记得在我大学时代,就用VB做过TCP的通信。当然那时候是很初级的,发送的数据量也很小的应用。当时就觉得,有时候发送的数据接收端不能接收到,有时候呢觉得一次性没有接受完毕,总会丢失一些内容。这和我从书本学到的TCP/IP可靠通信协议的知识完全不匹配,这让我疑惑了很久。直到后来接触的东西越来越多,眼界也逐渐开拓才慢慢意识到问题出在哪。
应用平台:Windows XP
开发工具:C++ Builder 6.0
[b]问题描述[/b]
我在使用Socket接收消息时,将会触发一个接收函数。(BCB中的是ClientRead函数)所以我在此函数处接收信息,并做相应处理。那问题来了:由于传输的数据包都是我自定义的,我明确的知道长度为多多少。可实际效果却是,有时候接不够我期待的长度,而甚至有时候一次接收的数据包长度竟然比我预期的要长10个字节。当时只有设定条件将不满足我预期长度的数据包丢弃。
[b]问题分析[/b]
看了上面描述,想必大家也明白我的错误在哪了吧?实际是我对Socket的接收机制理解有误。TCP/IP只保证发送包按顺序到达目的地,但可能由于网络状况他会自动分包发送,这样就导致接收端的接受函数每次提交时只有若干数据,不一定是我预期的一个完整的包。可以这样理解,发过来的实际是一个‘流’。
看来要很好的解决这个问题,那就只有先将接收的数据保存起来,再来做处理。
[b]处理模型[/b]
为了要保存接收数据,我们首先就要建立一个缓冲区。那第一个问题来了:由于我们要接收的信息是不可预知的,那难道这个缓冲区要无限的扩容?
可我们的实际PC内存肯定是有限的,所以我们必须建立一套内存缓冲区可以被反复利用的机制 —— 环形队列。
我们用图来说明环形队列的工作原理:
[img]http://p.blog.csdn.net/images/p_blog_csdn_net/JigLoveSmile/EntryImages/20090512/环形队列.JPG[/img]
图1
蓝色为写入的数据,绿色为已经读取处理的数据
看上图1,在正常状态下:Write指针在写入数据,而Read指针在Write指针之前,说明缓冲区后端还有空余空间。
在指针回滚状态下:Write指针在Read指针之前,说明缓冲区的前端已经有空闲的空间。
除了这两种状态外,我们不得不再考虑一种即将错误状态:
[img]http://p.blog.csdn.net/images/p_blog_csdn_net/JigLoveSmile/EntryImages/20090512/环形队列%20错误.JPG[/img]
图2
蓝色为写入的数据,棕红色为未处理的数据
看图2,无足够空间:当Write指针回滚,发现无足够空间,将和Read指针发生交集(虚点部分)这显然是不合理的。一部分未处理数据将被覆盖破环。所以我们必须重新调整整个缓冲区。
重新分配调整:当遇到空间不足,不能实现Write指针回滚的情况,我们只有重新开辟一个更大一点的缓冲区,并把未处理数据(棕红色)和写入数据(蓝色)按顺序复制到新的缓冲区内,并调整好Read和Write指针的位置。最后释放掉原来的缓冲区。
我们可以看到,经过这样一个过程,我们的缓冲区,将在Read指针处理速度较慢并在处理信息量增大时,逐渐扩容。但是,当扩容到一定程度,将达到一个平衡。因为信息量不可能无限增大,当需处理信息量达到最大值再结合Read指针的不断处理,缓冲区的大小也将稳定下来。
我们一开头就给此缓冲区命名为‘环形队列’。从以上的图和文字,我们可以形象的理解:由于缓冲区大小最终将稳定,Write和Read指针将无障碍的在缓冲区中不断循环回滚,其运行轨迹,将是一个环形。
其他知识
为了要实现上述模型,我们必须要具备一些知识。
首先,Wirte指针部分,应该在Socket接收函数中去实现。他什么都不干,只管将接收到的数据往环形队列中存放就行了。
再一个,就是我们的Read指针部分。他需要尽可能快的在环形队列中读取已经储存好的数据,并解析数据后进行相关的操作。最重要一点是,这个过程必须是独立的,在主线程之外运行。
所以,我们的Write指针部分应该是在主线程,而Read指针部分就必须建立一个额外的线程来进行工作。
下面我们就看看C++ Builder 6.0下如何实现多线程和需注意的相关事宜。
1. 深浅相关全局或私有变量
[color=Blue]HANDLE DealInfHanld; //处理各类信息线程句柄
DWORD DealInfID; //处理各类信息线程ID
CRITICAL_SECTION m_csLock; //用于临界变量互锁[/color]
2. 编写好一个线程处理函数实体
[color=Blue]//处理环形队列中各类信息
DWORD __stdcall DealInf(LPVOID)
{
……
}[/color]
3. 利用CreateThread函数创建线程
在窗体开被创建时就创建好线程处理函数:
[color=Blue]void __fastcall TForm_Main::FormCreate(TObject *Sender)
{
……
::InitializeCriticalSection(&m_csLock);
//开辟各类信息处理线程
DealInfHanld = CreateThread(NULL, 0, DealInf, NULL, 0, &DealInfID);
}[/color]
进过上面3个步骤,函数 [color=Blue]DealInf(LPVOID)[/color] 将被创建为一个线程函数,他将独立在主线程之外独立运行。
我们还需要注意一个很重要的问题:由于线程函数中操作的有关内存,很可能也是主线程中要操作的。比如我们的环形队列就是这样。其中Read指针在线程中读取数据进行处理,而Write指针却在主线程中储存数据。所以此两指针应该要是‘不可见’的,即他们不应该同时去操作同一数据区,总不可能要CPU同时对同一个内存地址又读又写吧?所以我们必须利用互锁机制,让Write和Read操作互斥。
这点很好实现,比如 [color=Blue]DealInf(LPVOID)[/color] 函数,我们只需在函数主体的开始和结束处加锁定和解锁代码即可:
[color=Blue]//处理环形队列中各类信息
DWORD __stdcall DealInf(LPVOID)
{
::EnterCriticalSection(&m_csLock); //锁定
……
::LeaveCriticalSection(&m_csLock); //解锁
}[/color]
当然我们应该在主线程Sockte接收函数处也这样锁定和解锁。
[b]具体Write部分实现[/b]
首先我们还需要来讨论下,如何实现自定义数据包能在我们实际编码的时带来便利,并最好做到自定义数据包能无限扩展。
我个人认为,在自定义数据包时,必须将此数据包的实际长度信息包含进去,这样可以有利于信息在接收时能有判断的依据。
举例说明:
[color=Blue]//加为好友命令
typedef struct QQMAKEFRIEND
{
UINT32 BufferLeng; //本数据包长度
UINT8 Order; //命令ID
UINT32 QQNumMy; //自己的QQ号码
UINT32 QQNumFD; //好友的QQ号码
} QQMakeFriend;[/color]
如上面的一个加好友命令,我们应该在数据包的最前端4字节用来标记数据包长度。这样我们在信息接收函数时,就可以有效判断我们是否已经将此数据包接收完毕。代码如下:
[color=Blue]//接收各客户端信息
UINT32 LengBuffer, LengOff = 0;
UINT32 ReLeng;
UINT8 t = 0;
UINT8 *DealInfMem2;
//获取此次接收到的全部数据
do
{
t++;
LengBuffer = Socket->ReceiveLength();
Socket->ReceiveBuf(ReadBuffer+LengOff+sizeof(TCustomWinSocket*), LengBuffer);
LengOff += LengBuffer; //累计接收到的数据长度
//获取此次数据包长度,并把Soket连接记录在数据包中去
if (t == 1)
{
memcpy(ReadBuffer, &Socket, sizeof(TCustomWinSocket *));
memcpy(&ReLeng, ReadBuffer+sizeof(TCustomWinSocket *), 4);
}
}while (LengOff!=ReLeng); //若此数据包接收完毕,跳出
LengBuffer = LengOff+sizeof(TCustomWinSocket *);[/color]
经过上面的代码,我们就可以将每次发送来的数据包完整的记录在字节数组[color=Blue]ReadBuffer[/color]中,以便后面使用。
而且这样将数据包长度信息加在数据包中,还便于变长数据包的传输。比如当发送聊天信息的时候,由于我们的信息是不定长的,如果知道数据包长度便于我们完整接收数据包。并且这些信息在Read指针读取的时候也发挥巨大作用,后面我们将看到。
接下来,我们就是将接收到的数据合理的储存到环形队列中。
通过图1和图2我们清楚的知道在将数据包放入环形队列的时候,有3种情形:
[color=Sienna]1. 环形队列后面还有足够空余空间
2. 环形队列后面没有足够空余空间但前端有,这样实现回滚
3. 环形队列前后都没有足够的空余空间,这样重新开辟更大的缓冲区。复制好数据调整读写指针,并释放原来缓冲区。[/color]
我们就根据上面三中2情形实现代码如下:
[color=Blue]//向环形队列填塞信息
::EnterCriticalSection(&m_csLock); //锁定
if (WriteIndex >= ReadIndex) //Write指针在Read指针之后
{
if ((MemcpySize-WriteIndex) >= LengBuffer) //说明环行队列,后面有空闲位置
{
memcpy(DealInfMem + WriteIndex, ReadBuffer, LengBuffer);
WriteIndex += LengBuffer;
}
else //后面没有空闲位置,往前面找
{
if ((MemcpySize-WriteIndex+ReadIndex) > LengBuffer) //如果前面有空闲位置
{
memcpy(DealInfMem + WriteIndex, ReadBuffer, MemcpySize-WriteIndex);
memcpy(DealInfMem,ReadBuffer+(MemcpySize-WriteIndex), LengBuffer-(MemcpySize-WriteIndex));
WriteIndex = LengBuffer-(MemcpySize-WriteIndex);
}
else //说明没有空余空间,重新开辟缓冲区
{
while ((DealInfMem2= (UINT8*)malloc
(MemcpySize+MEMSIZE+LengBuffer)) == NULL);
memcpy(DealInfMem2, DealInfMem, MemcpySize);
MemcpySize += (MEMSIZE+LengBuffer);
free(DealInfMem);
DealInfMem = DealInfMem2;
memcpy(DealInfMem + WriteIndex, ReadBuffer, LengBuffer);
WriteIndex += LengBuffer;
}
}
}
else // Write指针在Read指针之前
{
if ((ReadIndex-WriteIndex) > LengBuffer) //有空余空间
{
memcpy(DealInfMem+WriteIndex, ReadBuffer, LengBuffer);
WriteIndex += LengBuffer;
}
else //无空余空间,重新开辟缓冲区
{
while ((DealInfMem2 = (UINT8*)malloc
(MemcpySize+MEMSIZE+LengBuffer)) == NULL);
memcpy(DealInfMem2, DealInfMem+ReadIndex, MemcpySize-ReadIndex);
memcpy(DealInfMem2+MemcpySize-ReadIndex, DealInfMem, WriteIndex);
memcpy(DealInfMem2+MemcpySize-ReadIndex+WriteIndex, ReadBuffer,
LengBuffer);
WriteIndex = MemcpySize-ReadIndex+WriteIndex+LengBuffer;
MemcpySize += (MEMSIZE+LengBuffer);
ReadIndex = 0;
free(DealInfMem);
DealInfMem = DealInfMem2;
}
}
::LeaveCriticalSection(&m_csLock); //解定[/color]
这样,我们就实现了Write指针储存数据的部分。