http://www.educity.cn 作者:pc 来源:希赛教育
basic_string类的用途

    basic_string并不象它的名字那样,只可能是一个字符串。有时候,它不那么象字符串。例如:

    typedef std::basic_string<double> DoubleArray;

    此时,basic_string是一个double类型的动态数组。你可能说,为什么不用vector呢?如下:

    typedef std::vector<double> DoubleArray;

    这两者有什么不同?其实最大的不同,在于basic_string类通常是基于copy-on-write技术的。这意味着basic_string的赋值操作(operator=)只是一个简单的加引用计数(AddRef),是相当快速的。而vector类的赋值操作则是真正的内存拷贝过程。

    现在我要实现一个矩阵(Matrix)类。你可以想象一下现在要矩阵的各种运算,例如加法(operator+):

    Matrix operator+(const Matrix& a, const Matrix& b)
    {
    Matrix result = a;
    result += b;
    return result;
    }

    你可以发现,如果Matrix内部采用vector,而不是用basic_string,那么Matrix类的operator+中就有多次无谓的内存拷贝过程。 

bug的发现

    我的Matrix类一直工作的很好,直到有一天,我发现某个Matrix的数据少了。跟踪发现,问题出在basic_string的copy-on-write实现上。vc++ 6.0的stl中,basic_string通过_Split函数进行分裂:

    class basic_string {
    void _Split()
    {if (_Ptr != 0 && _Refcnt(_Ptr) != 0 && _Refcnt(_Ptr) != _FROZEN)
    {_E *_Temp = _Ptr;
    _Tidy(true);
    assign(_Temp); }}
    };

    问题出在上面的assign语句上。你的数组被理解为是一个‘’结尾的”字符串“。这样_Split操作完成后,如果某个数组元素为0,数据变少了。

    bug的修复

    找到了肇事者,修改代码还是很容易,如下:

    void _Split()
    {if (_Ptr != 0 && _Refcnt(_Ptr) != 0 && _Refcnt(_Ptr) != _FROZEN)
    {_E *_Temp = _Ptr;
    size_type _N = _Len;
    _Tidy(true);
    assign(_Temp, _N); }} //@@code modify: assign(_Temp); ---> bug fixed by xushiwei 

问题在于:

    既然它是标准库,直接修改它的代码并不是很好,因为你的同事(或者其他人)还在用着有问题的版本。

    如果你采用MultiThread DLL模式链接C++标准库,这意味着就算你修改了vc++的头文件也没用,因为编译器最终链接的是dll中的代码,而不是你修改后的代码。

    怎么办呢?

    winx就这个问题进行了一定程度的修复。也就是说,只要你包含了最新的winx,多数情况下不会出现此bug。但如果你采用MultiThread DLL模式链接C++标准库(问题挺严重,因为这是推荐的链接方式),那么你需要小心使用string、wstring类(但是其他类诸如basic_string<double>没问题),因为此模式下winx并没有修复该bug。注意不要让字符串中出现‘’字符即可。如果确实需要出现‘’的字符串,可使用winx::CString类。