主题:[讨论]matmul对几种情况的测试报告,望指点
我的试验环境是 在/O3的速度优化条件下,用两个1000×1000的矩阵相乘
分4种情况:
1.固定矩阵之间相乘;
2.可分配矩阵相乘;
3.自定义数据的固定矩阵相乘;
4.自定义数据的可分配矩阵相乘。
测试代码在附件内,我的测试结果如下:
matmul(fixed,fixed) costs 0.4524 sec
matmul(alloc,alloc) costs 0.5460 sec
matmul(mytype.fixed,mytype.fixed) costs 0.4368 sec
matmul(mytype.alloc,mytype.alloc) costs 26.6606 sec
因为我的程序里都是自定义数据的可分配矩阵相乘,而测试结果显示其速度很慢
请教大家此缘由,如能提供有效措施解决该问题,不甚感谢
分4种情况:
1.固定矩阵之间相乘;
2.可分配矩阵相乘;
3.自定义数据的固定矩阵相乘;
4.自定义数据的可分配矩阵相乘。
测试代码在附件内,我的测试结果如下:
matmul(fixed,fixed) costs 0.4524 sec
matmul(alloc,alloc) costs 0.5460 sec
matmul(mytype.fixed,mytype.fixed) costs 0.4368 sec
matmul(mytype.alloc,mytype.alloc) costs 26.6606 sec
因为我的程序里都是自定义数据的可分配矩阵相乘,而测试结果显示其速度很慢
请教大家此缘由,如能提供有效措施解决该问题,不甚感谢