回 帖 发 新 帖 刷新版面

主题:[讨论]比较了一下串行、并行中的重载函数效率

比较了以下三种情况,有些疑问
1. 串行情况下 matmul
2. OpenMP并行下的matmul
3. OpenMP并行下的matmul的重载函数mt

对附件文件进行编译:
ifort /O3 /Qopenmp mtml_inomp.f90 /link /STACK:50000000,50000000

然后运行 mtml_inomp
在我的电脑上效率是  3>2>1,不明白为什么重载函数效率超过原函数好多

PS:电脑是i7 4核8线程 16G内存
!############################################################
[size=5]###实际问题在2楼###[/size]

回复列表 (共21个回复)

21 楼

我还是那个意思,前处理的问题,你反汇编看看吧,前面肯定是一堆处理shape的代码。另:楼主可以把两个语句反过来执行或许又是另一个效果。

我来回复

您尚未登录,请登录后再回复。点此登录或注册