主题:请教matmul效率, 跟Blas比较.
yeg001
[专家分:14390] 发布于 2010-04-22 00:44:00
请问有人把矩阵操作和向量操作运算跟BLAS的比较过吗? 如果有可不可以谈谈经验?
回复列表 (共56个回复)
11 楼
yeg001 [专家分:14390] 发布于 2010-04-30 22:37:00
回楼上
是开源的, 要自己编译的.
近几天测试似乎MKL自带的BLAS也不差.
12 楼
vehicle [专家分:310] 发布于 2010-05-01 18:30:00
我下了一个软件包,请问怎么编译呢?我用的cvf6.5
13 楼
yeg001 [专家分:14390] 发布于 2010-05-02 00:05:00
有说明的, windows下做的话, 编译比较麻烦. 好像要下载个gwin(不记得名字是不是这个了)然后用它再进行编译.
14 楼
vehicle [专家分:310] 发布于 2010-05-02 12:12:00
请问说明在压缩包吗?
我没有找到相关软件使用说明,例如都有哪些功能?
你在哪里找到这些的?
15 楼
yeg001 [专家分:14390] 发布于 2010-05-02 14:55:00
看GotoBLAS那个网址的FAQ, 包里面也有, 记得有3个readme文件.
16 楼
vehicle [专家分:310] 发布于 2010-05-07 16:25:00
我把楼主的代码放到我的电脑计算。
windows+ivf11.1+core2 T8300 2.4G
计算时间大约是33s
我怎么设置ivf,才能达到楼主的matmual的计算速度。
这是什么意思
ifort test_blas.f90 -O3 libgoto2_core2-r1.13.a
17 楼
yeg001 [专家分:14390] 发布于 2010-05-07 20:00:00
我那个是在linux下的编译命令, 把自己编译的库放到程序同一个文件夹(这是偷懒行为, 方便测试而已), 在win下你也可以开命令行进行编译, 也可以修改ivf的优化来进行, 具体到处乱点就找到的了, 我很久没有用win的ivf了.
18 楼
terrytr1986 [专家分:150] 发布于 2010-05-08 14:54:00
哇,这样一说,我的程序主要也涉及到矩阵相乘了,难怪循环加了一个矩阵相乘就变得很慢了。原来是这样的。又学到一点。呵呵!
19 楼
zinsser_1982 [专家分:400] 发布于 2010-06-15 15:31:00
采用楼主的代码,matmul和MKL都比较正常,但调用IMSL中的dgemm函数,计算时间居然达到85s,相当困惑……
编译器:ivf11.1.051, IMSL6.0
20 楼
vehicle [专家分:310] 发布于 2010-06-16 18:22:00
[quote]采用楼主的代码,matmul和MKL都比较正常,但调用IMSL中的dgemm函数,计算时间居然达到85s,相当困惑……
编译器:ivf11.1.051, IMSL6.0
[/quote]
请问你是在windows下运行的吗?
我在windows下matmul的运算时间时30多s,而达不到3s多?
如果是windows,你是怎样设置?
我来回复