主题:一台多核电脑做并行,用mpi不太好吧,是不是用带有Openmp的编译器?
feiyuno1987
[专家分:10] 发布于 2011-09-05 21:37:00
RT
回复列表 (共28个回复)
21 楼
yeg001 [专家分:14390] 发布于 2011-09-07 13:11:00
PGI 确实是支持cuda, 效果怎样没试过不知道. 只不过个人倾向于opencl. 还未入门, 将来怎么学还未知.
22 楼
cgl_lgs [专家分:21040] 发布于 2011-09-07 14:07:00
没机会试,显卡不行,不过PGI编译出来的程序效率确实不错:)
23 楼
feiyuno1987 [专家分:10] 发布于 2011-09-07 15:31:00
[quote]有些算法是比较天然有独立性, 不需要换并行算法的. 只要重新分配一下就可以了.
CUDA我兴趣不是很大, 现在买了一本国内出的介绍gpu的书, 还打印了2本关于opencl的书. 等迟些真有时间再学. 这几天泡gpgpu论坛多了一些, 看看那些老鸟怎么看待gpu通用计算的.[/quote]
老兄好好学,等你学会了,我再向你学习,呵呵!
24 楼
dongyuanxun [专家分:7180] 发布于 2011-09-07 23:07:00
我跟yeg001说过
主流编译器(不讨论大型机)里除了gcc/clang/vc
其他真的不入流
为啥intel/pgi的编译的快呢
1、默认fastmath
2、库是优化库,不通用
3、默认就开启了很多优化开关
4、以体积/内存换效率
5、宣传的好
另外除了gcc/clang/vc(vc不包含MFC和ATL)外,intel/pgi做商业开发都会被查出来
25 楼
cgl_lgs [专家分:21040] 发布于 2011-09-08 12:32:00
但vc是MS与Intel合作开发的啊~~~至少之前是,后来据说Intel不给MS做了。
26 楼
dongyuanxun [专家分:7180] 发布于 2011-09-08 20:31:00
就是说Intel放弃了速度和体积相平衡的策略
搞到各类应用软件不敢用intel的编译,速度虽然高了些,内存占用暴多……
intel还想引进N多gcc扩展成功编译linux内核来着,内存不解决,我看悬
所以各类讲求速度的场合,如游戏之类的都不用intel的编译而采用vc/gcc/asm+手写SIMD+查表……
速度也比intel的快很多
27 楼
feiyuno1987 [专家分:10] 发布于 2011-09-09 08:38:00
哦,做一个程序都要用n多公司的东西,好麻烦啊!
28 楼
cgl_lgs [专家分:21040] 发布于 2011-09-09 09:45:00
凑合吧,一次性投资而已:)
而且好些都还免费:)
我来回复