程序在服务器上运行,用的是ifort,但服务器是曙光A620r-G服务器,配置有2颗AMD Opteron 6168 cpu,那么编译的时候用哪些参数可以达到最佳性能?或者用pgi的fortran编译器也行。我查了一下,这个cpu支持sse3,但在ifort的参数中加入-xsse3会报错,因为不是intel的cpu。

另外,请问怎样可以最简单地将一个串行程序并行化,如同时运行10个cpu?

多谢