MATLAB 并行计算 parfor 用法及注意事项

最近在用MATLAB做工作空间计算,for循环次数较多,运算非常慢,同学说可以使用并行计算,于是尝试,大开眼界。

一、使用方法

参考文章:Matlab并行计算(新手)_a99h的博客-CSDN博客

在较新版本的matlab中,不需要使用p=parpool(n)来手动开启线程池,操作变得更简单。

1. 首先,设置线程数量

(注:MATLAB 2023a已经不需要设置线程数量了,这一步可以直接跳过)

在任务管理器中查看cpu的线程数量:

按 ctrl+shift+esc 打开任务管理器,点击性能 -> cpu

 在折线图那里右键将图形更改为逻辑处理器,就可以看到cpu每个线程的利用率;我的电脑是12核20线程,因此有20个小窗。记住这个线程数。

在MATLAB中点击主页 -> 预设 -> parallel computing Toobox, 调整parallel pool下面的数字,最大不能超过刚才在任务管理器里看到的最大线程数。如果给的太大,系统其他软件可能会卡死,所以别太大,克制一点。

 

 这样,线程池的线程数量就设置好了。

2. 然后在代码中将 for 改为 parfor

例:

原代码:

a = randn([1,1000]);
for i = 1000
    a(i) = a(i)^2;
end

修改为 parfor:

a = randn([1,1000]);
parfor i = 1000
    a(i) = a(i)^2;
end

二、注意事项

注:parfor是并行计算,同时计算多个线程,因此不能在内部打断点调试,在里面输出变量时也不会在命令行显示。我在计算时使用了 try, 也可以使用pause(1)来定位出错的位置:当pause(1)生效时,pause(1)所在行之前的代码可以认为是没出错的。

parfor 的使用存在很多限制,下面一一说明。

parfor循环要求:

  1. 任务间必须独立
  2. 循环间次序独立

循环体的限制:

  1. 不能引入变量(eg.eval,load,global,etc.)
  2. 不能含有break或return声明
  3. 不能嵌套另外的parfor循环

1. 每次循环之间不可以有依赖于别的循环计算出的结果。

2. 交换循环的次序不影响每次循环的结果

针对以上两条,举例:使用10线程计算,则 i=1,2,3,...,10 的循环可能是同时进行的。若不独立,则会出现错误。

3. 不能使用全局变量,这是因为若某次循环中改变了全局变量的值,可能导致其他正在进行的线程的该变量值也发生变化从而引发混乱,因此禁用全局变量。

4. 亲测可以使用load, 只是load的结果要赋值给循环内新声明的变量,例:

    % 导入数据
    data_name = strcat('X:/data_1/data/',num2str(process_i));
    load_data = load(data_name);

5. 在使用并行计算时,可以认为循环内不在工作区内生成数据。因此,所有需要调用外部函数的命令都要将需要的变量传递给外部函数

6. parfor内不能使用save 保存变量,但是可以将save写到外部函数后调用,例如,我想保存工作区里的变量值,则可以创建新函数,在parfor里调用parsave即可:

function parsave(data_name, data)
    save(data_name, 'data');
end

7. parfor里画图是不会弹出图窗的,可以通过保存 fig (或jpg等格式)文件记录图窗:

    plot(x,y)    % 画图   
    fig_name = strcat('X:/data_1/figs/00_90_processed/',...
            num2str(process_i),'.fig');    %生成图像名称
    saveas(gcf,fig_name);    % 保存图像

8. parfor内部的for循环不能直接使用 j=j+1

% 下面的代码是不允许的
parfor i=1:10000
    for j = 1:200
        j=j+1;
    end
end

% 可以声明一个新的变量曲线救国
parfor i=1:10000
    for j = 1:200
        a = j;
        a=a+1;
    end
end

猜你喜欢

转载自blog.csdn.net/aniclever/article/details/131657336