基于openMP的并行计算实验Word文档下载推荐.docx

资源描述

基于openMP的并行计算实验Word文档下载推荐.docx

《基于openMP的并行计算实验Word文档下载推荐.docx》由会员分享，可在线阅读，更多相关《基于openMP的并行计算实验Word文档下载推荐.docx（15页珍藏版）》请在冰点文库上搜索。

基于openMP的并行计算实验Word文档下载推荐.docx

…

结束后再次调用omp_get_wtime（）获取时间end，end-start即为并行消耗时间

⑤再次调用时间函数更新strat

串行做一边矩阵相加

更新end,end-start即为串行耗时

代码如下：

#include<

iostream>

#include<

omp.h>

#definesize10000

usingnamespacestd;

inta[size][size],

b[size][size],

c[size][size];

intmain（）

{

for（inti=0;

=size;

++i）//initialthematrix

for（intj=0;

++j）{

a[i][j]=1;

b[i][j]=2;

}

doublestart=omp_get_wtime（）;

omp_set_num_threads（4）;

#pragmaompparallelfor

for（inti=0;

size;

++i）

++j）

c[i][j]=a[i][j]+b[i][j];

doubleend=omp_get_wtime（）;

cout<

并行运行时间：

end-start<

endl;

start=omp_get_wtime（）;

for（inti=0;

for（intj=0;

c[i][j]=a[i][j]+b[i][j];

end=omp_get_wtime（）;

cout<

串行运行时间：

system（"

pause"

）;

}

2、问题规模对串、并行程序时间的影响（A、B矩阵的大小为N*M）

（1）通过不断增加问题规模，观察串行和并行程序的执行时间，得到如下表格的时间消耗数据：

100*100

1000*1000

10000*10000

串行消耗（ms）

0.03

4.36

296.91

并行消耗（ms）

7.06

9.54

182.27

（2）可以发现，当矩阵规模较小时，串行算法仍然要比并行算法运行的快，当规模到达一定程度的时候，并行运行的速度较串行有了提升。

并行算法对各个CPU的调度也占用一定的时间，当问题规模很小的时候，这个调度时间占了很大的比重，而在规模较大的时候，这个调度时间就显得微乎其微了

3、线程数目对并行程序的影响（这里假设问题规模为：

N*M=10000*10000）

（1）在使用OpenMP进行并行执行矩阵加法时，我们可以自由设置进行并行计算的并行线程数目。

（2）在并行区域中，通过函数intomp_set_num_threads（int）设置并行区域中要创建的线程数，分别设置为2、4、8、16，得到如下表格的时间消耗

262.73

205.12

248.97

295.38

（3）观察发现，在问题规模不变的前提下，随着线程数目的增加，问题解决的时间也在相应的减少。

但是，问题消耗的时间并不会随着线程数目的增加而不断的减少，原因可能是因为，随着线程数目的增减，线程的额外准备时间开销也将扩大。

四、心得体会

通过本次实验，了解了openMP库函数，掌握了openMP最基本的多线程程序编写。

通过分析比较串并行运行时间，体会了不同规模下串并行的使用效果。

实验二：

使用OpenMP实现圆周率计算的并行算法

1、考察问题规模N对圆周率计算精确度的影响；

2、考察线程数目对圆周率计算执行时间的影响；

3、比较串、并行算法在执行时间上的差别。

1、使用OpenMP和近似计算公式计算圆周率π的大小，并分析串行、并行时间的差别以及问题规模对程序运行时间的影响

①全局变量设置宏size，用来描述计算范围

②利用如下公式准备计算圆周率π的近似值

#pragma

omp

parallel

for

reduction（+:

sum）

开始做并行区部分

注意：

其中sum是共享的，因为是个连续和的问题，采用reduction之后，每个线程根据reduction（+:

sum）的声明算出自己的sum，然后再将每个线程的sum加起来。

避免各个线程共享sum资源时出现问题

…

#include<

#define

size

10000000

using

namespace

std;

int

main（）

{

double

sum=0,start,end;

omp_set_num_threads（4）;

start=omp_get_wtime（）;

for（int

i=0;

++i）{

sum+=4/（1+（（0.5+i）/size）*（（0.5+i）/size））*1/size;

}

end=omp_get_wtime（）;

cout<

并行时间:

sum=0;

串行时间:

cout.precision（20）;

π：

sum<

system（"

}

2、问题规模对串、并行程序时间的影响（N的大小影响时间）

1000

100000

0.04

4.10

365.70

4.60

15.04

188.48

（2）可以发现，当规模较小时，串行算法仍然要比并行算法运行的快，当规模到达一定程度的时候，并行运行的速度较串行有了提升。

N=100000）

（1）在使用OpenMP进行并行执行运算时，我们可以自由设置进行并行计算的并行线程数目。

3.26

3.23

3.14

30.9

通过本次实验，进一步深入了openMP的编程，对openMP各线程共享资源、各自拥有自己的资源有了初步认识。

再一次体会到了并行计算给大规模计算带来的便利性。

实验三：

使用OpenMP求最大值

1、掌握求最大值的并行算法

1、使用OpenMP求一个乱序数列的最大值，并分析串行、并行时间的差别以及问题规模对程序运行时间的影响

本程序实现了平衡树算法，但由于处理器数目有限，并行结果反而不如串行，不过当处理器足够多时（理想情况为数组长度的一半）时，并行会有大的提升。

这里只讲一下平衡树算法思路。

1全局变量设置num×

size的二维数组，最后一维用来保存数列

其中：

num=log（size-1）/log

（2）+1;

表示平衡树的高度

②初始化最后一维数组

⑤算法核心部分：

算法先处理最后一层平衡树（假设个数为n），两个数据一组比较，取大的，生成新的一层平衡树（个数为n/2或者（n+1）/2）,放在二维数组的上一维。

迭代处理每一层，最后使得新的一层个数为1，这个值就是最大值，即a[1][1];

并行处理每一层平衡树

#include<

math.h>

constintsize=10000;

inta[size+1][size+1];

intmain（）

intnum=log（size-1）/log

（2）+1;

for（size_ti=1;

++i）{//初始化

a[num][i]=i;

intm=0;

++i）//串行

if（a[num][i]>

=m）

m=a[num][i];

串行:

intamax=size;

for（intk=num-1;

=0;

k--）{

for（intj=1;

=（amax-1）/2+1;

j++）{

if（2*j>

amax）

a[k][j]=a[k+1][amax];

else

a[k][j]=a[k+1][2*j-1]>

a[k+1][2*j]?

a[k+1][2*j-1]:

a[k+1][2*j];

并行:

}

2、问题规模对串、并行程序时间的影响（数列长度为N）

100

10000

1.23e-6

1.35e-5

3.4e-5

0.0031

0.0360

0.047

（2）可以发现，并行总是比串行慢。

主要原因是：

平衡树算法对处理器个数有很高的要求，在处理器个数达到问题规模的一半的时候才有最好的效果，本机只有4个线程，线程的调度反而使得整个时间消耗比串行多。

0.006

0.004

0.06

通过本次实验，学会了平衡树的算法设计思想，见识到了高性能计算在庞大任务规模面前的解决问题的能力。

在实验的过程中使用平衡树没有得到理想的结果，也说明了高性能计算在处理器方面的限制。

实验四：

使用OpenMP计算矩阵相乘

1、掌握矩阵的乘法的串、并行算法

1、给定两个矩阵A[N,M1]和B[M1,M]的乘积，即求C[N,M]=A[N,M1]*B[M1,M]。

计算矩阵的乘法，简单的使用三重循环完成，并行对最外层循环并行计算

1全局变量设置3个数组：

a[M+1][N+1],b[N+1][M+1],c[M+1][M+1]

②初始化三个数组

#define

500

using

int

a[M+1][N+1],b[N+1][M+1],c[M+1][M+1];

{

//init

array

i=1;

=M;

i++）

for（int

j=1;

=N;

j++）

a[i][j]=1;

b[i][j]=2;

//parallel

start=omp_get_wtime（）;

for

for（int

k=1;

k++）

c[i][j]+=a[i][k]*b[k][j];

end=omp_get_wtime（）;

//serial

2、问题规模对串、并行程序时间的影响（二维数组为N*N）

300

0.0072

0.119

0.49

0.0198

0.100

0.31

（2）可以发现，当规模较小时，串行算法仍然要比并行算法运行的快，当规模到达一定程度的时候，并行运行的速度较串行有了提升。

3、线程数目对并行程序的影响（这里假设问题规模为：

N*M=500*500）

0.418

0.254

0.252

0.352

挺水的一次实验，不是因为实验水，而是感觉跟第一次实验没什么区别，线程只是利用线程数去减少了时间开销，而不是降低了问题的复杂度。

主要是矩阵的乘法，自己没有用到好的算法。

不过目前计算矩阵的乘法还没有找到O（n^2）或者比O（n^2）时间复杂度更小的算法吧

展开阅读全文