南开23春学期(高起专1903、专升本1903)《并行程序设计》在线作业三

奥鹏南开大学新学期作业参考

南开23春学期(高起专1903、专升本1903)《并行程序设计》在线作业三插图

南开大学23春学期(高起专1903、专升本1903)《并行程序设计》在线作业

1.在使用条件变量之前必须对其进行____。
选项A:初始化
选项B:加锁
选项C:解锁
选项D:销毁
正确答案问询微信:424329

2.MPI默认点对点通信模式是____。
选项A:阻塞的
选项B:非阻塞的
选项C:对等的
选项D:主从的
正确答案问询微信:424329

3.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
选项A:正确的
选项B:错误的
正确答案问询微信:424329

4.for (i=2; i<10; i++) A[i] = A[i-2]+1; 此循环____数据依赖。
选项A:存在
选项B:不存在
选项C:不确定
选项D:以上皆错
正确答案问询微信:424329

5.对于起泡排序程序两层循环是否存在数据依赖,下面说法正确的是____。
选项A:外层存在,内层不存在
选项B:外层不存在,内层存在
选项C:两层都不存在
选项D:两层都存在
正确答案问询微信:424329

6.AVX是____平台的SIMD架构。
选项A:x86
选项B:POWER
选项C:SPARC
选项D:ARM
正确答案问询微信:424329

7.pthread_rwlock_rdlock是对读写锁进行____操作。
选项A:加锁
选项B:解锁
选项C:加读琐
选项D:加写锁
正确答案问询微信:424329

8.SSE intrinsics _mm_load_ps命令的功能是____。
选项A:对齐向量读取单精度浮点数
选项B:未对齐向量读取单精度浮点数
选项C:对齐向量读取双精度浮点数
选项D:未对齐向量读取双精度浮点数
正确答案问询微信:424329

9.采用多核、众核技术提升CPU性能,相对于单核的优势不包括____。
选项A:架构设计更容易
选项B:更易突破物理极限
选项C:能更充分利用现有资源
选项D:功耗优势明显
正确答案问询微信:424329

10.当问题规模不变时,随着处理器数量增大,效率降低的性质对____成立。
选项A:部分并行算法
选项B:代价最优并行算法
选项C:所有并行算法
选项D:以上皆错
正确答案问询微信:424329

11.n个节点的超立方中,节点最远通信距离为____。
选项A:1
选项B:O(logn)
选项C:O(sqrt(n))
选项D:O(n)
正确答案问询微信:424329

12.pthread_join的作用是____。
选项A:强制终止指定线程
选项B:检测指定线程是否结束
选项C:等待指定线程结束才返回
选项D:向指定线程发送数据
正确答案问询微信:424329

13.在使用条件变量之后必须对其进行____。
选项A:初始化
选项B:加锁
选项C:解锁
选项D:销毁
正确答案问询微信:424329

14.为了充分利用CPU内的多条流水线,程序应满足____。
选项A:相邻指令无依赖性
选项B:相邻指令相互依赖
选项C:整段程序中指令无依赖性
选项D:整段程序中指令相互依赖
正确答案问询微信:424329

15.MPI中表示虚拟进程的____。
选项A:MPI_ANY_SOURCE
选项B:MPI_PROC_NULL
选项C:MPI_PROC_ANY
选项D:MPI_ANY_TAG
正确答案问询微信:424329

16.OpenMP主要是通过____来更高层抽象的多线程编程。
选项A:设计实现新的语言
选项B:为现有语言提供大量库函数
选项C:为现有语言扩展编译指示
选项D:新编译器实现自动并行化
正确答案问询微信:424329

17.C/C++语言存储二维数组采取____。
选项A:行主次序存储
选项B:列主次序存储
选项C:交错式存储
选项D:对角线存储
正确答案问询微信:424329

18.并行算法的额外开销不包括____。
选项A:进程间通信
选项B:进程等待I/O
选项C:进程空闲
选项D:额外计算
正确答案问询微信:424329

19.MPI组通信操作不包括哪类____。
选项A:通信
选项B:同步
选项C:点对点
选项D:计算
正确答案问询微信:424329

20.关于omp single指令,下面说法错误的是____。
选项A:线程组中只有一个线程执行代码
选项B:用于I/O或初始化等任务
选项C:是保持数据依赖所必须的
选项D:入口或出口无隐式barrier
正确答案问询微信:424329

21.编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
选项A:2
选项B:4
选项C:8
选项D:16
正确答案问询微信:424329

22.使用____无法直接实现“主线程等待4个从线程完成任务”。
选项A:1个信号量
选项B:障碍
选项C:1个互斥量
选项D:4个互斥量
正确答案问询微信:424329

23.互斥量mutex机制,在任何时刻____进入它保护的区域。
选项A:允许任意数量任意类型的线程
选项B:允许一个读线程任意个写线程
选项C:允许一个写线程任意个读线程
选项D:只允许一个线程
正确答案问询微信:424329

24.OpenMP是___的一个常见替代。
选项A:SSE
选项B:MPI
选项C:Pthread
选项D:CUDA
正确答案问询微信:424329

25.OpenMP是___架构下的一种编程工具。
选项A:SIMD
选项B:MISD
选项C:共享内存
选项D:分布式内存
正确答案问询微信:424329

26.记并行时间为T,串行时间为T',处理器数量为p,则额外开销应如何计算?
选项A:T'-T
选项B:T-T'
选项C:pT
选项D:pT-T'
正确答案问询微信:424329

27.OpenMP的优点不包括____。
选项A:从头编写并行程序很自然
选项B:串行程序并行化简单
选项C:不必关心低层细节
选项D:可移植、可扩展
正确答案问询微信:424329

28.CUDA生态环境的特点不包括____。
选项A:支持多种显卡架构
选项B:支持CPU、GPU自动混合并行
选项C:支持多种编程语言
选项D:支持多领域的库
正确答案问询微信:424329

29.动态任务划分相对于静态任务划分的缺点是____。
选项A:可能导致负载不均
选项B:通信开销高
选项C:任务粒度粗
选项D:计算复杂度高
正确答案问询微信:424329

30.在使用信号量之前必须对其进行____。
选项A:初始化
选项B:加锁
选项C:加1
选项D:销毁
正确答案问询微信:424329

31.动态线程编程模式的缺点是____。
选项A:线程管理开销高
选项B:系统资源利用率低
选项C:线程任务分配困难
选项D:线程通信效率低
正确答案问询微信:424329

32.在128位的SIMD寄存器中,我们不能保存____。
选项A:16个8位整数
选项B:8个16位短整型
选项C:4个32位整型
选项D:16个字符的字符串
正确答案问询微信:424329

33.单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.
选项A:等于8
选项B:小于8
选项C:4到8之间
选项D:等于4
正确答案问询微信:424329

34.R*=1.3;G+=1.8;B+=1.2;X*=1.1,此程序片段可进行SIMD并行化吗?
选项A:不可以
选项B:可以
选项C:不确定
选项D:以上皆错
正确答案问询微信:424329

35.对单精度浮点计算,AVX最高实现____路并行。
选项A:2
选项B:4
选项C:8
选项D:16
正确答案问询微信:424329

36.两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_____达到更高的cache命中率。
选项A:时间局部性
选项B:空间局部性
选项C:计算局部性
选项D:混合局部性
正确答案问询微信:424329

37.采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加___前缀。
选项A:__global__
选项B:__device___
选项C:__shared__
选项D:__private__
正确答案问询微信:424329

38.对于MPI中的点对点通信,下面错误的说法是____。
选项A:发送方的目的地址必须是接受方的进程编号
选项B:接受方的源地址可以不是发送方的进程编号
选项C:发送方和接受方的消息标签必须一致
选项D:接受方的消息标签可以是MPI_ANY_TAG
正确答案问询微信:424329

39.主线程要求从线程退出应采用____。
选项A:pthread_create
选项B:pthread_exit
选项C:pthread_quit
选项D:pthread_cancel
正确答案问询微信:424329

40.将寄存器设置为4个给定单精度浮点数的SSE intrinsics指令是____。
选项A:_mm_set_ps
选项B:_mm_set1_ss
选项C:_mm_setzero_ss
选项D:_mm_setzero_ps
正确答案问询微信:424329

41.每个AVX_512寄存器宽度为____位。
选项A:64
选项B:128
选项C:256
选项D:512
正确答案问询微信:424329

42.一个AVX寄存器最多存放____个整型数。
选项A:2
选项B:4
选项C:8
选项D:16
正确答案问询微信:424329

43.关于消息传递编程的特点,以下说法正确的是____。
选项A:与共享内存一样有竞争条件
选项B:编程简单
选项C:需程序员考虑局部性
选项D:无需考虑进程间通信
正确答案问询微信:424329

44.关于MPI是什么,以下说法错误的是____。
选项A:一种消息传递编程模型标准
选项B:一种共享内存编程模型标准
选项C:编程角度看是C++/Fortran等的库
选项D:基于SPMD模型
正确答案问询微信:424329

45.静态任务划分相对于动态任务划分的缺点是____。
选项A:可能导致负载不均
选项B:通信开销高
选项C:计算复复杂度高
选项D:任务粒度粗
正确答案问询微信:424329

46.以下超级计算机中,____是SIMD架构。
选项A:CRAY-1
选项B:天河1A
选项C:天河2号
选项D:神威.太湖之光
正确答案问询微信:424329

47.CUDA的优点不包括____。
选项A:可移植性
选项B:入门简单
选项C:标准的SPMD模式
选项D:不再需要图形A奥鹏南开大学新学期作业参考PI
正确答案问询微信:424329

48.CUDA程序中不包括____。
选项A:host代码
选项B:device代码
选项C:kernel
选项D:图形渲染代码
正确答案问询微信:424329

49.OpenMP循环划分策略不包括____。
选项A:static
选项B:fixed
选项C:dynamic
选项D:guided
正确答案问询微信:424329

50.OpenMP的缺点不包括____。
选项A:常见并行结构的表达并不总可行
选项B:局部性处理不易
选项C:不易编写多核单核通用程序
选项D:性能控制不易
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网