南开大学22秋学期(高起本1709-1803、全层次1809-2103)《并行程序设计》在线作业三
奥鹏南开在线作业满分答案参考
22秋学期(高起本1709-1803、全层次1809-2103)《并行程序设计》在线作业-00003
1.现代CPU中都具有指令乱序执行功能,其目的不包括____。
选项A:消除指令依赖,更充分利用多流水线
选项B:提高cache效率
选项C:改变计算结果
选项D:消除资源冲突
满分答案问询微信:424329
2.编写矩阵乘法的Neon程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
选项A:2
选项B:4
选项C:8
选项D:16
满分答案问询微信:424329
3.C/C++语言存储二维数组采取____。
选项A:行主次序存储
选项B:列主次序存储
选项C:交错式存储
选项D:对角线存储
满分答案问询微信:424329
4.MPI收发各一条消息的API是_____。
选项A:MPI_Sendrecv
选项B:MPI_Send
选项C:MPI_Recv
选项D:MPI_Replace
满分答案问询微信:424329
5.以下____是MPI基本原语。
选项A:MPI_barrier
选项B:MPI_Comm_numprocs
选项C:MPI_Comm_rank
选项D:MPI_Comm_Send
满分答案问询微信:424329
6.MPI是用于____系统的并行编程模型。
选项A:SIMD
选项B:MISD
选项C:共享内存
选项D:分布式内存
满分答案问询微信:424329
7.SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=1则表示___。
选项A:将第一个源寄存器的第j个元素放在目标寄存器位置1
选项B:将第二个源寄存器的第j个元素放在目标寄存器位置1
选项C:将第一个源寄存器的第j个元素放在目标寄存器位置j
选项D:将第二个源寄存器的第j个元素放在目标寄存器位置j
满分答案问询微信:424329
8.在矩阵乘法之前将第二个矩阵转置,其作用不包括____。
选项A:增大访存空间局部性
选项B:减少运算次数
选项C:优化SIMD访存
选项D:以上皆错
满分答案问询微信:424329
9.一个Neon寄存器最多存放____个整型数。
选项A:2
选项B:4
选项C:8
选项D:16
满分答案问询微信:424329
10.OpenMP归约指令采用的是一种____算法。
选项A:分治
选项B:贪心
选项C:动态规划
选项D:排序
满分答案问询微信:424329
11.任务依赖图中顶点权重之和表示____。
选项A:任务数
选项B:任务难度
选项C:串行执行时间
选项D:并行执行时间
满分答案问询微信:424329
12.当处理器数量不变时,随着问题规模增大,加速比____。
选项A:所有算法都增大
选项B:所有算法都减小
选项C:代价最优算法都增大
选项D:代价最优算法都减小
满分答案问询微信:424329
13.在下面问题中,SIMD并行最不适合____。
选项A:向量加法
选项B:向量中元素排序
选项C:矩阵向量乘法
选项D:矩阵加法
满分答案问询微信:424329
14.在128位的SIMD寄存器中,我们不能保存____。
选项A:16个8位整数
选项B:8个16位短整型
选项C:4个32位整型
选项D:16个字符的字符串
满分答案问询微信:424329
15.在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买频率(商品组合)划分给不同进程,这是一种划分____的数据并行策略。
选项A:输入数据
选项B:中间结果
选项C:输出数据
选项D:临时数据
满分答案问询微信:424329
16.SIMD并行化时遇到对齐问题,高效的处理方法是____。
选项A:直接使用SIMD不对齐访存指令
选项B:将数据拷贝到对齐的内存地址
选项C:重写算法保证对齐访问
选项D:串行处理到对齐边界,然后进行SIMD对齐访存
满分答案问询微信:424329
17.采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是____。
选项A:更有利于负载均衡
选项B:减少了通信开销
选项C:降低了计算次数
选项D:减少了从进程空闲
满分答案问询微信:424329
18.对于障碍同步机制,以下说法错误的是____。
选项A:SIMD架构无需障碍机制
选项B:是一种群体同步机制
选项C:可用信号量实现
选项D:无法用其他同步机制实现
满分答案问询微信:424329
19.OpenMP编译指示中说明私有变量是用____子句。
选项A:private
选项B:shared
选项C:schedule
选项D:nowait
满分答案问询微信:424329
20.静态线程编程模式的优点是____。
选项A:线程负载均衡
选项B:线程通信效率高
选项C:线程管理开销低
选项D:系统资源利用率高
满分答案问询微信:424329
21.指定线程间划分循环策略的OpenMP子句是____。
选项A:shared
选项B:reduction
选项C:schedule
选项D:nowait
满分答案问询微信:424329
22.一个Neon寄存器最多存放____个单精度浮点数。
选项A:2
选项B:4
选项C:8
选项D:16
满分答案问询微信:424329
23.对于加速比S和处理器数量p,下列说法正确的是____。
选项A:有可能S>p
选项B:必然S<p
选项C:不可能S=p
选项D:两者无关联
满分答案问询微信:424329
24.Pthread是_____线程接口标准。
选项A:Linux
选项B:POSIX
选项C:Windows
选项D:IOS
满分答案问询微信:424329
25.OpenMP默认采用____循环划分策略。
选项A:静态
选项B:固定
选项C:动态
选项D:自适应
满分答案问询微信:424329
26.动态任务划分相对于静态任务划分的优点是____。
选项A:确保负载均衡
选项B:通信开销低
选项C:实现简单
选项D:计算复杂度低
满分答案问询微信:424329
27.Pthread不支持____。
选项A:创建并发执行线程
选项B:同步
选项C:非显式通信
选项D:自动并行化
满分答案问询微信:424329
28.在用pthread_mutex_trylock对互斥量进行加锁时,若其已上锁,则线程进入____状态。
选项A:初始化
选项B:阻塞
选项C:继续执行
选项D:销毁
满分答案问询微信:424329
29.对于搜索分解,下面哪个说法是错误的_____。
选项A:所有子树搜索任务都必须全部完成
选项B:工作量可能大于串行计算
选项C:工作量可能小于串行计算
选项D:可能产生超线性加速比
满分答案问询微信:424329
30.两个矩阵相乘,当矩阵规模大于cache大小时,平凡算法的问题是____。
选项A:第一个矩阵访存时间局部性差
选项B:第一个矩阵访存空间局部性差
选项C:第二个矩阵访存时间局部性差
选项D:第二个矩阵访存空间局部性差
满分答案问询微信:424329
31.起泡排序改为奇偶转置排序,消除了循环步间的数据依赖的原因是____。
选项A:增大了元素比较距离
选项B:减奥鹏南开在线作业满分答案参考小了元素比较距离
选项C:改为元素两两分组比较
选项D:消除了元素比较
满分答案问询微信:424329
32.利用cache line一次读取多个数据字的机制优化程序访存性能,其机理是____。
选项A:降低了访存延迟
选项B:隐藏了访存延迟
选项C:利用了cache空间局部性
选项D:利用了cache时间局部性
满分答案问询微信:424329
33.多对多广播/归约高效算法基于____。
选项A:递归思想
选项B:流水线思想
选项C:分治思想
选项D:贪心思想
满分答案问询微信:424329
34.并行算法加速比的定义是____。
选项A:并行时间/串行时间
选项B:串行时间/并行时间
选项C:串行时间-并行时间
选项D:(串行时间-并行时间)/并行时间
满分答案问询微信:424329
35.在条件成立时使用pthread_cond_signal____。
选项A:唤醒等待线程
选项B:解锁互斥量
选项C:加锁互斥量
选项D:唤醒等待线程,该线程重新加锁互斥量
满分答案问询微信:424329
36.下面说法错误的是____。
选项A:不存在权威的并行体系结构
选项B:学习并行程序设计只关心软件即可
选项C:并行体系结构对性能有巨大影响
选项D:很多并行体系结构未来发展不明了
满分答案问询微信:424329
37.编写n个数求和的OpenMP程序,最高效的方法是____。
选项A:多线程直接并发累加到共享变量
选项B:将累加操作设置为临界区
选项C:在累加操作前设置障碍
选项D:采用归约指令
满分答案问询微信:424329
38.对矩阵乘法串行程序的主体三重循环,我们选择最内层循环进行向量化的原因是____。
选项A:它最后执行
选项B:外层循环中没有计算操作
选项C:是随意选择的
选项D:它的连续循环步是对不同元素进行相同运算
满分答案问询微信:424329
39.SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高),则执行C=shuffle(A, A, 0x1B)后,C中元素为
选项A:A1 A2 A3 A4
选项B:A2 A1 A4 A3
选项C:A3 A4 A1 A2
选项D:A4 A3 A2 A1
满分答案问询微信:424329
40.SSE是____平台的SIMD架构。
选项A:x86
选项B:POWER
选项C:SPARC
选项D:ARM
满分答案问询微信:424329
41.如果运算结果要保存到独立无关的变量,则在向量运算之后需要进行的一个操作是____。
选项A:对齐
选项B:打包
选项C:解包
选项D:以上皆错
满分答案问询微信:424329
42.对于条件变量,下列说法错误的是____。
选项A:可以用互斥量实现相同功能
选项B:不能用互斥量实现相同功能
选项C:较之互斥量方案节省资源
选项D:较之互斥量方案代码更简洁
满分答案问询微信:424329
43.记并行时间为T,串行时间为T',处理器数量为p,并行代价的定义是____。
选项A:pT
选项B:T'+T
选项C:p(T'-T)
选项D:pT-T'
满分答案问询微信:424329
44.采用多核、众核技术提升CPU性能,相对于单核的优势不包括____。
选项A:架构设计更容易
选项B:更易突破物理极限
选项C:能更充分利用现有资源
选项D:功耗优势明显
满分答案问询微信:424329
45.SSE intrinsics _mm_store_sd命令的功能是____。
选项A:对齐向量存单精度浮点数
选项B:未对齐向量存单精度浮点数
选项C:对齐标量存双精度浮点数
选项D:未对齐标量存双精度浮点数
满分答案问询微信:424329
46.使用____无法直接实现“主线程唤醒4个从线程去执行任务”。
选项A:1个信号量
选项B:障碍
选项C:1个互斥量
选项D:4个互斥量
满分答案问询微信:424329
47.n个节点的线性阵列中,节点最远通信距离为____。
选项A:1
选项B:O(logn)
选项C:O(sqrt(n))
选项D:O(n)
满分答案问询微信:424329
48.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
选项A:正确的
选项B:错误的
满分答案问询微信:424329
49.数据依赖是指必须保持两个内存操作的____才能保证程序结果正确。
选项A:大小
选项B:时序
选项C:时长
选项D:cache局部性
满分答案问询微信:424329
50.OpenMP并行模型是一种____模式。
选项A:SISD
选项B:SIMD
选项C:MISD
选项D:SPMD
满分答案问询微信:424329