南开23春学期(高起专1903、专升本1903)《并行程序设计》在线作业一
奥鹏南开大学新学期作业参考

南开大学23春学期(高起专1903、专升本1903)《并行程序设计》在线作业
1.编写矩阵乘法的AVX程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
选项A:2
选项B:4
选项C:8
选项D:16
正确答案问询微信:424329
2.在SSE intrinsics程序中整数数据类型是____。
选项A:__m128
选项B:__m128f
选项C:__m128d
选项D:__m128i
正确答案问询微信:424329
3.动态线程编程模式的缺点是____。
选项A:线程管理开销高
选项B:系统资源利用率低
选项C:线程任务分配困难
选项D:线程通信效率低
正确答案问询微信:424329
4.记并行时间为T,串行时间为T',处理器数量为p,并行效率E的定义是____。
选项A:T'-T
选项B:T'/T
选项C:T'/pT
选项D:pT-T'
正确答案问询微信:424329
5.Flynn分类法中,下面哪种体系结构非常适合向量/矩阵计算的并行化?
奥鹏南开大学新学期作业参考 选项A:SISD
选项B:SIMD
选项C:MISD
选项D:MIMD
正确答案问询微信:424329
6.一个并行算法是非代价最优的,则____改进为代价最优。
选项A:减少处理器数量必然能
选项B:减少处理器数量有可能
选项C:减少处理器数量也不可能
选项D:增大处理器数量必然能
正确答案问询微信:424329
7.MPI的通信是____。
选项A:无类型传输
选项B:弱类型传输
选项C:强类型传输
选项D:以上皆错
正确答案问询微信:424329
8.为利用cache空间局部性,需满足____。
选项A:cache空间足够大
选项B:cache line足够大
选项C:程序访问的数据量足够小
选项D:程序访存模式符合空间局部性特点
正确答案问询微信:424329
9.pthread_join的第二个参数的作用是____。
选项A:设置指定线程属性
选项B:获取指定线程属性
选项C:向指定线程传递参数
选项D:获取指定线程函数返回结果
正确答案问询微信:424329
10.对同一个问题的两个任务依赖图G1和G2,以下哪个条件不能表明G1优于G2____。
选项A:G1顶点权重之和小于G2
选项B:G1平均并发度大于G2
选项C:G1关键路径长度小于G2
选项D:G1顶点权重之和除以关键路径长度大于G2
正确答案问询微信:424329
11.MPI原址收发各一条消息的API是_____。
选项A:MPI_Sendrecv
选项B:MPI_Send
选项C:MPI_Recv
选项D:MPI_Sendrecv_Replace
正确答案问询微信:424329
12.一个SSE寄存器可容纳____个短整型数。
选项A:2
选项B:4
选项C:8
选项D:16
正确答案问询微信:424329
13.对于粗粒度任务划分和细粒度任务划分,下面说法错误的是____。
选项A:细粒度划分可达到更高的并发度,应选择它
选项B:细粒度划分会导致更大通信开销
选项C:粗粒度划分更不容易达到负载均衡
选项D:粗粒度划分会产生更多线程间交互
正确答案问询微信:424329
14.超级计算机制造越来越关注的一个新的指标是____。
选项A:计算能力
选项B:存储能力
选项C:占地面积
选项D:功耗
正确答案问询微信:424329
15.关于pthread_create函数,下列说法错误的是____。
选项A:它返回是线程创建成功与否的错误码
选项B:线程属性参数使用空指针表示使用默认参数
选项C:它成功创建线程后立刻执行线程函数等待其结束后返回
选项D:可通过它将参数传递给线程函数
正确答案问询微信:424329
16.采用划分子矩阵方法实现矩阵乘法,会将程序的主体三重循环变为____重循环。
选项A:4
选项B:5
选项C:6
选项D:7
正确答案问询微信:424329
17.对于障碍同步机制,以下说法错误的是____。
选项A:SIMD架构无需障碍机制
选项B:是一种群体同步机制
选项C:可用信号量实现
选项D:无法用其他同步机制实现
正确答案问询微信:424329
18.关于MPI_recv对源地址的标识,下列说法正确的是____。
选项A:只能使用进程编号
选项B:可以使用IP地址
选项C:可以使用IPV6地址
选项D:可以使用MPI_ANY_SOURCE
正确答案问询微信:424329
19.超立方中相邻节点二进制编号____。
选项A:至少差1位
选项B:至多差1位
选项C:恰好差1位
选项D:差异不固定
正确答案问询微信:424329
20.全球500强超算在操作系统上越来越体现出____一家独大的趋势。
选项A:Unix
选项B:Windows
选项C:Linux
选项D:ios
正确答案问询微信:424329
21.超算领域软件应用的最高奖项是____。
选项A:图灵奖
选项B:菲尔茨奖
选项C:诺贝尔奖
选项D:戈登?贝尔奖
正确答案问询微信:424329
22.在下列应用中,SIMD最不适合____。
选项A:图像处理
选项B:音频处理
选项C:科学计算
选项D:数据库查询
正确答案问询微信:424329
23.以下哪条不是推动并行计算发展的因素?
选项A:存储是系统瓶颈
选项B:单CPU发展已能满足应用需求
选项C:利用标准硬件构造并行机令升级容易
选项D:编程环境标准化逐步发展
正确答案问询微信:424329
24.CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为
选项A:8MFlops
选项B:125MFlops
选项C:1GFlops
选项D:4GFlops
正确答案问询微信:424329
25.每个MMX寄存器宽度为____位。
选项A:32
选项B:64
选项C:128
选项D:256
正确答案问询微信:424329
26.关于omp single指令,下面说法错误的是____。
选项A:线程组中只有一个线程执行代码
选项B:用于I/O或初始化等任务
选项C:是保持数据依赖所必须的
选项D:入口或出口无隐式barrier
正确答案问询微信:424329
27.在下面问题中,SIMD并行更适合____。
选项A:搜索
选项B:排序
选项C:矩阵乘法
选项D:构建二叉排序树
正确答案问询微信:424329
28.互斥量mutex机制,在任何时刻____进入它保护的区域。
选项A:允许任意数量任意类型的线程
选项B:允许一个读线程任意个写线程
选项C:允许一个写线程任意个读线程
选项D:只允许一个线程
正确答案问询微信:424329
29.FORTRAN语言存储二维数组采取____。
选项A:行主次序存储
选项B:列主次序存储
选项C:交错式存储
选项D:对角线存储
正确答案问询微信:424329
30.MPI预定义数据类型不包括____。
选项A:MPI_DOUBLE
选项B:MPI_LONG_LONG
选项C:MPI_BYTE
选项D:MPI_PACKED
正确答案问询微信:424329
31.造成超线性加速比的原因包括____。
选项A:进程间大量通信
选项B:并行算法导致额外计算
选项C:并行计算工作量显著小于串行计算
选项D:问题求解包含不可并行化部分
正确答案问询微信:424329
32.MPI组通信操作不包括哪类____。
选项A:通信
选项B:同步
选项C:点对点
选项D:计算
正确答案问询微信:424329
33.下列指令集中___不是SIMD指令集。
选项A:SSE
选项B:Neon
选项C:AVX
选项D:EMT64
正确答案问询微信:424329
34.经典冯诺依曼架构执行一条指令的过程中不包括哪个操作?
选项A:取指令
选项B:解码
选项C:安全性检查
选项D:执行指令
正确答案问询微信:424329
35.一个AVX寄存器最多存放____个双精度浮点数。
选项A:2
选项B:4
选项C:8
选项D:16
正确答案问询微信:424329
36.使用____无法直接实现“主线程等待4个从线程完成任务”。
选项A:1个信号量
选项B:障碍
选项C:1个互斥量
选项D:4个互斥量
正确答案问询微信:424329
37.采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。
选项A:按编号顺序依次从从进程接收结果
选项B:按编号逆序依次从从进程接收结果
选项C:按编号顺序、逆序交替从从进程接收结果
选项D:使用MPI_ANY_SOURCE和MPI_ANY_TAG
正确答案问询微信:424329
38.我国获得戈登?贝尔奖的工作都是基于____超算进行的。
选项A:天河1号
选项B:天河2号
选项C:神威?太湖之光
选项D:美洲虎
正确答案问询微信:424329
39.CUDA程序中不包括____。
选项A:host代码
选项B:device代码
选项C:kernel
选项D:图形渲染代码
正确答案问询微信:424329
40.n个节点的超立方构造成本为____。
选项A:O(logn)
选项B:O(sqrt(n))
选项C:O(n)
选项D:O(nlogn)
正确答案问询微信:424329
41.全球500强超算越来越体现出依赖____提供强大计算能力的趋势。
选项A:单核CPU
选项B:多核CPU
选项C:FPGA
选项D:众核协处理器
正确答案问询微信:424329
42.一个AVX寄存器最多存放____个整型数。
选项A:2
选项B:4
选项C:8
选项D:16
正确答案问询微信:424329
43.MPI程序中发送和接收消息的两个进程必须____。
选项A:在同一个网段中
选项B:连接在同一个路由器上
选项C:在同一个通信域中
选项D:以上皆错
正确答案问询微信:424329
44.竞争条件是指程序执行过程中两个或多个事件的____影响执行结果。
选项A:时序
选项B:时长
选项C:结果
选项D:运算对象
正确答案问询微信:424329
45.单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.
选项A:等于8
选项B:小于8
选项C:4到8之间
选项D:等于4
正确答案问询微信:424329
46.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的___操作才能得到结果矩阵的一个元素。
选项A:排列
选项B:交换
选项C:广播
选项D:归约
正确答案问询微信:424329
47.下面说法错误的是____。
选项A:不存在权威的并行体系结构
选项B:学习并行程序设计只关心软件即可
选项C:并行体系结构对性能有巨大影响
选项D:很多并行体系结构未来发展不明了
正确答案问询微信:424329
48.OpenMP中多线程间是一种____关系。
选项A:主从
选项B:分组
选项C:对等
选项D:竞争
正确答案问询微信:424329
49.R*=1.3;G+=1.8;B+=1.2;X*=1.1,此程序片段可进行SIMD并行化吗?
选项A:不可以
选项B:可以
选项C:不确定
选项D:以上皆错
正确答案问询微信:424329
50.如果运算对象是独立无关的变量,则在向量运算之前需____。
选项A:将变量拷贝到连续区域
选项B:将变量地址拷贝到连续区域
选项C:将变量逐个传输到向量寄存器
选项D:以上皆错
正确答案问询微信:424329