南开大学22秋学期(高起本1709-1803、全层次1809-2103)《并行程序设计》在线作业一
奥鹏南开在线作业满分答案参考
22秋学期(高起本1709-1803、全层次1809-2103)《并行程序设计》在线作业-00001
1.SSE intrinsics _mm_load_sd命令的功能是____。
选项A:对齐标量读取单精度浮点数
选项B:未对齐标量读取单精度浮点数
选项C:对齐标量读取双精度浮点数
选项D:未对齐标量读取双精度浮点数
满分答案问询微信:424329
2.在使用信号量之后必须对其进行____。
选项A:初始化
选项B:解锁
选项C:减1
选项D:销毁
满分答案问询微信:424329
3.下列哪门课程不是并行程序设计的先导课?
选项A:计算机概论
选项B:高级语言程序设计
选项C:计算机体系结构
选项D:数据库系统
满分答案问询微信:424329
4.SIMD并行架构的优点不包括____。
选项A:辅助提供更大并发度
选项B:设计简单
选项C:编程简单
选项D:更小的芯片尺寸
满分答案问询微信:424329
5.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。
选项A:初始化
选项B:第二个矩阵转置循环
选项C:矩阵元素乘—加计算的循环
选项D:结果输出
满分答案问询微信:424329
6.pthread_join的第二个参数的作用是____。
选项A:设置指定线程属性
选项B:获取指定线程属性
选项C:向指定线程传递参数
选项D:获取指定线程函数返回结果
满分答案问询微信:424329
7.如果运算结果要保存到独立无关的变量,则在向量运算之后需要进行的一个操作是____。
选项A:对齐
选项B:打包
选项C:解包
选项D:以上皆错
满分答案问询微信:424329
8.对两个互斥量a、b,线程1执行lock(a); lock(b);,线程2执行lock(b); lock(a),则两个线程间会发生____。
选项A:竞争条件
选项B:数据依赖
选项C:资源泄漏
选项D:死锁
满分答案问询微信:424329
9.SSE寄存器A和B中元素分别为A1 A2 A3 A4和B1 B2 B3 B4(均为由低到高),则执行C=blend(A, B, 0x05)后,C中元素为
选项A:A1 A2 B3 B4
选项B:B1 B2 A3 A4
选项C:A1 B2 A3 B4
选项D:B1 A2 B3 A4
满分答案问询微信:424329
10.C/C++语言存储二维数组采取____。
选项A:行主次序存储
选项B:列主次序存储
选项C:交错式存储
选项D:对角线存储
满分答案问询微信:424329
11.单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.
选项A:等于8
选项B:小于8
选项C:4到8之间
选项D:等于4
满分答案问询微信:424329
12.SIMD架构中,_____。
选项A:唯一控制单元控制所有计算单元
选项B:每个计算单元独有控制单元
选项C:一组计算单元共享一个控制单元
选项D:以上皆错
满分答案问询微信:424329
13.编写n个数求和的OpenMP程序,最高效的方法是____。
选项A:多线程直接并发累加到共享变量
选项B:将累加操作设置为临界区
选项C:在累加操作前设置障碍
选项D:采用归约指令
满分答案问询微信:424329
14.每个SSE寄存器宽度为____位。
选项A:32
选项B:64
选项C:128
选项D:256
满分答案问询微信:424329
15.互斥量是一种____同步机制。
选项A:一元状态
选项B:二元状态
选项C:多元状态
选项D:以上皆错
满分答案问询微信:424329
16.四位助教帮助教授批改300份试卷,试卷共16道题,每位助教负责批改75份试卷,这是一种____任务划分方法。
选项A:数据并行
选项B:任务并行
选项C:搜索并行
选项D:预测并行
满分答案问询微信:424329
17.Pthread是_____线程接口标准。
选项A:Linux
选项B:POSIX
选项C:Windows
选项D:IOS
满分答案问询微信:424329
18.在SSE intrinsics程序中整数数据类型是____。
选项A:__m128
选项B:__m128f
选项C:__m128d
选项D:__m128i
满分答案问询微信:424329
19.pthread_rwlock_rdlock是对读写锁进行____操作。
选项A:加锁
选项B:解锁
选项C:加读琐
选项D:加写锁
满分答案问询微信:424329
20.n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是____。
选项A:负载不均
选项B:通信开销大
选项C:CPU空闲等待严重
选项D:sum累加产生竞争条件,导致结果错误
满分答案问询微信:424329
21.数据依赖是指必须保持两个内存操作的____才能保证程序结果正确。
选项A:大小
选项B:时序
选项C:时长
选项D:cache局部性
满分答案问询微信:424329
22.OpenMP并行模型是一种____编程模型。
选项A:静态线程
选项B:动态线程
选项C:混合线程
选项D:众核
满分答案问询微信:424329
23.关于pthread_create的第一个pthread_t参数,下列说奥鹏南开在线作业满分答案参考法错误的是____。
选项A:它是输出参数
选项B:它返回线程系统ID
选项C:它返回线程的pthread ID
选项D:需要为它预先分配内存
满分答案问询微信:424329
24.并行算法运行时间是指____。
选项A:最快进程花费时间
选项B:所有进程平均花费时间
选项C:所有进程花费总时间
选项D:最慢进程花费时间
满分答案问询微信:424329
25.下面哪个问题相对而言更不适合进行数据并行____。
选项A:求和
选项B:排序
选项C:向量加法
选项D:矩阵乘法
满分答案问询微信:424329
26.AVX_512有____个专用寄存器。
选项A:4
选项B:8
选项C:16
选项D:32
满分答案问询微信:424329
27.在使用条件变量之后必须对其进行____。
选项A:初始化
选项B:加锁
选项C:解锁
选项D:销毁
满分答案问询微信:424329
28.当问题规模不变时,随着处理器数量增大,加速比____。
选项A:必然增大
选项B:必然减小
选项C:必然不变
选项D:以上皆错
满分答案问询微信:424329
29.一个Neon寄存器最多存放____个短整型数。
选项A:2
选项B:4
选项C:8
选项D:16
满分答案问询微信:424329
30.动态任务划分相对于静态任务划分的优点是____。
选项A:确保负载均衡
选项B:通信开销低
选项C:实现简单
选项D:计算复杂度低
满分答案问询微信:424329
31.现代CPU中都具有指令乱序执行功能,其目的不包括____。
选项A:消除指令依赖,更充分利用多流水线
选项B:提高cache效率
选项C:改变计算结果
选项D:消除资源冲突
满分答案问询微信:424329
32.在共享内存架构编程中,线程间不能通过____进行通信
选项A:全局变量
选项B:局部变量
选项C:静态变量
选项D:全局堆中变量
满分答案问询微信:424329
33.OpenMP程序和Pthread程序中线程获得自身编号的方式分别是____。
选项A:两者均为创建线程时传递参数
选项B:两者均通过特定API
选项C:前者创建线程时传递参数,后者通过特定API
选项D:前者通过特定API,后者创建线程时传递参数
满分答案问询微信:424329
34.for (i=0; i<16; i+=1) { L = A[i+0] – B[i+0]; D = D + abs(L); },此循环____。
选项A:可完全向量化
选项B:不可向量化
选项C:不确定
选项D:可部分向量化
满分答案问询微信:424329
35.单程序多数据流模式是针对____架构的。
选项A:SISD
选项B:SIMD
选项C:MISD
选项D:MIMD
满分答案问询微信:424329
36.在使用条件变量时,还需配套使用一个____。
选项A:互斥量
选项B:信号量
选项C:障碍
选项D:自旋锁
满分答案问询微信:424329
37.全球500强超算在CPU、网络等硬件上越来越体现出采用____的趋势。
选项A:特殊硬件
选项B:通用硬件
选项C:非公开硬件
选项D:廉价硬件
满分答案问询微信:424329
38.OpenMP中多线程间是一种____关系。
选项A:主从
选项B:分组
选项C:对等
选项D:竞争
满分答案问询微信:424329
39.SSE是____平台的SIMD架构。
选项A:x86
选项B:POWER
选项C:SPARC
选项D:ARM
满分答案问询微信:424329
40.多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是
选项A:读取x存在数据依赖,不能并发进行
选项B:累加顺序被改变,结果是错误的
选项C:加法操作是简单运算,无需同步
选项D:加法操作不是原子操作,需要同步保证数据依赖
满分答案问询微信:424329
41.我们不能通过____指定OpenMP循环划分策略。
选项A:使用编译指示
选项B:设置环境变量
选项C:调用库函数
选项D:采用默认设置
满分答案问询微信:424329
42.以下说法错误的是____。
选项A:全归约的高效算法基于多对多广播的高效算法
选项B:全归约高效算法基于一对多广播的高效算法
选项C:前缀和的高效算法基于多对多广播的高效算法
选项D:前缀和的高效算法中的通信模式于全归约的高效算法相似
满分答案问询微信:424329
43.编写矩阵乘法的Neon程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
选项A:2
选项B:4
选项C:8
选项D:16
满分答案问询微信:424329
44.CUDA的优点不包括____。
选项A:可移植性
选项B:入门简单
选项C:标准的SPMD模式
选项D:不再需要图形API
满分答案问询微信:424329
45.1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X[0]*1.3;G=X[1]*1.8;B=X[2]*1.1; 这两个程序片段哪个进行向量化效率更高?
选项A:1)
选项B:2)
选项C:不确定
选项D:以上皆错
满分答案问询微信:424329
46.编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
选项A:2
选项B:4
选项C:8
选项D:16
满分答案问询微信:424329
47.OpenMP编译指示中说明共享变量是用____子句。
选项A:private
选项B:shared
选项C:schedule
选项D:nowait
满分答案问询微信:424329
48.动态任务划分相对于静态任务划分的缺点是____。
选项A:可能导致负载不均
选项B:通信开销高
选项C:任务粒度粗
选项D:计算复杂度高
满分答案问询微信:424329
49.SSE intrinsics _mm_loadu_pd命令的功能是____。
选项A:对齐向量读取单精度浮点数
选项B:未对齐向量读取单精度浮点数
选项C:对齐向量读取双精度浮点数
选项D:未对齐向量读取双精度浮点数
满分答案问询微信:424329
50.互斥量mutex机制,在任何时刻____进入它保护的区域。
选项A:允许任意数量任意类型的线程
选项B:允许一个读线程任意个写线程
选项C:允许一个写线程任意个读线程
选项D:只允许一个线程
满分答案问询微信:424329