南开大学22秋学期（高起本1709-1803、全层次1809-2103）《并行程序设计》在线作业一

奥鹏南开在线作业满分答案参考

22秋学期（高起本1709-1803、全层次1809-2103）《并行程序设计》在线作业-00001

1.SSE intrinsics _mm_load_sd命令的功能是____。
选项A：对齐标量读取单精度浮点数
选项B：未对齐标量读取单精度浮点数
选项C：对齐标量读取双精度浮点数
选项D：未对齐标量读取双精度浮点数
满分答案问询微信：424329

2.在使用信号量之后必须对其进行____。
选项A：初始化
选项B：解锁
选项C：减1
选项D：销毁
满分答案问询微信：424329

3.下列哪门课程不是并行程序设计的先导课?
选项A：计算机概论
选项B：高级语言程序设计
选项C：计算机体系结构
选项D：数据库系统
满分答案问询微信：424329

4.SIMD并行架构的优点不包括____。
选项A：辅助提供更大并发度
选项B：设计简单
选项C：编程简单
选项D：更小的芯片尺寸
满分答案问询微信：424329

5.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。
选项A：初始化
选项B：第二个矩阵转置循环
选项C：矩阵元素乘—加计算的循环
选项D：结果输出
满分答案问询微信：424329

6.pthread_join的第二个参数的作用是____。
选项A：设置指定线程属性
选项B：获取指定线程属性
选项C：向指定线程传递参数
选项D：获取指定线程函数返回结果
满分答案问询微信：424329

7.如果运算结果要保存到独立无关的变量,则在向量运算之后需要进行的一个操作是____。
选项A：对齐
选项B：打包
选项C：解包
选项D：以上皆错
满分答案问询微信：424329

8.对两个互斥量a、b,线程1执行lock(a); lock(b);,线程2执行lock(b); lock(a),则两个线程间会发生____。
选项A：竞争条件
选项B：数据依赖
选项C：资源泄漏
选项D：死锁
满分答案问询微信：424329

9.SSE寄存器A和B中元素分别为A1 A2 A3 A4和B1 B2 B3 B4(均为由低到高),则执行C=blend(A, B, 0x05)后,C中元素为
选项A：A1 A2 B3 B4
选项B：B1 B2 A3 A4
选项C：A1 B2 A3 B4
选项D：B1 A2 B3 A4
满分答案问询微信：424329

10.C/C++语言存储二维数组采取____。
选项A：行主次序存储
选项B：列主次序存储
选项C：交错式存储
选项D：对角线存储
满分答案问询微信：424329

11.单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.
选项A：等于8
选项B：小于8
选项C：4到8之间
选项D：等于4
满分答案问询微信：424329

12.SIMD架构中,_____。
选项A：唯一控制单元控制所有计算单元
选项B：每个计算单元独有控制单元
选项C：一组计算单元共享一个控制单元
选项D：以上皆错
满分答案问询微信：424329

13.编写n个数求和的OpenMP程序,最高效的方法是____。
选项A：多线程直接并发累加到共享变量
选项B：将累加操作设置为临界区
选项C：在累加操作前设置障碍
选项D：采用归约指令
满分答案问询微信：424329

14.每个SSE寄存器宽度为____位。
选项A：32
选项B：64
选项C：128
选项D：256
满分答案问询微信：424329

15.互斥量是一种____同步机制。
选项A：一元状态
选项B：二元状态
选项C：多元状态
选项D：以上皆错
满分答案问询微信：424329

16.四位助教帮助教授批改300份试卷,试卷共16道题,每位助教负责批改75份试卷,这是一种____任务划分方法。
选项A：数据并行
选项B：任务并行
选项C：搜索并行
选项D：预测并行
满分答案问询微信：424329

17.Pthread是_____线程接口标准。
选项A：Linux
选项B：POSIX
选项C：Windows
选项D：IOS
满分答案问询微信：424329

18.在SSE intrinsics程序中整数数据类型是____。
选项A：__m128
选项B：__m128f
选项C：__m128d
选项D：__m128i
满分答案问询微信：424329

19.pthread_rwlock_rdlock是对读写锁进行____操作。
选项A：加锁
选项B：解锁
选项C：加读琐
选项D：加写锁
满分答案问询微信：424329

20.n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是____。
选项A：负载不均
选项B：通信开销大
选项C：CPU空闲等待严重
选项D：sum累加产生竞争条件，导致结果错误
满分答案问询微信：424329

21.数据依赖是指必须保持两个内存操作的____才能保证程序结果正确。
选项A：大小
选项B：时序
选项C：时长
选项D：cache局部性
满分答案问询微信：424329

22.OpenMP并行模型是一种____编程模型。
选项A：静态线程
选项B：动态线程
选项C：混合线程
选项D：众核
满分答案问询微信：424329

23.关于pthread_create的第一个pthread_t参数,下列说奥鹏南开在线作业满分答案参考法错误的是____。
选项A：它是输出参数
选项B：它返回线程系统ID
选项C：它返回线程的pthread ID
选项D：需要为它预先分配内存
满分答案问询微信：424329

24.并行算法运行时间是指____。
选项A：最快进程花费时间
选项B：所有进程平均花费时间
选项C：所有进程花费总时间
选项D：最慢进程花费时间
满分答案问询微信：424329

25.下面哪个问题相对而言更不适合进行数据并行____。
选项A：求和
选项B：排序
选项C：向量加法
选项D：矩阵乘法
满分答案问询微信：424329

26.AVX_512有____个专用寄存器。
选项A：4
选项B：8
选项C：16
选项D：32
满分答案问询微信：424329

27.在使用条件变量之后必须对其进行____。
选项A：初始化
选项B：加锁
选项C：解锁
选项D：销毁
满分答案问询微信：424329

28.当问题规模不变时,随着处理器数量增大,加速比____。
选项A：必然增大
选项B：必然减小
选项C：必然不变
选项D：以上皆错
满分答案问询微信：424329

29.一个Neon寄存器最多存放____个短整型数。
选项A：2
选项B：4
选项C：8
选项D：16
满分答案问询微信：424329

30.动态任务划分相对于静态任务划分的优点是____。
选项A：确保负载均衡
选项B：通信开销低
选项C：实现简单
选项D：计算复杂度低
满分答案问询微信：424329

31.现代CPU中都具有指令乱序执行功能,其目的不包括____。
选项A：消除指令依赖，更充分利用多流水线
选项B：提高cache效率
选项C：改变计算结果
选项D：消除资源冲突
满分答案问询微信：424329

32.在共享内存架构编程中,线程间不能通过____进行通信
选项A：全局变量
选项B：局部变量
选项C：静态变量
选项D：全局堆中变量
满分答案问询微信：424329

33.OpenMP程序和Pthread程序中线程获得自身编号的方式分别是____。
选项A：两者均为创建线程时传递参数
选项B：两者均通过特定API
选项C：前者创建线程时传递参数，后者通过特定API
选项D：前者通过特定API，后者创建线程时传递参数
满分答案问询微信：424329

34.for (i=0; i<16; i+=1) { L = A[i+0] – B[i+0]; D = D + abs(L); },此循环____。
选项A：可完全向量化
选项B：不可向量化
选项C：不确定
选项D：可部分向量化
满分答案问询微信：424329

35.单程序多数据流模式是针对____架构的。
选项A：SISD
选项B：SIMD
选项C：MISD
选项D：MIMD
满分答案问询微信：424329

36.在使用条件变量时,还需配套使用一个____。
选项A：互斥量
选项B：信号量
选项C：障碍
选项D：自旋锁
满分答案问询微信：424329

37.全球500强超算在CPU、网络等硬件上越来越体现出采用____的趋势。
选项A：特殊硬件
选项B：通用硬件
选项C：非公开硬件
选项D：廉价硬件
满分答案问询微信：424329

38.OpenMP中多线程间是一种____关系。
选项A：主从
选项B：分组
选项C：对等
选项D：竞争
满分答案问询微信：424329

39.SSE是____平台的SIMD架构。
选项A：x86
选项B：POWER
选项C：SPARC
选项D：ARM
满分答案问询微信：424329

40.多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是
选项A：读取x存在数据依赖，不能并发进行
选项B：累加顺序被改变，结果是错误的
选项C：加法操作是简单运算，无需同步
选项D：加法操作不是原子操作，需要同步保证数据依赖
满分答案问询微信：424329

41.我们不能通过____指定OpenMP循环划分策略。
选项A：使用编译指示
选项B：设置环境变量
选项C：调用库函数
选项D：采用默认设置
满分答案问询微信：424329

42.以下说法错误的是____。
选项A：全归约的高效算法基于多对多广播的高效算法
选项B：全归约高效算法基于一对多广播的高效算法
选项C：前缀和的高效算法基于多对多广播的高效算法
选项D：前缀和的高效算法中的通信模式于全归约的高效算法相似
满分答案问询微信：424329

43.编写矩阵乘法的Neon程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
选项A：2
选项B：4
选项C：8
选项D：16
满分答案问询微信：424329

44.CUDA的优点不包括____。
选项A：可移植性
选项B：入门简单
选项C：标准的SPMD模式
选项D：不再需要图形API
满分答案问询微信：424329

45.1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X[0]*1.3;G=X[1]*1.8;B=X[2]*1.1; 这两个程序片段哪个进行向量化效率更高?
选项A：1)
选项B：2)
选项C：不确定
选项D：以上皆错
满分答案问询微信：424329

46.编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
选项A：2
选项B：4
选项C：8
选项D：16
满分答案问询微信：424329

47.OpenMP编译指示中说明共享变量是用____子句。
选项A：private
选项B：shared
选项C：schedule
选项D：nowait
满分答案问询微信：424329

48.动态任务划分相对于静态任务划分的缺点是____。
选项A：可能导致负载不均
选项B：通信开销高
选项C：任务粒度粗
选项D：计算复杂度高
满分答案问询微信：424329

49.SSE intrinsics _mm_loadu_pd命令的功能是____。
选项A：对齐向量读取单精度浮点数
选项B：未对齐向量读取单精度浮点数
选项C：对齐向量读取双精度浮点数
选项D：未对齐向量读取双精度浮点数
满分答案问询微信：424329

50.互斥量mutex机制,在任何时刻____进入它保护的区域。
选项A：允许任意数量任意类型的线程
选项B：允许一个读线程任意个写线程
选项C：允许一个写线程任意个读线程
选项D：只允许一个线程
满分答案问询微信：424329

提供优质的教育资源