南开23春学期(高起本:1709-2103、专升本高起专:1903-2103)《并行程序设计》在线作业二
奥鹏南开大学新学期作业参考

南开大学23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《并行程序设计》在线作业
1.在使用信号量之前必须对其进行____。
选项A:初始化
选项B:加锁
选项C:加1
选项D:销毁
正确答案问询微信:424329
2.程序访存更多在____中命中,可最大程度提高性能、降低功耗
选项A:本CPU cache
选项B:本CPU主存
选项C:本结点其他CPU主存
选项D:远端结点主存
正确答案问询微信:424329
3.在条件成立时使用pthread_cond_signal____。
选项A:唤醒等待线程
选项B:解锁互斥量
选项C:加锁互斥量
选项D:唤醒等待线程,该线程重新加锁互斥量
正确答案问询微信:424329
4.传统科学和工程实验相对于计算机并行仿真的劣势不包括____。
选项A:成本太高
选项B:结果不准确
选项C:时间太长
选项D:太危险
正确答案问询微信:424329
5.任务依赖图中顶点权重之和表示____。
选项A:任务数
选项B:任务难度
选项C:串行执行时间
选项D:并行执行时间
正确答案问询微信:424329
6.用pthread_barrier_init初始化障碍,应提供的参数不包括____。
选项A:障碍对象
选项B:障碍初值
选项C:障碍属性
选项D:参与的线程数
正确答案问询微信:424329
7.矩阵乘法问题更适合使用MPI的____编程模型。
选项A:阻塞的
选项B:非阻塞的
选项C:对等的
选项D:主从的
正确答案问询微信:424329
8.当前CPU性能提升已从依赖时钟频率提升转为更多依赖____。
选项A:多核和众核技术
选项B:突破物理局限
选项C:改善散热
选项D:采用新材料
正确答案问询微信:424329
9.CUDA的优点不包括____。
选项A:可移植性
选项B:入门简单
选项C:标准的SPMD模式
选项D:不再需要图形API
正确答案问询微信:424329
10.四位助教帮助教授批改300份试卷,试卷共16道题,每位助教负责批改所有试卷的4道题,这是一种____任务划分方法。
选项A:数据并行
选项B:任务并行
选项C:搜索并行
选项D:预测并行
正确答案问询微信:424329
11.SSE intrinsics _mm_loadu_pd命令的功能是____。
选项A:对齐向量读取单精度浮点数
选项B:未对齐向量读取单精度浮点数
选项C:对齐向量读取双精度浮点数
选项D:未对齐向量读取双精度浮点数
正确答案问询微信:424329
12.两个MPI进程A和B相互收发消息,关于死锁下面说法正确的是____。
选项A:均为先向对方发再从对方收不会产生死锁
选项B:均为先向对方发再从对方收可能产生死锁
选项C:一个先发后收另一个先收后发必然死锁
选项D:一个先发后收另一个先收后发不会产生死锁
正确答案问询微信:424329
13.第一款桌面多核CPU是____发布的。
选项A:Intel
选项B:AMD
选项C:IBM
选项D:SUN
正确答案问询微信:424329
14.定期评选全球计算能力最强的超级计算机的国际组织是____。
选项A:top500
选项B:green500
选项C:graph500
选项D:super500
正确答案问询微信:424329
15.四位助教帮助教授批改300份试卷,试卷共16道题,每位助教负责批改75份试卷,这是一种____任务划分方法。
选项A:数据并行
选项B:任务并行
选项C:搜索并行
选项D:预测并行
正确答案问询微信:424329
16.信号量是一种____同步机制。
选项A:一元状态
选项B:二元状态
选项C:多元状态
选项D:以上皆错
正确答案问询微信:424329
17.MPI原址收发各一条消息的API是_____。
选项A:MPI_Sendrecv
选项B:MPI_Send
选项C:MPI_Recv
选项D:MPI_Sendrecv_Replace
正确答案问询微信:424329
18.有大量分支指令的程序不适合下面哪种体系结构上进行并行化?
选项A:SISD
选项B:SIMD
选项C:SPMD
选项D:MIMD
正确答案问询微信:424329
19.以下超级计算机中,____不是SIMD架构。
选项A:CDCSTAR-100
选项B:757
选项C:银河
选项D:天河1号
正确答案问询微信:424329
20.我们在小规模系统和小规模输入下测试了几个并行算法,应选择哪个应用在实际系统中?
选项A:选择性能测试并行时间最少者
选项B:选择性能测试加速比最大者
选项C:选择性能测试效率最高者
选项D:应结合可扩展性分析做出选择
正确答案问询微信:424329
21.动态线程编程模式的缺点是____。
选项A:线程管理开销高
选项B:系统资源利用率低
选项C:线程任务分配困难
选项D:线程通信效率低
正确答案问询微信:424329
22.SSE intrinsics _mm_load_sd命令的功能是____。
选项A:对齐标量读取单精度浮点数
选项B:未对齐标量读取单精度浮点数
选项C:对齐标量读取双精度浮点数
选项D:未对齐标量读取双精度浮点数
正确答案问询微信:424329
23.将寄存器设置为4个单精度浮点数0.0的SSE intrinsics指令是____。
选项A:_mm_set_ps
选项B:_mm_set1_ss
选项C:_mm_setzero_ss
选项D:_mm_setzero_ps
正确答案问询微信:424329
24.CUDA线程层次中不包括____。
选项A:Kernel
选项B:Grid
选项C:Block
选项D:Thread
正确答案问询微信:424329
25.动态任务划分相对于静态任务划分的缺点是____。
选项A:可能导致负载不均
选项B:通信开销高
选项C:任务粒度粗
选项D:计算复杂度高
正确答案问询微信:424329
26.下面哪个问题相对而言更不适合进行数据并行____。
选项A:求和
选项B:排序
选项C:向量加法
选项D:矩阵乘法
正确答案问询微信:424329
27.并行算法设计所做的事情不包括____。
选项A:分解计算工作分配给多个处理器
选项B:保持数据依赖保证结果正确
选项C:确保不能产生重复计算
选项D:尽量降低通信等额外开销
正确答案问询微信:424329
28.一个Neon寄存器最多存放____个单精度浮点数。
选项A:2
选项B:4
选项C:8
选项D:16
正确答案问询微信:424329
29.采用划分子矩阵(大小b*b)的方法实现n*n矩阵乘法,一次乘—加运算涉及的子矩阵可全部放入cache,则整个计算过程中,两个输入矩阵的每个元素会产生____次访存。
选项A:n
选项B:t
选项C:n-t
选项D:n/t
正确答案问询微信:424329
30.SSE intrinsics _mm_store_ss命令的功能是____。
选项A:对齐向量存单精度浮点数
选项B:未对齐向量存双精度浮点数
选项C:对齐标量存单精度浮点数
选项D:未对齐标量存双精度浮点数
正确答案问询微信:424329
31.并行算法加速比的定义是____。
选项A:并行时间/串行时间
选项B:串行时间/并行时间
选项C:串行时间-并行时间
选项D:(串行时间-并行时间)/并行时间
正确答案问询微信:424329
32.关于pthread_create函数,下列说法错误的是____。
选项A:它返回是线程创建成功与否的错误码
选项B:线程属性参数使用空指针表示使用默认参数
选项C:它成功创建线程后立刻执行线程函数等待其结束后返回
选项D:可通过它将参数传递给线程函数
正确答案问询微信:424329
33.利用cache line一次读取多个数据字的机制优化程序访存性能,其机理是____。
选项A:降低了访存延迟
选项B:隐藏了访存延迟
选项C:利用了cache空间局部性
选项D:利用了cache时间局部性
正确答案问询微信:424329
34.线程主动退出不能采用____。
选项A:return语句
选项B:pthread_exit函数
选项C:pthread_cancel函数
选项D:exit调用
正确答案问询微信:424329
35.对矩阵乘法串行程序的主体三重循环,我们选择最内层循环进行向量化的原因是____。
选项A:它最后执行
选项B:外层循环中没有计算操作
选项C:是随意选择的
选项D:它的连续循环步是对不同元素进行相同运算
正确答案问询微信:424329
36.MMX有____个专用寄存器。
选项A:4
选项B:8
选项C:16
选项D:32
正确答案问询微信:424329
37.并行计算的新兴应用领域不包括____。
选项A:制药
选项B:数字媒体
选项C:国防
选项D:游戏
正确答案问询微信:424329
38.通常忙等待方法的性能要比互斥量方法的性能____。
奥鹏南开大学新学期作业参考选项A:更高
选项B:更低
选项C:高低不确定
选项D:以上皆错
正确答案问询微信:424329
39.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
选项A:正确的
选项B:错误的
正确答案问询微信:424329
40.关于互斥量mutex,下面说法错误的是____。
选项A:它将保护区域内的运算变成原子操作
选项B:任何时刻只允许一个线程进入保护区域
选项C:保险起见,对并发操作都应用互斥量保护
选项D:互斥量加锁、解锁开销远大于一般运算
正确答案问询微信:424329
41.对于效率E,下面描述错误的是____。
选项A:理想并行E=1
选项B:总是在0~1之间
选项C:可能>1
选项D:可能随着处理器数量增大趋向于0
正确答案问询微信:424329
42.SSE intrinsics _mm_store_sd命令的功能是____。
选项A:对齐向量存单精度浮点数
选项B:未对齐向量存单精度浮点数
选项C:对齐标量存双精度浮点数
选项D:未对齐标量存双精度浮点数
正确答案问询微信:424329
43.MPI基本原语不包括____。
选项A:MPI_Barrier
选项B:MPI_Comm_rank
选项C:MPI_Comm_size
选项D:MPI_Init
正确答案问询微信:424329
44.执行pthread_rwlock_rdlock时,____的情况下线程进入阻塞。
选项A:已有一个线程上了读锁
选项B:已有一个线程上了写锁
选项C:已有多个线程上了读锁
选项D:已有多个线程上了写锁
正确答案问询微信:424329
45.主线程通过____函数获取特定线程的返回结果。
选项A:pthread_create
选项B:pthread_join
选项C:pthread_cancel
选项D:pthread_get
正确答案问询微信:424329
46.采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。
选项A:按编号顺序依次从从进程接收结果
选项B:按编号逆序依次从从进程接收结果
选项C:按编号顺序、逆序交替从从进程接收结果
选项D:使用MPI_ANY_SOURCE和MPI_ANY_TAG
正确答案问询微信:424329
47.在使用条件变量之前必须对其进行____。
选项A:初始化
选项B:加锁
选项C:解锁
选项D:销毁
正确答案问询微信:424329
48.OpenMP最常见的编程方式是寻找串行程序中____结构进行并行化。
选项A:赋值语句
选项B:循环语句
选项C:递归
选项D:输出语句
正确答案问询微信:424329
49.对同一个问题的两个任务依赖图G1和G2,以下哪个条件不能表明G1优于G2____。
选项A:G1顶点权重之和小于G2
选项B:G1平均并发度大于G2
选项C:G1关键路径长度小于G2
选项D:G1顶点权重之和除以关键路径长度大于G2
正确答案问询微信:424329
50.在128位的SIMD寄存器中,我们不能保存____。
选项A:16个8位整数
选项B:8个16位短整型
选项C:4个32位整型
选项D:16个字符的字符串
正确答案问询微信:424329