南开23春学期（高起本：1709-2103、专升本高起专：1903-2103）《并行程序设计》在线作业三

奥鹏南开大学新学期作业参考

南开大学23春学期（高起本：1709-2103、专升本/高起专：1903-2103）《并行程序设计》在线作业

1.pthread_sem_wait是对信号量进行____操作。
选项A：加锁
选项B：解锁
选项C：加1
选项D：减1
正确答案问询微信：424329

2.一个SSE寄存器可容纳____个短整型数。
选项A：2
选项B：4
选项C：8
选项D：16
正确答案问询微信：424329

3.执行pthread_rwlock_rdlock时,____的情况下线程进入阻塞。
选项A：已有一个线程上了读锁
选项B：已有一个线程上了写锁
选项C：已有多个线程上了读锁
选项D：已有多个线程上了写锁
正确答案问询微信：424329

4.对单精度浮点计算,AVX最高实现____路并行。
选项A：2
选项B：4
选项C：8
选项D：16
正确答案问询微信：424329

5.在条件不成立时,使用pthread_cond_wait____。
选项A：令线程阻塞
选项B：解锁互斥量
选项C：解锁互斥量然后令线程阻塞
选项D：加锁互斥量
正确答案问询微信：424329

6.推动GPU应用于通用高性能计算爆发式增长的开发工具是____。
选项A：OpenGL
选项B：OpenCL
选项C：DirectX
选项D：CUDA
正确答案问询微信：424329

7.pthread_join的第二个参数的作用是____。
选项A：设置指定线程属性
选项B：获取指定线程属性
选项C：向指定线程传递参数
选项D：获取指定线程函数返回结果
正确答案问询微信：424329

8.MPI基本原语不包括____。
选项A：MPI_Barrier
选项B：MPI_Comm_rank
选项C：MPI_Comm_size
选项D：MPI_Init
正确答案问询微信：424329

9.我们不能通过____指定OpenMP循环划分策略。
选项A：使用编译指示
选项B：设置环境变量
选项C：调用库函数
选项D：采用默认设置
正确答案问询微信：424329

10.CUDA生态环境的特点不包括____。
选项A：支持多种显卡架构
选项B：支持CPU、GPU自动混合并行
选项C：支持多种编程语言
选项D：支持多领域的库
正确答案问询微信：424329

11.华尔街是世界上超级计算机最密集的区域之一,原因是____。
选项A：金融巨头支付得起
选项B：与超算制造商有良好合作
选项C：海量交易需要很高安全性
选项D：海量交易处理需要并行计算
正确答案问询微信奥鹏南开大学新学期作业参考：424329

12.对下面程序,说法正确的是
# pragma omp parallel for num_threads(thread_count)
reduction(+:sum)
for (k = 1; k 1
正确答案问询微信：424329

13.n个节点的二维mesh构造成本为____。
选项A：O(logn)
选项B：O(sqrt(n))
选项C：O(n)
选项D：O(nlogn)
正确答案问询微信：424329

14.OpenMP的缺点不包括____。
选项A：常见并行结构的表达并不总可行
选项B：局部性处理不易
选项C：不易编写多核单核通用程序
选项D：性能控制不易
正确答案问询微信：424329

15.对于加速比S和处理器数量p,下列说法正确的是____。
选项A：有可能S>p
选项B：必然S<p
选项C：不可能S=p
选项D：两者无关联
正确答案问询微信：424329

16.“提升时钟频率”方式提高CPU性能的限制因素不包括____。
选项A：物理制造局限
选项B：功耗问题
选项C：散热问题
选项D：软件设计问题
正确答案问询微信：424329

17.OpenMP的优点不包括____。
选项A：从头编写并行程序很自然
选项B：串行程序并行化简单
选项C：不必关心低层细节
选项D：可移植、可扩展
正确答案问询微信：424329

18.全球500强超算越来越体现出依赖____提供强大计算能力的趋势。
选项A：单核CPU
选项B：多核CPU
选项C：FPGA
选项D：众核协处理器
正确答案问询微信：424329

19.SSE intrinsics _mm_hadd_ps命令的功能是____。
选项A：寄存器间单精度浮点数向量加法
选项B：寄存器间双精度浮点数向量加法
选项C：寄存器内单精度浮点数加法
选项D：寄存器内双精度浮点数加法
正确答案问询微信：424329

20.OpenMP不能实现的是____。
选项A：负责创建和管理线程
选项B：隐藏栈管理
选项C：提供同步机制
选项D：自动并行化
正确答案问询微信：424329

21.两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_____达到更高的cache命中率。
选项A：时间局部性
选项B：空间局部性
选项C：计算局部性
选项D：混合局部性
正确答案问询微信：424329

22.SSE运算指令中未提供____指令。
选项A：算术运算
选项B：矩阵运算
选项C：逻辑运算
选项D：比较运算
正确答案问询微信：424329

23.C/C++语言存储二维数组采取____。
选项A：行主次序存储
选项B：列主次序存储
选项C：交错式存储
选项D：对角线存储
正确答案问询微信：424329

24.SSE intrinsics _mm_store_ss命令的功能是____。
选项A：对齐向量存单精度浮点数
选项B：未对齐向量存双精度浮点数
选项C：对齐标量存单精度浮点数
选项D：未对齐标量存双精度浮点数
正确答案问询微信：424329

25.n个节点的线性阵列构造成本为____。
选项A：O(logn)
选项B：O(sqrt(n))
选项C：O(n)
选项D：O(nlogn)
正确答案问询微信：424329

26.定期评选全球计算能力最强的超级计算机的国际组织是____。
选项A：top500
选项B：green500
选项C：graph500
选项D：super500
正确答案问询微信：424329

27.对于搜索分解,下面哪个说法是错误的_____。
选项A：所有子树搜索任务都必须全部完成
选项B：工作量可能大于串行计算
选项C：工作量可能小于串行计算
选项D：可能产生超线性加速比
正确答案问询微信：424329

28.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
选项A：正确的
选项B：错误的
正确答案问询微信：424329

29.主线程通过____函数获取特定线程的返回结果。
选项A：pthread_create
选项B：pthread_join
选项C：pthread_cancel
选项D：pthread_get
正确答案问询微信：424329

30.静态任务划分相对于动态任务划分的缺点是____。
选项A：可能导致负载不均
选项B：通信开销高
选项C：计算复复杂度高
选项D：任务粒度粗
正确答案问询微信：424329

31.多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是
选项A：读取x存在数据依赖，不能并发进行
选项B：累加顺序被改变，结果是错误的
选项C：加法操作是简单运算，无需同步
选项D：加法操作不是原子操作，需要同步保证数据依赖
正确答案问询微信：424329

32.GPU相对于其他众核产品的优势不包括____。
选项A：平台普及
选项B：有CUDA这样易学的开发工具
选项C：性价比高
选项D：由英伟达公司一家把控
正确答案问询微信：424329

33.SSE数据移动指令分类不包括____。
选项A：对齐传输
选项B：未对齐传输
选项C：标量传输
选项D：缓存传输
正确答案问询微信：424329

提供优质的教育资源