南开23春学期(高起本:1709-2103、专升本高起专:1903-2103)《并行程序设计》在线作业三

奥鹏南开大学新学期作业参考

南开23春学期(高起本:1709-2103、专升本高起专:1903-2103)《并行程序设计》在线作业三插图

南开大学23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《并行程序设计》在线作业

1.pthread_sem_wait是对信号量进行____操作。
选项A:加锁
选项B:解锁
选项C:加1
选项D:减1
正确答案问询微信:424329

2.一个SSE寄存器可容纳____个短整型数。
选项A:2
选项B:4
选项C:8
选项D:16
正确答案问询微信:424329

3.执行pthread_rwlock_rdlock时,____的情况下线程进入阻塞。
选项A:已有一个线程上了读锁
选项B:已有一个线程上了写锁
选项C:已有多个线程上了读锁
选项D:已有多个线程上了写锁
正确答案问询微信:424329

4.对单精度浮点计算,AVX最高实现____路并行。
选项A:2
选项B:4
选项C:8
选项D:16
正确答案问询微信:424329

5.在条件不成立时,使用pthread_cond_wait____。
选项A:令线程阻塞
选项B:解锁互斥量
选项C:解锁互斥量然后令线程阻塞
选项D:加锁互斥量
正确答案问询微信:424329

6.推动GPU应用于通用高性能计算爆发式增长的开发工具是____。
选项A:OpenGL
选项B:OpenCL
选项C:DirectX
选项D:CUDA
正确答案问询微信:424329

7.pthread_join的第二个参数的作用是____。
选项A:设置指定线程属性
选项B:获取指定线程属性
选项C:向指定线程传递参数
选项D:获取指定线程函数返回结果
正确答案问询微信:424329

8.MPI基本原语不包括____。
选项A:MPI_Barrier
选项B:MPI_Comm_rank
选项C:MPI_Comm_size
选项D:MPI_Init
正确答案问询微信:424329

9.我们不能通过____指定OpenMP循环划分策略。
选项A:使用编译指示
选项B:设置环境变量
选项C:调用库函数
选项D:采用默认设置
正确答案问询微信:424329

10.CUDA生态环境的特点不包括____。
选项A:支持多种显卡架构
选项B:支持CPU、GPU自动混合并行
选项C:支持多种编程语言
选项D:支持多领域的库
正确答案问询微信:424329

11.华尔街是世界上超级计算机最密集的区域之一,原因是____。
选项A:金融巨头支付得起
选项B:与超算制造商有良好合作
选项C:海量交易需要很高安全性
选项D:海量交易处理需要并行计算
正确答案问询微信奥鹏南开大学新学期作业参考:424329

12.对下面程序,说法正确的是
# pragma omp parallel for num_threads(thread_count)
reduction(+:sum)
for (k = 1; k 1
正确答案问询微信:424329

13.n个节点的二维mesh构造成本为____。
选项A:O(logn)
选项B:O(sqrt(n))
选项C:O(n)
选项D:O(nlogn)
正确答案问询微信:424329

14.OpenMP的缺点不包括____。
选项A:常见并行结构的表达并不总可行
选项B:局部性处理不易
选项C:不易编写多核单核通用程序
选项D:性能控制不易
正确答案问询微信:424329

15.对于加速比S和处理器数量p,下列说法正确的是____。
选项A:有可能S>p
选项B:必然S<p
选项C:不可能S=p
选项D:两者无关联
正确答案问询微信:424329

16.“提升时钟频率”方式提高CPU性能的限制因素不包括____。
选项A:物理制造局限
选项B:功耗问题
选项C:散热问题
选项D:软件设计问题
正确答案问询微信:424329

17.OpenMP的优点不包括____。
选项A:从头编写并行程序很自然
选项B:串行程序并行化简单
选项C:不必关心低层细节
选项D:可移植、可扩展
正确答案问询微信:424329

18.全球500强超算越来越体现出依赖____提供强大计算能力的趋势。
选项A:单核CPU
选项B:多核CPU
选项C:FPGA
选项D:众核协处理器
正确答案问询微信:424329

19.SSE intrinsics _mm_hadd_ps命令的功能是____。
选项A:寄存器间单精度浮点数向量加法
选项B:寄存器间双精度浮点数向量加法
选项C:寄存器内单精度浮点数加法
选项D:寄存器内双精度浮点数加法
正确答案问询微信:424329

20.OpenMP不能实现的是____。
选项A:负责创建和管理线程
选项B:隐藏栈管理
选项C:提供同步机制
选项D:自动并行化
正确答案问询微信:424329

21.两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_____达到更高的cache命中率。
选项A:时间局部性
选项B:空间局部性
选项C:计算局部性
选项D:混合局部性
正确答案问询微信:424329

22.SSE运算指令中未提供____指令。
选项A:算术运算
选项B:矩阵运算
选项C:逻辑运算
选项D:比较运算
正确答案问询微信:424329

23.C/C++语言存储二维数组采取____。
选项A:行主次序存储
选项B:列主次序存储
选项C:交错式存储
选项D:对角线存储
正确答案问询微信:424329

24.SSE intrinsics _mm_store_ss命令的功能是____。
选项A:对齐向量存单精度浮点数
选项B:未对齐向量存双精度浮点数
选项C:对齐标量存单精度浮点数
选项D:未对齐标量存双精度浮点数
正确答案问询微信:424329

25.n个节点的线性阵列构造成本为____。
选项A:O(logn)
选项B:O(sqrt(n))
选项C:O(n)
选项D:O(nlogn)
正确答案问询微信:424329

26.定期评选全球计算能力最强的超级计算机的国际组织是____。
选项A:top500
选项B:green500
选项C:graph500
选项D:super500
正确答案问询微信:424329

27.对于搜索分解,下面哪个说法是错误的_____。
选项A:所有子树搜索任务都必须全部完成
选项B:工作量可能大于串行计算
选项C:工作量可能小于串行计算
选项D:可能产生超线性加速比
正确答案问询微信:424329

28.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
选项A:正确的
选项B:错误的
正确答案问询微信:424329

29.主线程通过____函数获取特定线程的返回结果。
选项A:pthread_create
选项B:pthread_join
选项C:pthread_cancel
选项D:pthread_get
正确答案问询微信:424329

30.静态任务划分相对于动态任务划分的缺点是____。
选项A:可能导致负载不均
选项B:通信开销高
选项C:计算复复杂度高
选项D:任务粒度粗
正确答案问询微信:424329

31.多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是
选项A:读取x存在数据依赖,不能并发进行
选项B:累加顺序被改变,结果是错误的
选项C:加法操作是简单运算,无需同步
选项D:加法操作不是原子操作,需要同步保证数据依赖
正确答案问询微信:424329

32.GPU相对于其他众核产品的优势不包括____。
选项A:平台普及
选项B:有CUDA这样易学的开发工具
选项C:性价比高
选项D:由英伟达公司一家把控
正确答案问询微信:424329

33.SSE数据移动指令分类不包括____。
选项A:对齐传输
选项B:未对齐传输
选项C:标量传输
选项D:缓存传输
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网