南开大学23秋学期《并行程序设计》在线作业二
奥鹏南开大学23年秋季新学期作业参考
23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《并行程序设计》在线作业-00002
将寄存器设置为4个给定单精度浮点数的SSE intrinsics指令是____。
A:_mm_set_ps
B:_mm_set1_ss
C:_mm_setzero_ss
D:_mm_setzero_ps
正确答案问询微信奥鹏南开大学23年秋季新学期作业参考:424329
采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是____。
A:更不利于负载均衡
B:增大了通信开销
C:提高了计算次数
D:增加了从进程空闲
正确答案问询微信:424329
FORTRAN语言存储二维数组采取____。
A:行主次序存储
B:列主次序存储
C:交错式存储
D:对角线存储
正确答案问询微信:424329
下面矩阵运算中,哪个进行简单的数据并行效果不佳____。
A:矩阵求和
B:矩阵相乘
C:矩阵向量相乘
D:高斯消去
正确答案问询微信:424329
对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
A:正确的
B:错误的
正确答案问询微信:424329
为缓解存储和CPU之间的性能差距,常见的技术手段不包括____。
A:利用cache降低访存延迟
B:利用多线程隐藏访存延迟
C:利用预取隐藏访存延迟
D:采用大容量内存提高访问速度
正确答案问询微信:424329
对同一个问题的两个任务依赖图G1和G2,以下哪个条件不能表明G1优于G2____。
A:G1顶点权重之和小于G2
B:G1平均并发度大于G2
C:G1关键路径长度小于G2
D:G1顶点权重之和除以关键路径长度大于G2
正确答案问询微信:424329
编写n个数求和的OpenMP程序,最高效的方法是____。
A:多线程直接并发累加到共享变量
B:将累加操作设置为临界区
C:在累加操作前设置障碍
D:采用归约指令
正确答案问询微信:424329
对双精度浮点计算,AVX最高实现____路并行。
A:2
B:4
C:8
D:16
正确答案问询微信:424329
动态任务划分相对于静态任务划分的缺点是____。
A:可能导致负载不均
B:通信开销高
C:任务粒度粗
D:计算复杂度高
正确答案问询微信:424329
对矩阵乘法串行程序的主体三重循环,我们选择最内层循环进行向量化的原因是____。
A:它最后执行
B:外层循环中没有计算操作
C:是随意选择的
D:它的连续循环步是对不同元素进行相同运算
正确答案问询微信:424329
在使用信号量之后必须对其进行____。
A:初始化
B:解锁
C:减1
D:销毁
正确答案问询微信:424329
CUDA共享内存是由____共享。
A:Grid中所有线程
B:一个Block中所有线程
C:一个Warp中所有线程
D:GPU中所有线程
正确答案问询微信:424329
SSE intrinsics _mm_store_sd命令的功能是____。
A:对齐向量存单精度浮点数
B:未对齐向量存单精度浮点数
C:对齐标量存双精度浮点数
D:未对齐标量存双精度浮点数
正确答案问询微信:424329
链表数据结构的查找、插入、删除等操作,既有对链表的读也有对链表的写,对此,采用互斥量加解锁每个节点的同步机制相比加解锁整个链表的方式的缺点是____。
A:粒度太粗,节点读写一致性不能保证
B:粒度太粗,线程不必要的等待
C:粒度太细,加解锁开销大
D:粒度太细,总体读写一致性不能保证
正确答案问询微信:424329
主线程创建了4个线程,它们打印各自的线程号(0-3),未使用任何同步,则两次执行程序的输出顺序____。
A:必然都是0 1 2 3
B:必然不同
C:可能不同
D:必然相同但不一定是0 1 2 3
正确答案问询微信:424329
OpenMP归约指令采用的是一种____算法。
A:分治
B:贪心
C:动态规划
D:排序
正确答案问询微信:424329
SIMD架构未见于_____中。
A:多媒体扩展
B:图形和游戏处理器
C:计算机集群
D:协处理器
正确答案问询微信:424329
程序访存更多在____中命中,可最大程度提高性能、降低功耗
A:本CPU cache
B:本CPU主存
C:本结点其他CPU主存
D:远端结点主存
正确答案问询微信:424329
并行计算的新兴应用领域不包括____。
A:制药
B:数字媒体
C:国防
D:游戏
正确答案问询微信:424329
对于MPI中的点对点通信,下面错误的说法是____。
A:发送方的目的地址必须是接受方的进程编号
B:接受方的源地址可以不是发送方的进程编号
C:发送方和接受方的消息标签必须一致
D:接受方的消息标签可以是MPI_ANY_TAG
正确答案问询微信:424329
SIMD并行架构的优点不包括____。
A:辅助提供更大并发度
B:设计简单
C:编程简单
D:更小的芯片尺寸
正确答案问询微信:424329
对这样的循环for (i=0; i<100; i+=1) A[i+0] = A[i+0] + B[i+0]; 进行向量化,基本技术手段是____。
A:循环划分
B:循环消除
C:循环展开
D:以上皆错
正确答案问询微信:424329
OpenMP编译指示中说明私有变量是用____子句。
A:private
B:shared
C:schedule
D:nowait
正确答案问询微信:424329
定期评选全球计算能力最强的超级计算机的国际组织是____。
A:top500
B:green500
C:graph500
D:super500
正确答案问询微信:424329
MPI收发各一条消息的API是_____。
A:MPI_Sendrecv
B:MPI_Send
C:MPI_Recv
D:MPI_Replace
正确答案问询微信:424329
SSE intrinsics _mm_load_sd命令的功能是____。
A:对齐标量读取单精度浮点数
B:未对齐标量读取单精度浮点数
C:对齐标量读取双精度浮点数
D:未对齐标量读取双精度浮点数
正确答案问询微信:424329
一个函数是“线程安全的”,其含义是该函数____。
A:多线程执行能抵御网络攻击
B:多线程执行能保护用户隐私数据
C:多线程执行结果也是正确的
D:以上皆错
正确答案问询微信:424329
信号量是一种____同步机制。
A:一元状态
B:二元状态
C:多元状态
D:以上皆错
正确答案问询微信:424329
AVX有____个专用寄存器。
A:4
B:8
C:16
D:34
正确答案问询微信:424329
在MPI中从/向虚拟进程收/发消息的实际效果是____。
A:与通信域根进程通信
B:与0号进程通信
C:像什么都没发生一样
D:以上皆错
正确答案问询微信:424329
n个模块的总线,并发通信能力为____。
A:1
B:O(logn)
C:O(n)
D:O(nlogn)
正确答案问询微信:424329
对下面程序,说法正确的是
# pragma omp parallel for num_threads(thread_count)
reduction(+:sum)
for (k = 1; k <= n; k++) {
sum += factor/(2*k-1);
factor = -factor;
}
A:破坏了数据依赖
B:未破坏数据依赖
C:取决于变量声明
D:比临界区方式性能差
正确答案问询微信:424329
SSE intrinsics _mm_load_ss命令的功能是____。
A:对齐向量读取单精度浮点数
B:未对齐向量读取单精度浮点数
C:对齐标量读取单精度浮点数
D:未对齐标量读取单精度浮点数
正确答案问询微信:424329
对单精度浮点计算,MMX最高实现____路并行。
A:2
B:4
C:8
D:16
正确答案问询微信:424329
静态任务划分相对于动态任务划分的缺点是____。
A:可能导致负载不均
B:通信开销高
C:计算复复杂度高
D:任务粒度粗
正确答案问询微信:424329
动态线程编程模式的优点是____。
A:线程创建开销低
B:线程管理开销低
C:线程终止开销低
D:系统资源利用率高
正确答案问询微信:424329
造成超线性加速比的原因包括____。
A:进程间大量通信
B:并行算法导致额外计算
C:并行计算工作量显著小于串行计算
D:问题求解包含不可并行化部分
正确答案问询微信:424329
编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A:2
B:4
C:8
D:16
正确答案问询微信:424329
编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A:2
B:4
C:8
D:16
正确答案问询微信:424329
实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是____。
A:omp parallel
B:omp barrier
C:omp critical
D:omp reduce
正确答案问询微信:424329
____执行pthread_sem_post操作,当前线程会唤醒阻塞线程。
A:当信号量已加锁时
B:当信号量为0时
C:当信号量已超过阈值时
D:当信号量已销毁时
正确答案问询微信:424329
MPI程序中发送和接收消息的两个进程必须____。
A:在同一个网段中
B:连接在同一个路由器上
C:在同一个通信域中
D:以上皆错
正确答案问询微信:424329
SSE intrinsics _mm_storeu_ps命令的功能是____。
A:对齐标量存单精度浮点数
B:未对齐向量存单精度浮点数
C:对齐标量存双精度浮点数
D:未对齐向量存双精度浮点数
正确答案问询微信:424329
两个n*n的矩阵相乘,将所有n^3个乘法计算划分给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一种划分____的数据并行。
A:输入数据
B:中间结果
C:输出数据
D:临时数据
正确答案问询微信:424329
超级计算机制造越来越关注的一个新的指标是____。
A:计算能力
B:存储能力
C:占地面积
D:功耗
正确答案问询微信:424329
关于互斥量mutex,下面说法错误的是____。
A:它将保护区域内的运算变成原子操作
B:任何时刻只允许一个线程进入保护区域
C:保险起见,对并发操作都应用互斥量保护
D:互斥量加锁、解锁开销远大于一般运算
正确答案问询微信:424329
我国最早夺得全球超级计算机计算能力冠军的是____。
A:天河1号
B:天河1A
C:天河2号
D:神威.太湖之光
正确答案问询微信:424329
我们不能通过____指定OpenMP循环划分策略。
A:使用编译指示
B:设置环境变量
C:调用库函数
D:采用默认设置
正确答案问询微信:424329
关于MPI_recv对源地址的标识,下列说法正确的是____。
A:只能使用进程编号
B:可以使用IP地址
C:可以使用IPV6地址
D:可以使用MPI_ANY_SOURCE
正确答案问询微信:424329