南开大学23秋学期《并行程序设计》在线作业三
奥鹏南开大学23年秋季新学期作业参考
23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《并行程序设计》在线作业-00003
采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是____。
A:更不利于负载均衡
B:增大了通信开销
C:提高了计算次数
D:增加了从进程空闲
正确答案问询微信:424329
MPI基本原语不包括____。
A:MPI_Barrier
B:MPI_Comm_rank
C:MPI_Comm_size
D:MPI_Init
正确答案问询微信:424329
限制CPU内流水线深度的因素包括_____。
A:指令复杂程度
B:分支预测性能
C:CPU核心数
D:CPU cache大小
正确答案问询微信:424329
n个节点的二维mesh构造成本为____。
A:O(logn)
B:O(sqrt(n))
C:O(n)
D:O(nlogn)
正确答案问询微信:424329
单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.
A:等于8
B:小于8
C:4到8之间
D:等于4
正确答案问询微信:424329
并行计算的新兴应用领域不包括____。
A:制药
B:数字媒体
C:国防
D:游戏
正确答案问询微信:424329
OpenMP的循环调度策略不会影响算法的____。
A:负载均衡
B:调度开销
C:计算总量
D:数据局部性
正确答案问询微信:424329
将t个线程的局部结果汇总,可采用递归分解并行进行,即,两两汇总,中间结果继续两两汇总,直到剩下唯一的最终结果,其时间复杂度为____。
A:(1)
B:(logt)
C:(t)
D:(tlogt)
正确答案问询微信:424329
SSE intrinsics _mm_store_pd命令的功能是____。
A:对齐向量存单精度浮点数
B:未对齐标量存单精度浮点数
C:对齐向量存双精度浮点数
D:未对齐标量存双精度浮点数
正确答案问询微信:424329
执行pthread_rwlock_rdlock时,____的情况下线程进入阻塞。
A:已有一个线程上了读锁
B:已有一个线程上了写锁
C:已有多个线程上了读锁
D:已有多个线程上了写锁
正确答案奥鹏南开大学23年秋季新学期作业参考问询微信:424329
一个程序用pthread_create创建了4个线程,此时系统中属于这个程序的共有____线程。
A:4
B:5
C:6
D:7
正确答案问询微信:424329
编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括____。
A:创建和管理线程代码
B:循环划分给线程的代码
C:找出数据依赖的代码
D:线程同步的代码
正确答案问询微信:424329
n*n的两个矩阵相乘,问题规模为____。
A:n
B:n^2
C:2n^2
D:n^3
正确答案问询微信:424329
SSE intrinsics _mm_storeu_ps命令的功能是____。
A:对齐标量存单精度浮点数
B:未对齐向量存单精度浮点数
C:对齐标量存双精度浮点数
D:未对齐向量存双精度浮点数
正确答案问询微信:424329
在使用互斥量之前必须对其进行____。
A:初始化
B:加锁
C:解锁
D:销毁
正确答案问询微信:424329
CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为
A:8MFlops
B:125MFlops
C:1GFlops
D:4GFlops
正确答案问询微信:424329
全球500强超算越来越体现出依赖____提供强大计算能力的趋势。
A:单核CPU
B:多核CPU
C:FPGA
D:众核协处理器
正确答案问询微信:424329
for (i=2; ip
正确答案问询微信:424329
对划分输入数据的策略,下面说法错误的是____。
A:当输出数据很少时,需划分输入数据
B:当输出数据存在依赖时,需划分输入数据
C:通常最后需要汇总结果
D:由于不是直接划分输出数据,性能会很差
正确答案问询微信:424329
n个元素排序问题,如果只能通过元素比较交换构造算法,则n个处理器的并行排序算法达到____的运行时间才是代价最优的。
A:O(logn)
B:O(n)
C:O(nlogn)
D:O(n^2)
正确答案问询微信:424329
主线程要求从线程退出应采用____。
A:pthread_create
B:pthread_exit
C:pthread_quit
D:pthread_cancel
正确答案问询微信:424329
编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A:2
B:4
C:8
D:16
正确答案问询微信:424329
MPI默认点对点通信模式是____。
A:阻塞的
B:非阻塞的
C:对等的
D:主从的
正确答案问询微信:424329
16步循环,4个线程,循环0-1和8-9、2-3和10-11、4-5和12-13、6-7和14-15分别分配给线程0、1、2、3,这是OpenMP的____划分策略。
A:static
B:fixed
C:dynamic
D:guided
正确答案问询微信:424329
在使用条件变量之后必须对其进行____。
A:初始化
B:加锁
C:解锁
D:销毁
正确答案问询微信:424329
利用cache line一次读取多个数据字的机制优化程序访存性能,其机理是____。
A:降低了访存延迟
B:隐藏了访存延迟
C:利用了cache空间局部性
D:利用了cache时间局部性
正确答案问询微信:424329
用pthread_barrier_init初始化障碍,应提供的参数不包括____。
A:障碍对象
B:障碍初值
C:障碍属性
D:参与的线程数
正确答案问询微信:424329