南开大学23秋学期《并行程序设计》在线作业一
奥鹏南开大学23年秋季新学期作业参考
23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《并行程序设计》在线作业-00001
SSE intrinsics _mm_storeu_ps命令的功能是____。
A:对齐标量存单精度浮点数
B:未对齐向量存单精度浮点数
C:对齐标量存双精度浮点数
D:未对齐向量存双精度浮点数
正确答案问询微信:424329
OpenMP相对于Pthread的优点是____。
A:功能更强大
B:可达更高并发度
C:可降低通信开销
D:由编译器生成线程创建和管理代码,更简单
正确答案问询微信:424329
关于OpenMP循环并行程序的编写,下列说法中正确的是____。
A:程序员需要编写线程创建和管理代码
B:程序员需要编写循环划分代码
C:程序员需要编写调度策略代码
D:程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么
正确答案问询微信:424329
OpenMP是___架构下的一种编程工具。
A:SIMD
B:MISD
C:共享内存
D:分布式内存
正确答案问询微信:424329
CUDA程序中不包括____。
A:host代码
B:device代码
C:kernel
D:图形渲染代码
正确答案问询微信:424329
pthread_rwlock_rdlock是对读写锁进行____操作。
A:加锁
B:解锁
C:加读琐
D:加写锁
正确答案问询微信:424329
将寄存器设置为4个给定单精度浮点数的SSE intrinsics指令是____。
A:_mm_set_ps
B:_mm_set1_ss
C:_mm_setzero_ss
D:_mm_setzero_ps
正确答案问询微信:424329
MPI中表示虚拟进程的____。
A:MPI_ANY_SOURCE
B:MPI_PROC_NULL
C:MPI_PROC_ANY
D:MPI_ANY_TAG
正确答案问询微信:424329
采用搜索分解设计15数码问题的并行算法,不包含下面哪个步骤____。
A:串行生成一定规模的搜索树
B:当前每个叶结点为根的子树搜索分配给一个处理器
C:发现解的处理器通知其他处理器
D:将所有处理器的结果组合成最终解
正确答案问询微信:424329
如果运算对象是独立无关的变量,则在向量运算之前需____。
A:将变量拷贝到连续区域
B:将变量地址拷贝到连续区域
C:将变量逐个传输到向量寄存器
D:以上皆错
正确答案问询微信:424329
在下列应用中,SIMD最不适合____。
A:图像处理
B:音频处理
C:科学计算
D:数据库查询
正确答案问询微信:424329
任务依赖图中权重之和最长的路径称为____。
A:最大任务
B:关键路径
C:平均并发度
D:最短路径
正确答案问询微信:424329
SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制整数imm8[0:3],若imm8[2]=j则表示___。
A:将第一个源寄存器的第j个元素放在目标寄存器位置2
B:将第二个源寄存器的第j个元素放在目标寄存器位置2
C:将第一个源寄存器的第2个元素放在目标寄存器位置2
D:将第二个源寄存器的第2个元素放在目标寄存器位置2
正确答案问询微信:424329
在下面问题中,SIMD并行更适合____。
A:搜索
B:排序
C:矩阵乘法
D:构建二叉排序树
正确答案问询微信:424329
两个MPI进程A和B相互收发消息,关于死锁下面说法正确的是____。
A:均为先向对方发再从对方收不会产生死锁
B:均为先向对方发再从对方收可能产生死锁
C:一个先发后收另一个先收后发必然死锁
D:一个先发后收另一个先收后发不会产生死锁
正确答案问询微信:424329
编写矩阵乘法的AVX程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A:2
B:4
C:8
D:16
正确答案问询微信:424329
静态线程编程模式的缺点是____。
A:线程管理开销高
B:系统资源利用率低
C:线程负载不均
D:线程通信开销高
正确答案问询微信:424329
float a[64]; for (i=0; i<60; i+=4) Va = a[i+2:i+5]; 系统向量化访存是按16字节对齐的,则此向量化程序每个循环步产生____个内存访问操作。
A:1
B:2
C:3
D:4
正确答案问询微信:424329
CUDA共享内存是由____共享。
A:Grid中所有线程
B:一个Block中所有线程
C:一个Warp中所有线程
D:GPU中所有线程
正确答案问询微信:424329
一个Neon寄存器最多存放____个双精度浮点数。
A:2
B:4
C:8
D:16
正确答案问询微信:424329
对于粗粒度任务划分和细粒度任务划分,下面说法错误的是____。
A:细粒度划分可达到更高的并发度,应选择它
B:细粒度划分会导致更大通信开销
C:粗粒度划分更不容易达到负载均衡
D:粗粒度划分会产生更多线程间交互
正确答案问询微信:424329
执行pthread_rwlock_wrlock时,____的情况下加锁成功。
A:没有线程已为线程上锁
B:已有一个线程上了读锁
C:已有一个线程上了写锁
D:已有多个线程上了读锁
正确答案问询微信:424329
Pthread是_____线程接口标准。
A:Linux
B:POSIX
C:Windows
D:IOS
正确答案问询微信:424329
OpenMP的缺点不包括____。
A:常见并行结构的表达并不总可行
B:局部性处理不易
C:不易编写多核单核通用程序
D:性能控制不易
正确答案问询微信:424329
对于向量化,以下说法错误的是____。
A:总会有打包/解包开销
B:若运算对象连续存储,可消除打包开销
C:若运算结果连续存储,可消除解包开销
D:打包/解包开销由数据存储决定
正确答案问询微信:424329
OpenMP循环并行指令是____。
A:omp parallel
B:omp single
C:omp parallel for
D:omp master
正确答案问询微信:424329
指定线程间划分循环策略的OpenMP子句是____。
A:shared
B:reduction
C:schedule
D:nowait
正确答案问询微信:424329
两个矩阵相乘,若矩阵规模大于cache大小,则优化访存的可行方法是____。
A:先将两个矩阵读入cache再进行乘法
B:先转置第一个矩阵再进行乘法
C:先转置第二个矩阵再进行乘法
D:以上皆错
正确答案问询微信:424329
信号量是一种____同步机制。
A:一元状态
B:二元状态
C:多元状态
D:以上皆错
正确答案问询微信:424329
天河1号、天河2号、神威.太湖之光总体上都是____架构
A:单核
B:多核
C:众核
D:集群
正确答案问询微信:424329
线程主动退出不能采用____。
A:return语句
B:pthread_exit函数
C:pthread_cancel函数
D:exit调用
正确答案问询微信:424329
一个AVX寄存器最多存放____个双精度浮点数。
A:2
B:4
C:8
D:16
正确答案问询微信:424329
定期评选全球计算能力最强的超级计算机的国际组织是____。
A:top500
B:green500
C:graph500
D:super500
正确答案问询微信:424329
pthread_create函数中设置一个参数为“线程函数参数”的原因是____。
A:它调用线程函数时可直接传递,性能更优
B:它需要预处理之后传递给线程函数
C:线程函数不是用户程序调用,只能采用这种方式由系统代为传递参数
D:没有特别用意
正确答案问询微信:424329
____执行pthread_sem_post操作,当前线程会唤醒阻塞线程。
A:当信号量已加锁时
B:当信号量为0时
C:当信号量已超过阈值时
D:当信号量已销毁时
正确答案问询微信:424329
我们不能通过____指定OpenMP循环划分策略。
A:使用编译指示
B:设置环境变量
C:调用库函数
D:采用默认设置
正确答案问询微信:424329
动态任务划分相对于静态任务划分的缺点是____。
A:可能导致负载不均
B:通信开销高
C:任务粒度粗
D:奥鹏南开大学23年秋季新学期作业参考计算复杂度高
正确答案问询微信:424329
在SSE intrinsics程序中整数数据类型是____。
A:__m128
B:__m128f
C:__m128d
D:__m128i
正确答案问询微信:424329
对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
A:正确的
B:错误的
正确答案问询微信:424329
OpenMP中指定多线程中只有主线程执行代码块的指令是____。
A:omp single
B:omp master
C:omp slave
D:omp parallel
正确答案问询微信:424329
当处理器数量不变时,随着问题规模增大,效率增大对____成立。
A:部分并行算法
B:所有并行算法
C:所有并行算法都不
D:以上皆错
正确答案问询微信:424329
一个Neon寄存器最多存放____个整型数。
A:2
B:4
C:8
D:16
正确答案问询微信:424329
两个n*n的矩阵相乘,将所有n^3个乘法计算划分给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一种划分____的数据并行。
A:输入数据
B:中间结果
C:输出数据
D:临时数据
正确答案问询微信:424329
任务依赖图的平均并发度的定义是____。
A:顶点权重之和
B:顶点数
C:各层平均顶点数
D:顶点权重之和/关键路径长度
正确答案问询微信:424329
多线程是____架构下的并行模式。
A:MIMD
B:共享内存
C:分布式内存
D:分离式地址空间
正确答案问询微信:424329
在应用中____的情况下读写锁相对于互斥量的性能优势更明显。
A:读写操作较为平均
B:读操作远远多于写操作
C:写操作远远多于读操作
D:以上皆错
正确答案问询微信:424329
关于消息传递编程的特点,以下说法正确的是____。
A:与共享内存一样有竞争条件
B:编程简单
C:需程序员考虑局部性
D:无需考虑进程间通信
正确答案问询微信:424329
采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是____。
A:更不利于负载均衡
B:增大了通信开销
C:提高了计算次数
D:增加了从进程空闲
正确答案问询微信:424329
采用多核、众核技术提升CPU性能,相对于单核的优势不包括____。
A:架构设计更容易
B:更易突破物理极限
C:能更充分利用现有资源
D:功耗优势明显
正确答案问询微信:424329
关于OpenMP循环并行程序的编写,下列说法中不正确的是____。
A:程序员无需编写线程创建和管理代码
B:程序员无需编写循环划分代码
C:程序员需指出哪个循环应并行
D:程序员需编写线程同步代码
正确答案问询微信:424329