南开大学23年秋学期《并行程序设计》在线作业三

奥鹏南开大学23年秋季新学期作业参考

23秋学期(仅限-高起专1909、专升本奥鹏南开大学23年秋季新学期作业参考1909)《并行程序设计》在线作业-00003

OpenMP是___的一个常见替代。
A:SSE
B:MPI
C:Pthread
D:CUDA
正确答案问询微信:424329

为了解决CPU内流水线深度限制,主要的技术手段是____。
A:降低指令复杂度
B:去掉分支预测功能
C:增大核心数
D:超标量技术
正确答案问询微信:424329

SSE intrinsics _mm_hadd_ps命令的功能是____。
A:寄存器间单精度浮点数向量加法
B:寄存器间双精度浮点数向量加法
C:寄存器内单精度浮点数加法
D:寄存器内双精度浮点数加法
正确答案问询微信:424329

采用划分子矩阵(大小b*b)的方法实现n*n矩阵乘法,一次乘—加运算涉及的子矩阵可全部放入cache,则整个计算过程中,两个输入矩阵的每个元素会产生____次访存。
A:n
B:t
C:n-t
D:n/t
正确答案问询微信:424329

程序访存更多在____中命中,可最大程度提高性能、降低功耗
A:本CPU cache
B:本CPU主存
C:本结点其他CPU主存
D:远端结点主存
正确答案问询微信:424329

动态任务划分相对于静态任务划分的缺点是____。
A:可能导致负载不均
B:通信开销高
C:任务粒度粗
D:计算复杂度高
正确答案问询微信:424329

对于向线程函数传递参数,下列说法错误的是____。
A:线程函数并非用户程序调用,因此无法直接传递
B:线程函数必须接受void *参数,因此只能传递大小不超过指针的数据对象
C:线程通常通过此途径获取线程号
D:不同线程间的参数传递相互无关,即使它们具有相同的线程函数
正确答案问询微信:424329

FORTRAN语言存储二维数组采取____。
A:行主次序存储
B:列主次序存储
C:交错式存储
D:对角线存储
正确答案问询微信:424329

用GCC编译器编译SSE intrinsics程序,需使用编译选项
A:-march=corei7
B:-g
C:-O
D:-O2
正确答案问询微信:424329

____不是SIMD架构。
A:SSE
B:超线程
C:AltiVec
D:Neon
正确答案问询微信:424329

关于MPI_recv对源地址的标识,下列说法正确的是____。
A:只能使用进程编号
B:可以使用IP地址
C:可以使用IPV6地址
D:可以使用MPI_ANY_SOURCE
正确答案问询微信:424329

记并行时间为T,串行时间为T',处理器数量为p,并行代价的定义是____。
A:pT
B:T'+T
C:p(T'-T)
D:pT-T'
正确答案问询微信:424329

Pthread不支持____。
A:创建并发执行线程
B:同步
C:非显式通信
D:自动并行化
正确答案问询微信:424329

主线程创建了4个线程,它们打印各自的线程号(0-3),未使用任何同步,则输出顺序____。
A:必然是0 1 2 3
B:必然是4 3 2 1
C:不可能是4 3 2 1
D:以上皆错
正确答案问询微信:424329

新一代GPU重点提供的新特性不包括____。
A:新型高速显存
B:GPU间直接高速互联
C:自动并行化
D:人工智能计算专门优化
正确答案问询微信:424329

对于科学仿真并行计算的一般方法,哪个步骤的描述是错误的?
A:将空间离散化为网格
B:在网络上进行局部计算
C:局部计算结果完全独立
D:重复若干时间步
正确答案问询微信:424329

对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
A:正确的
B:错误的
正确答案问询微信:424329

我们在小规模系统和小规模输入下测试了几个并行算法,应选择哪个应用在实际系统中?
A:选择性能测试并行时间最少者
B:选择性能测试加速比最大者
C:选择性能测试效率最高者
D:应结合可扩展性分析做出选择
正确答案问询微信:424329

对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。
A:声明语句
B:条件分支语句
C:循环语句
D:输入输出语句
正确答案问询微信:424329

OpenMP并行模型是一种____编程模型。
A:静态线程
B:动态线程
C:混合线程
D:众核
正确答案问询微信:424329

和一对多广播对应的组通信操作是____。
A:多对一收集
B:多对多收集
C:多对一归约
D:多对多归约
正确答案问询微信:424329

天河1号、天河2号、神威.太湖之光总体上都是____架构
A:单核
B:多核
C:众核
D:集群
正确答案问询微信:424329

MPI程序中发送和接收消息的两个进程必须____。
A:在同一个网段中
B:连接在同一个路由器上
C:在同一个通信域中
D:以上皆错
正确答案问询微信:424329

SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=0则表示___。
A:将第一个源寄存器的第j个元素放在目标寄存器位置0
B:将第二个源寄存器的第j个元素放在目标寄存器位置0
C:将第一个源寄存器的第j个元素放在目标寄存器位置j
D:将第二个源寄存器的第j个元素放在目标寄存器位置j
正确答案问询微信:424329

OpenMP循环并行指令是____。
A:omp parallel
B:omp single
C:omp parallel for
D:omp master
正确答案问询微信:424329

SIMD架构未见于_____中。
A:多媒体扩展
B:图形和游戏处理器
C:计算机集群
D:协处理器
正确答案问询微信:424329

如果运算对象是独立无关的变量,则在向量运算之前需____。
A:将变量拷贝到连续区域
B:将变量地址拷贝到连续区域
C:将变量逐个传输到向量寄存器
D:以上皆错
正确答案问询微信:424329

OpenMP编译指示中说明共享变量是用____子句。
A:private
B:shared
C:schedule
D:nowait
正确答案问询微信:424329

主线程通过____函数获取特定线程的返回结果。
A:pthread_create
B:pthread_join
C:pthread_cancel
D:pthread_get
正确答案问询微信:424329

以下哪条不是推动并行计算发展的因素?
A:存储是系统瓶颈
B:单CPU发展已能满足应用需求
C:利用标准硬件构造并行机令升级容易
D:编程环境标准化逐步发展
正确答案问询微信:424329

数据依赖是指必须保持两个内存操作的____才能保证程序结果正确。
A:大小
B:时序
C:时长
D:cache局部性
正确答案问询微信:424329

CPU cache大小为32KB,如希望(单精度浮点数)矩阵乘法计算过程中所有数据都驻留cache中,则矩阵大小最大为
A:16*16
B:32*32
C:64*64
D:128*128
正确答案问询微信:424329

全球500强超算在CPU、网络等硬件上越来越体现出采用____的趋势。
A:特殊硬件
B:通用硬件
C:非公开硬件
D:廉价硬件
正确答案问询微信:424329

采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。
A:按编号顺序依次从从进程接收结果
B:按编号逆序依次从从进程接收结果
C:按编号顺序、逆序交替从从进程接收结果
D:使用MPI_ANY_SOURCE和MPI_ANY_TAG
正确答案问询微信:424329

Flynn分类法中,下面哪种体系结构在实际中几乎没有意义?
A:SISD
B:SIMD
C:MISD
D:MIMD
正确答案问询微信:424329

我国首次获得戈登?贝尔奖是在____年。
A:2015
B:2016
C:2017
D:2018
正确答案问询微信:424329

多线程是____架构下的并行模式。
A:MIMD
B:共享内存
C:分布式内存
D:分离式地址空间
正确答案问询微信:424329

OpenMP循环划分策略不包括____。
A:static
B:fixed
C:dynamic
D:guided
正确答案问询微信:424329

SSE intrinsics _mm_store_sd命令的功能是____。
A:对齐向量存单精度浮点数
B:未对齐向量存单精度浮点数
C:对齐标量存双精度浮点数
D:未对齐标量存双精度浮点数
正确答案问询微信:424329

关于消息传递编程的特点,以下说法正确的是____。
A:与共享内存一样有竞争条件
B:编程简单
C:需程序员考虑局部性
D:无需考虑进程间通信
正确答案问询微信:424329

经典冯诺依曼架构执行一条指令的过程中不包括哪个操作?
A:取指令
B:解码
C:安全性检查
D:执行指令
正确答案问询微信:424329

MPI程序中默认的通信域是____。
A:MPI_ANY_SOURCE
B:MPI_ANY_TAG
C:MPI_ANY_COMM
D:MPI_COMM_WORLD
正确答案问询微信:424329

矩阵每行排序的问题更适合使用MPI的____编程模型。
A:阻塞的
B:非阻塞的
C:对等的
D:主从的
正确答案问询微信:424329

对于加速比S和处理器数量p,下列说法正确的是____。
A:有可能S>p
B:必然S<p
C:不可能S=p
D:两者无关联
正确答案问询微信:424329

对于向量化,以下说法错误的是____。
A:总会有打包/解包开销
B:若运算对象连续存储,可消除打包开销
C:若运算结果连续存储,可消除解包开销
D:打包/解包开销由数据存储决定
正确答案问询微信:424329

记并行时间为T,串行时间为T',处理器数量为p,效率为E,则代价最优的定义是____。
A:pT'=T
B:E=(1)
C:E=pT/T'
D:E=T'/pT
正确答案问询微信:424329

在用pthread_mutex_lock对互斥量进行加锁时,若其已上锁,则线程进入____状态。
A:初始化
B:阻塞
C:继续执行
D:销毁
正确答案问询微信:424329

并行算法设计所做的事情不包括____。
A:分解计算工作分配给多个处理器
B:保持数据依赖保证结果正确
C:确保不能产生重复计算
D:尽量降低通信等额外开销
正确答案问询微信:424329

MPI基本原语不包括____。
A:MPI_Barrier
B:MPI_Comm_rank
C:MPI_Comm_size
D:MPI_Init
正确答案问询微信:424329

下面矩阵运算中,哪个进行简单的数据并行效果不佳____。
A:矩阵求和
B:矩阵相乘
C:矩阵向量相乘
D:高斯消去
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网