南开大学23秋学期《大数据开发技术(一)》在线作业一
奥鹏南开大学23年秋季新学期作业参考
23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《大数据开发技术(一)》在线作业-00001
SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流
A:Client Layer
B:Services Layer
C:Platform Layer
D:Infrastructure Layer
正确答案问询微信:424329
针对流数据,“量子恒道”可处理每天()级的实时流数据
A:TB
B:PB
C:GB
D:MB
正确答案问询微信:424329
Hbase中客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的()位置信息,用来加快后续数据访问过程
A:Master
B:Slaver
C:Region
D:客户端
正确答案问询微信:424329
Hbase在寻址过程客户端只需询问Zookeeper服务器,不需要链接()
A:Master
B:Region
C:Zookeeper
D:Chubby
正确答案问询微信:424329
Modest Maps是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329
MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。
A:M
B:N
C:M-1
D:N-1
正确答案问询微信:424329
Hbase中-ROOT-表有()个Region
A:1
B:10
C:10-1000
D:0
正确答案问询微信:424329
()是一个通用文件系统的抽象基类,可以被分布式文件系统继承
A:DistributedFileSystem
B:GFSSystem
C:FileSystem
D:HDFSSystem
正确答案问询微信:424329
以下说法不正确的是()。
A:MapReduce的核心思想就是“分面治之”
B:HDFS是对GFS的开源实现
C:MapReduce是一种分布式计算模型
D:HDFS采用HBase作为其底层数据存储
正确答案问询微信:424329
HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量()冗余因子
A:大于
B:小于
C:等于
D:大于等于
正确答案问询微信:424329
R是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
NoSQL中的CAP理论中的A代表()
A:一致性
B:可用性
C:分区容忍性
D:可扩展性
正确答案问询微信:424329
Hbase中采用()保证系统出错时及时恢复
A:MemStore
B:Hlog
C:StoreFile
D:客户端
正确答案问询微信:424329
MapReduce中最优的Reduce任务个数取决于集群中可用的()的数目。
A:Split
B:Slot
C:Map
D:Shuffle
正确答案问询微信:424329
优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活
提供嵌入式文档功能的数据库是()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329
以下哪种属于文档数据库()
A:MongoDB
B:Redis
C:Hbase
D:Neo4j
正确答案问询微信:424329
NoSQL中的CAP理论中的C代表()
A:一致性
B:可用性
C:分区容忍性
D:可扩展性
正确答案问询微信:424329
以下说法不正确的是()。
A:Zookeeper提供分布式锁之类的基本服务
B:Mahout提供了分布式存储服务
C:Flume提供了日志管理服务
D:Sqoop主要被用于数据交互操作
正确答案问询微信:424329
以下针对Hive的说法不正确的是()。
A:Hive是一个基于Hadoop的数据仓库工具
B:Hive是关系数据库
C:Hive QL是一种查询语言
D:Hive可以提供查询分析存储等功能
正确答案问询微信:424329
行式数据库采用()存储模型
A:NSM
B:DSM
C:Hbase
D:MySQL
正确答案问询微信:424329
UMP系统借助于()来实现分布式数据库服务
A:Mnesia
B:LVS
C:RabbitMQ
D:Zookeeper
正确答案问询微信:424329
关于MapReduce中Shuffle过程,说法错误的是()。
A:Shuffle过程中为每个Map任务分配一个缓存
B:Shuffle过程中分区默认采用哈希函数
C:Shulle过程的合并会改变最终结果
D:Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。
正确答案问询微信:424329
以下亚马逊的产品中哪个是关系数据库
A:RDS
B:Sim奥鹏南开大学23年秋季新学期作业参考pleDB
C:DynamoDB
D:Redshift
正确答案问询微信:424329
关于分布式并行编程,以下说法错误的是()。
A:“摩尔定律”,CPU性能大约每隔12个月翻一番
B:“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C:分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D:谷歌公司最先提出了分布式并行编程模型MapReduce
正确答案问询微信:424329
以下亚马逊的产品中哪个是数据仓库
A:ElastiCache
B:RDS
C:DynamoDB
D:Redshift
正确答案问询微信:424329
Storm框架在处理()上比MapReduce更有优势。
A:静态数据
B:流数据
C:批量数据
D:网络数据
正确答案问询微信:424329
Amazon Redshift属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
正确答案问询微信:424329
HDFS中ClientProtocol的()方法通知名称节点关闭文件
A:close
B:finish
C:exit
D:complete
正确答案问询微信:424329
以下哪个不属于MongoDB的特点
A:提供了面向文档的存储
B:可以设置任何属性索引
C:具有很好的垂直可扩展性
D:支持丰富的查询表达式
正确答案问询微信:424329
以下哪种数据库属于NoSQL数据库()
A:关系数据库
B:键值数据库
C:文档数据库
D:分布式数据库
正确答案问询微信:424329
HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
A:FsImage
B:DataNode
C:Block
D:EditLog
正确答案问询微信:424329
以下哪些是数据可视化地图工具()
A:Google Fusion Tables
B:Modest Maps
C:Leaflet
D:Google Chart API
正确答案问询微信:424329
流计算处理流程三个主要阶段是()。
A:实时采集
B:实时存储
C:实时计算
D:实时查询
正确答案问询微信:424329
以下哪个是HDFS的局限性()。
A:延迟高
B:只允许对文件执行追加操作,不能执行随机写操作
C:用MapReduce处理大量小文件时,会产生过多的Map任务,线程管理开销会大大增加
D:拥有复杂的数据模型
正确答案问询微信:424329
UMP系统依赖的开源组件包括()
A:Mnesia
B:LVS
C:RabbitMQ
D:Zookeeper
正确答案问询微信:424329
以下哪种数据库属于NoSQL数据库()
A:SimpleDB
B:BigTable
C:MongoDB
D:GraphDB
正确答案问询微信:424329
Pregel作为分布式图计算的计算框架,主要用于()
A:图遍历
B:最短路径
C:PageRank计算
D:MapReduce
正确答案问询微信:424329
MapReduce与传统并行计算框架的对比中,说法正确的是()。
A:MapReduce属于共享式集群架构,容错性好
B:传统并行计算框架比MapReduce硬件更加便宜
C:传统并行计算框架适用于实时、细粒度计算
D:MapReduce适用于数据密集型,传统并行计算框架适用于计算密集型
正确答案问询微信:424329
分布式文件系统的设计目的包括()。
A:并发控制
B:可伸缩性
C:容错
D:速度
正确答案问询微信:424329
Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储
A:对
B:错
正确答案问询微信:424329
关系数据库的关键特性包括完善的事务机制和高效的查询机制
A:对
B:错
正确答案问询微信:424329
HDFS集群中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。
A:对
B:错
正确答案问询微信:424329
Hadoop可以在单节点上以伪分布式的方式运行,Hadoop进程以分离的Java进程来运行,节点既作为NameNode也作为DataNode,同时,读取的是HDFS中的文件。
A:对
B:错
正确答案问询微信:424329
Linux系统中只有Ubuntu可以安装Hadoop。
A:对
B:错
正确答案问询微信:424329
大数据虽然商业价值高,但是其价值密度低。
A:对
B:错
正确答案问询微信:424329
Pregel中无论在哪台机器上,都可以简单根据顶点ID判断出该顶点属于哪个分区,即使该顶点可能已经不存在了
A:对
B:错
正确答案问询微信:424329
UMP系统中的Mnesia不错支持事务
A:对
B:错
正确答案问询微信:424329
在HBase 的概念视图中, 一个表可以视为一个稀疏、多维的映射关系。
A:对
B:错
正确答案问询微信:424329
Hbase和传统数据库一样都是行式数据库
A:对
B:错
正确答案问询微信:424329