南开大学23年春学期《大数据开发技术(一)》在线作业一
奥鹏南开大学新学期作业参考
23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《大数据开发技术(一)》在线作业-00001
Hbase中()文件记录了-ROOT-表的位置
A:Master
B:Region
C:Zookeeper
D:Chubby
正确答案问询微信:424329
行式数据库采用()存储模型
A:NSM
B:DSM
C:Hbase
D:MySQL
正确答案问询微信:424329
R是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
UMP系通过()来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器
正确答案问询微信:424329
MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。
A:M
B:N
C:M-1
D:N-1
正确答案问询微信:424329
Hadoop中执行MapReduce任务不含哪种方式()。
A:Mahout
B:Hadoop jar
C:Shell脚本
D:Python
正确答案问询微信:424329
NoSQL中的CAP理论中的C代表()
A:一致性
B:可用性
C:分区容忍性
D:可扩展性
正确答案问询微信:424329
以下哪层不属于物联网体系架构()。
A:应用层
B:采集层
C:网络层
D:感知层
正确答案问询微信:424329
对于不同顶点之间的信息交换,Pregel采用了()
A:远程数据读取
B:共享内存
C:纯消息传递模型
D:共享消息
正确答案问询微信:424329
针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
A:Time Tunnel
B:Spark
C:Super Mario
D:Storm
正确答案问询微信:424329
关于Storm中Topology说法错误的是()。
A:Topology可视为流转换图
B:Topology可以被提交到Storm集群执行
C:在Topology里面可以指定每个组件的并行度, Storm会在集群里面分配那么多的线程来同时计算
D:Topology里面的每一个组件都是串行运行的
正确答案问询微信:424329
NoSQL中的CAP理论中的P代表()
A:一致性
B:可用性
C:分区容忍性
D:可扩展性
正确答案问询微信:424329
Amazon RDS属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
正确答案问询微信:424329
UMP系统借助于()来实现各个节点之间的通信
A:Mnesia
B:LVS
C:RabbitMQ
D:Zookeeper
正确答案问询微信:424329
SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层
A:Client Layer
B:Services Layer
C:Platform Layer
D:Infrastructure Layer
正确答案问询微信:424329
Gephi是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
关于MapReduce中Shuffle过程,说法错误的是()。
A:Shuffle过程中为每个Map任务分配一个缓存
B:Shuffle过程中分区默认采用哈希函数
C:Shulle过程的合并会改变最终结果
D:Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。
正确答案问询微信:424329
UMP系统中面对多个小规模用户如何进行资源调度()
A:可以共享同一个MySQL实例
B:每个用户独占一个MySQL实例
C:会占用多个独立的MySQL实例
D:随机分配MySQL实例
正确答案问询微信:424329
Pregel计算模型中每个顶点ID的类型是()
A:String
B:Int
C:Double
D:结构体
正确答案问询微信:424329
Leaflet是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
A:垂直扩展
B:水平扩展
C:拓扑扩展
D:叠加
正确答案问询微信:424329
Google Fusion Tables是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
以下针对Hive的说法不正确的是()。
A:Hive是一个基于Hadoop的数据仓库工具
B:Hive是关系数据库
C:Hive QL是一种查询语言
D:Hive可以提供查询分析存储等功能
正确答案问询微信:424329
关于分布式并行编程,以下说法错误的是()。
A:“摩尔定律”,CPU性能大约每隔12个月翻一番
B:“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C:分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D:谷歌公司最先提出了分布式并行编程模型MapReduce
正确答案问询微信:424329
()是一个通用文件系统的抽象基类,可以被分布式文件系统继承
A:DistributedFileSystem
B:GFSSystem
C:FileSystem
D:HDFSSystem
正确答案问询微信:424329
UMP系统借助于()来实现分布式数据库服务
A:Mnesia
B:LVS
C:RabbitMQ
D:Zookeeper
正确答案问询微信:424329
HDFS中NameNode将从SecondaryNameNode接收到的新的FsImage替换旧的FsImage文件,同时将edit.new替换##文件
A:edit
B:edit.old
C:FsImage
D:EditLog
正确答案问询微信:424329
优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329
关于Hadoop集群,以下说法错误的是()。
A:SecondaryNameNode可以和NameNode共用一台机器
B:JobTracker指派的任务由TaskTracker执行
C:SecondaryNameNode可以和DataNode共用一台机器
D:NameNode可以和JobTracker共用一台机器
正确答案问询微信:424329
HDFS中ClientProtocal的()方法可以查找下一个数据块
A:getBlock
B:getBlockLocations
C:getLocation
D:nextBlock
正确答案问询微信:424329
Pregel作为分布式图计算的计算框架,主要用于()
A:图遍历
B:最短路径
C:PageRank计算
D:MapReduce
正确答案问询微信:424329
HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
A:FsImage
B:DataNode
C:Block
D:EditLog
正确答案问询微信:424329
以下亚马逊的产品中哪个属于存储部分
A:EC2
B:EBS
C:S3
D:ELB
正确答案问询微信:424329
以下哪些可以提供计算服务()。
A:Spark
B:Tez
C:Mahout
D:MapReduce
E:YARN
正确答案问询微信:424329
NoSQL数据库与关系数据库相比适用于哪些领域()
A:电信
B:银行
C:互联网企业大数据处理
D:传统企业的数据分析
正确答案问询微信:424329
关系数据库与NoSQL数据奥鹏南开大学新学期作业参考 代做2元一门库相比有哪些优势()
A:支持事务ACID四性
B:可以支持超大规模数据存储
C:以完善的关系代数理论作为基础
D:具有强大的横向扩展能力
正确答案问询微信:424329
以下哪些是数据可视化分析工具()
A:R
B:Weka
C:Gephi
D:Tableau
正确答案问询微信:424329
以下图计算软件哪种属于基于遍历算法的、实时的图数据库
A:Neo4j
B:OrientDB
C:Infinite Graph
D:Pregel
正确答案问询微信:424329
传统的数据处理流程的前提是()。
A:存储的数据是旧的
B:存储的数据是实时的
C:需要用户主动发出查询
D:不需要用户主动发出查询
正确答案问询微信:424329
以下亚马逊的产品中哪个属于计算部分
A:EC2
B:EBS
C:S3
D:ELB
正确答案问询微信:424329
在概念视图层面, HBase 中的每个表是采用了基于列的存储方式
A:对
B:错
正确答案问询微信:424329
大数据开发的两大核心技术是Hadoop和MapReduce
A:对
B:错
正确答案问询微信:424329
Pregel的消息模式采用异步和批量的方式传递消息,却无法缓解远程读取的延迟
A:对
B:错
正确答案问询微信:424329
Hadoop安装时要配置SSH,这是由于Hadoop数据节点需要启动集群中所有机器的Hadoop守护进程,这个过程需要通过SSH登录来实现。
A:对
B:错
正确答案问询微信:424329
传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中,之后由用户通过查询操作和数据管理系统进行交互
A:对
B:错
正确答案问询微信:424329
Hbase和传统数据库一样都是列式数据库
A:对
B:错
正确答案问询微信:424329
在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在
A:对
B:错
正确答案问询微信:424329
Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记
A:对
B:错
正确答案问询微信:424329
Pig是Hadoop项目中一种数据仓库工具。
A:对
B:错
正确答案问询微信:424329
从物理存储层面, HBase 中的每个表是由许多行组成的
A:对
B:错
正确答案问询微信:424329