南开23春学期(高起本:1709-2103、专升本高起专:1903-2103)《大数据开发技术(一)》在线作业一

奥鹏南开大学新学期作业参考

南开23春学期(高起本:1709-2103、专升本高起专:1903-2103)《大数据开发技术(一)》在线作业一插图

南开大学23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《大数据开发技术(一)》在线作业

1.Hbase中()文件记录了-ROOT-表的位置
选项A:Master
选项B:Region
选项C:Zookeeper
选项D:Chubby
正确答案问询微信:424329

2.行式数据库采用()存储模型
选项A:NSM
选项B:DSM
选项C:Hbase
选项D:MySQL
正确答案问询微信:424329

3.R是哪种可视化工具()
选项A:信息图表
选项B:地图工具
选项C:时间线工具
选项D:分析工具
正确答案问询微信:424329

4.UMP系通过()来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能
选项A:Controller服务器
选项B:Procy服务器
选项C:愚公系统
选项D:Agent服务器
正确答案问询微信:424329

5.MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。
选项A:M
选项B:N
选项C:M-1
选项D:N-1
正确答案问询微信:424329

6.Hadoop中执行MapReduce任务不含哪种方式()。
选项A:Mahout
选项B:Hadoop jar
选项C:Shell脚本
选项D:Python
正确答案问询微信:424329

7.NoSQL中的CAP理论中的C代表()
选项A:一致性
选项B:可用性
选项C:分区容忍性
选项D:可扩展性
正确答案问询微信:424329

8.以下哪层不属于物联网体系架构()。
选项A:应用层
选项B:采集层
选项C:网络层
选项D:感知层
正确答案问询微信:424329

9.对于不同顶点之间的信息交换,Pregel采用了()
选项A:远程数据读取
选项B:共享内存
选项C:纯消息传递模型
选项D:共享消息
正确答案问询微信:424329

10.针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
选项A:Time Tunnel
选项B:Spark
选项C:Super Mario
选项D:Storm
正确答案问询微信:424329

11.关于Storm中Topology说法错误的是()。
选项A:Topology可视为流转换图
选项B:Topology可以被提交到Storm集群执行
选项C:在Topology里面可以指定每个组件的并行度, Storm会在集群里面分配那么多的线程来同时计算
选项D:Topology里面的每一个组件都是串行运行的
正确答案问询微信:424329

12.NoSQL中的CAP理论中的P代表()
选项A:一致性
选项B:可用性
选项C:分区容忍性
选项D:可扩展性
正确答案问询微信:424329

13.Amazon RDS属于()
选项A:关系数据库
选项B:键值数据库
选项C:NoSQL数据库
选项D:数据仓库
正确答案问询微信:424329

14.UMP系统借助于()来实现各个节点之间的通信
选项A:Mnesia
选项B:LVS
选项C:RabbitMQ
选项D:Zookeeper
正确答案问询微信:424329

15.SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层
选项A:Client Layer
选项B:Services Layer
选项C:Platform Layer
选项D:Infrastructure Layer
正确答案问询微信:424329

16.Gephi是哪种可视化工具()
选项A:信息图表
选项B:地图工具
选项C:时间线工具
选项D:分析工具
正确答案问询微信:424329

17.关于MapReduce中Shuffle过程,说法错误的是()。
选项A:Shuffle过程中为每个Map任务分配一个缓存
选项B:Shuffle过程中分区默认采用哈希函数
选项C:Shulle过程的合并会改变最终结果
选项D:Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。
正确答案问询微信:424329

18.UMP系统中面对多个小规模用户如何进行资源调度()
选项A:可以共享同一个MySQL实例
选项B:每个用户独占一个MySQL实例
选项C:会占用多个独立的MySQL实例奥鹏南开大学新学期作业参考
选项D:随机分配MySQL实例
正确答案问询微信:424329

19.Pregel计算模型中每个顶点ID的类型是()
选项A:String
选项B:Int
选项C:Double
选项D:结构体
正确答案问询微信:424329

20.Leaflet是哪种可视化工具()
选项A:信息图表
选项B:地图工具
选项C:时间线工具
选项D:分析工具
正确答案问询微信:424329

21.HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
选项A:垂直扩展
选项B:水平扩展
选项C:拓扑扩展
选项D:叠加
正确答案问询微信:424329

22.Google Fusion Tables是哪种可视化工具()
选项A:信息图表
选项B:地图工具
选项C:时间线工具
选项D:分析工具
正确答案问询微信:424329

23.以下针对Hive的说法不正确的是()。
选项A:Hive是一个基于Hadoop的数据仓库工具
选项B:Hive是关系数据库
选项C:Hive QL是一种查询语言
选项D:Hive可以提供查询分析存储等功能
正确答案问询微信:424329

24.关于分布式并行编程,以下说法错误的是()。
选项A:“摩尔定律”,CPU性能大约每隔12个月翻一番
选项B:“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
选项C:分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
选项D:谷歌公司最先提出了分布式并行编程模型MapReduce
正确答案问询微信:424329

25.()是一个通用文件系统的抽象基类,可以被分布式文件系统继承
选项A:DistributedFileSystem
选项B:GFSSystem
选项C:FileSystem
选项D:HDFSSystem
正确答案问询微信:424329

26.UMP系统借助于()来实现分布式数据库服务
选项A:Mnesia
选项B:LVS
选项C:RabbitMQ
选项D:Zookeeper
正确答案问询微信:424329

27.HDFS中NameNode将从SecondaryNameNode接收到的新的FsImage替换旧的FsImage文件,同时将edit.new替换##文件
选项A:edit
选项B:edit.old
选项C:FsImage
选项D:EditLog
正确答案问询微信:424329

28.优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()
选项A:列族数据库
选项B:键值数据库
选项C:图数据库
选项D:文档数据库
正确答案问询微信:424329

29.关于Hadoop集群,以下说法错误的是()。
选项A:SecondaryNameNode可以和NameNode共用一台机器
选项B:JobTracker指派的任务由TaskTracker执行
选项C:SecondaryNameNode可以和DataNode共用一台机器
选项D:NameNode可以和JobTracker共用一台机器
正确答案问询微信:424329

30.HDFS中ClientProtocal的()方法可以查找下一个数据块
选项A:getBlock
选项B:getBlockLocations
选项C:getLocation
选项D:nextBlock
正确答案问询微信:424329

31.Pregel作为分布式图计算的计算框架,主要用于()
选项A:图遍历
选项B:最短路径
选项C:PageRank计算
选项D:MapReduce
正确答案问询微信:424329

32.HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
选项A:FsImage
选项B:DataNode
选项C:Block
选项D:EditLog
正确答案问询微信:424329

33.以下亚马逊的产品中哪个属于存储部分
选项A:EC2
选项B:EBS
选项C:S3
选项D:ELB
正确答案问询微信:424329

34.以下哪些可以提供计算服务()。
选项A:Spark
选项B:Tez
选项C:Mahout
选项D:MapReduce
选项E:YARN
正确答案问询微信:424329

35.NoSQL数据库与关系数据库相比适用于哪些领域()
选项A:电信
选项B:银行
选项C:互联网企业大数据处理
选项D:传统企业的数据分析
正确答案问询微信:424329

36.关系数据库与NoSQL数据库相比有哪些优势()
选项A:支持事务ACID四性
选项B:可以支持超大规模数据存储
选项C:以完善的关系代数理论作为基础
选项D:具有强大的横向扩展能力
正确答案问询微信:424329

37.以下哪些是数据可视化分析工具()
选项A:R
选项B:Weka
选项C:Gephi
选项D:Tableau
正确答案问询微信:424329

38.以下图计算软件哪种属于基于遍历算法的、实时的图数据库
选项A:Neo4j
选项B:OrientDB
选项C:Infinite Graph
选项D:Pregel
正确答案问询微信:424329

39.传统的数据处理流程的前提是()。
选项A:存储的数据是旧的
选项B:存储的数据是实时的
选项C:需要用户主动发出查询
选项D:不需要用户主动发出查询
正确答案问询微信:424329

40.以下亚马逊的产品中哪个属于计算部分
选项A:EC2
选项B:EBS
选项C:S3
选项D:ELB
正确答案问询微信:424329

41.在概念视图层面, HBase 中的每个表是采用了基于列的存储方式
选项A:对
选项B:错
正确答案问询微信:424329

42.大数据开发的两大核心技术是Hadoop和MapReduce
选项A:对
选项B:错
正确答案问询微信:424329

43.Pregel的消息模式采用异步和批量的方式传递消息,却无法缓解远程读取的延迟
选项A:对
选项B:错
正确答案问询微信:424329

44.Hadoop安装时要配置SSH,这是由于Hadoop数据节点需要启动集群中所有机器的Hadoop守护进程,这个过程需要通过SSH登录来实现。
选项A:对
选项B:错
正确答案问询微信:424329

45.传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中,之后由用户通过查询操作和数据管理系统进行交互
选项A:对
选项B:错
正确答案问询微信:424329

46.Hbase和传统数据库一样都是列式数据库
选项A:对
选项B:错
正确答案问询微信:424329

47.在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在
选项A:对
选项B:错
正确答案问询微信:424329

48.Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记
选项A:对
选项B:错
正确答案问询微信:424329

49.Pig是Hadoop项目中一种数据仓库工具。
选项A:对
选项B:错
正确答案问询微信:424329

50.从物理存储层面, HBase 中的每个表是由许多行组成的
选项A:对
选项B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网