南开23春学期（高起本：1709-2103、专升本高起专：1903-2103）《大数据开发技术（一）》在线作业一

奥鹏南开大学新学期作业参考

南开大学23春学期（高起本：1709-2103、专升本/高起专：1903-2103）《大数据开发技术（一）》在线作业

1.Hbase中()文件记录了-ROOT-表的位置
选项A：Master
选项B：Region
选项C：Zookeeper
选项D：Chubby
正确答案问询微信：424329

2.行式数据库采用()存储模型
选项A：NSM
选项B：DSM
选项C：Hbase
选项D：MySQL
正确答案问询微信：424329

3.R是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
正确答案问询微信：424329

4.UMP系通过()来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能
选项A：Controller服务器
选项B：Procy服务器
选项C：愚公系统
选项D：Agent服务器
正确答案问询微信：424329

5.MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。
选项A：M
选项B：N
选项C：M-1
选项D：N-1
正确答案问询微信：424329

6.Hadoop中执行MapReduce任务不含哪种方式()。
选项A：Mahout
选项B：Hadoop jar
选项C：Shell脚本
选项D：Python
正确答案问询微信：424329

7.NoSQL中的CAP理论中的C代表()
选项A：一致性
选项B：可用性
选项C：分区容忍性
选项D：可扩展性
正确答案问询微信：424329

8.以下哪层不属于物联网体系架构()。
选项A：应用层
选项B：采集层
选项C：网络层
选项D：感知层
正确答案问询微信：424329

9.对于不同顶点之间的信息交换,Pregel采用了()
选项A：远程数据读取
选项B：共享内存
选项C：纯消息传递模型
选项D：共享消息
正确答案问询微信：424329

10.针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
选项A：Time Tunnel
选项B：Spark
选项C：Super Mario
选项D：Storm
正确答案问询微信：424329

11.关于Storm中Topology说法错误的是()。
选项A：Topology可视为流转换图
选项B：Topology可以被提交到Storm集群执行
选项C：在Topology里面可以指定每个组件的并行度， Storm会在集群里面分配那么多的线程来同时计算
选项D：Topology里面的每一个组件都是串行运行的
正确答案问询微信：424329

12.NoSQL中的CAP理论中的P代表()
选项A：一致性
选项B：可用性
选项C：分区容忍性
选项D：可扩展性
正确答案问询微信：424329

13.Amazon RDS属于()
选项A：关系数据库
选项B：键值数据库
选项C：NoSQL数据库
选项D：数据仓库
正确答案问询微信：424329

14.UMP系统借助于()来实现各个节点之间的通信
选项A：Mnesia
选项B：LVS
选项C：RabbitMQ
选项D：Zookeeper
正确答案问询微信：424329

15.SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层
选项A：Client Layer
选项B：Services Layer
选项C：Platform Layer
选项D：Infrastructure Layer
正确答案问询微信：424329

16.Gephi是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
正确答案问询微信：424329

17.关于MapReduce中Shuffle过程,说法错误的是()。
选项A：Shuffle过程中为每个Map任务分配一个缓存
选项B：Shuffle过程中分区默认采用哈希函数
选项C：Shulle过程的合并会改变最终结果
选项D：Shuffle过程在Reduce端首先从Map端领取结果，然后执行归并操作，最后输送给Reduce任务进行处理。
正确答案问询微信：424329

18.UMP系统中面对多个小规模用户如何进行资源调度()
选项A：可以共享同一个MySQL实例
选项B：每个用户独占一个MySQL实例
选项C：会占用多个独立的MySQL实例奥鹏南开大学新学期作业参考
选项D：随机分配MySQL实例
正确答案问询微信：424329

19.Pregel计算模型中每个顶点ID的类型是()
选项A：String
选项B：Int
选项C：Double
选项D：结构体
正确答案问询微信：424329

20.Leaflet是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
正确答案问询微信：424329

21.HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
选项A：垂直扩展
选项B：水平扩展
选项C：拓扑扩展
选项D：叠加
正确答案问询微信：424329

22.Google Fusion Tables是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
正确答案问询微信：424329

23.以下针对Hive的说法不正确的是()。
选项A：Hive是一个基于Hadoop的数据仓库工具
选项B：Hive是关系数据库
选项C：Hive QL是一种查询语言
选项D：Hive可以提供查询分析存储等功能
正确答案问询微信：424329

24.关于分布式并行编程,以下说法错误的是()。
选项A：“摩尔定律”，CPU性能大约每隔12个月翻一番
选项B：“摩尔定律”逐渐失效后，人们开始借助于分布式并行编程来提高程序性能
选项C：分布式程序运行在大规模计算机集群上，可以并行执行大规模数据处理任务，从而获得海量的计算能力
选项D：谷歌公司最先提出了分布式并行编程模型MapReduce
正确答案问询微信：424329

25.()是一个通用文件系统的抽象基类,可以被分布式文件系统继承
选项A：DistributedFileSystem
选项B：GFSSystem
选项C：FileSystem
选项D：HDFSSystem
正确答案问询微信：424329

26.UMP系统借助于()来实现分布式数据库服务
选项A：Mnesia
选项B：LVS
选项C：RabbitMQ
选项D：Zookeeper
正确答案问询微信：424329

27.HDFS中NameNode将从SecondaryNameNode接收到的新的FsImage替换旧的FsImage文件,同时将edit.new替换##文件
选项A：edit
选项B：edit.old
选项C：FsImage
选项D：EditLog
正确答案问询微信：424329

28.优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()
选项A：列族数据库
选项B：键值数据库
选项C：图数据库
选项D：文档数据库
正确答案问询微信：424329

29.关于Hadoop集群,以下说法错误的是()。
选项A：SecondaryNameNode可以和NameNode共用一台机器
选项B：JobTracker指派的任务由TaskTracker执行
选项C：SecondaryNameNode可以和DataNode共用一台机器
选项D：NameNode可以和JobTracker共用一台机器
正确答案问询微信：424329

30.HDFS中ClientProtocal的()方法可以查找下一个数据块
选项A：getBlock
选项B：getBlockLocations
选项C：getLocation
选项D：nextBlock
正确答案问询微信：424329

31.Pregel作为分布式图计算的计算框架,主要用于()
选项A：图遍历
选项B：最短路径
选项C：PageRank计算
选项D：MapReduce
正确答案问询微信：424329

32.HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
选项A：FsImage
选项B：DataNode
选项C：Block
选项D：EditLog
正确答案问询微信：424329

33.以下亚马逊的产品中哪个属于存储部分
选项A：EC2
选项B：EBS
选项C：S3
选项D：ELB
正确答案问询微信：424329

34.以下哪些可以提供计算服务()。
选项A：Spark
选项B：Tez
选项C：Mahout
选项D：MapReduce
选项E：YARN
正确答案问询微信：424329

35.NoSQL数据库与关系数据库相比适用于哪些领域()
选项A：电信
选项B：银行
选项C：互联网企业大数据处理
选项D：传统企业的数据分析
正确答案问询微信：424329

36.关系数据库与NoSQL数据库相比有哪些优势()
选项A：支持事务ACID四性
选项B：可以支持超大规模数据存储
选项C：以完善的关系代数理论作为基础
选项D：具有强大的横向扩展能力
正确答案问询微信：424329

37.以下哪些是数据可视化分析工具()
选项A：R
选项B：Weka
选项C：Gephi
选项D：Tableau
正确答案问询微信：424329

38.以下图计算软件哪种属于基于遍历算法的、实时的图数据库
选项A：Neo4j
选项B：OrientDB
选项C：Infinite Graph
选项D：Pregel
正确答案问询微信：424329

39.传统的数据处理流程的前提是()。
选项A：存储的数据是旧的
选项B：存储的数据是实时的
选项C：需要用户主动发出查询
选项D：不需要用户主动发出查询
正确答案问询微信：424329

40.以下亚马逊的产品中哪个属于计算部分
选项A：EC2
选项B：EBS
选项C：S3
选项D：ELB
正确答案问询微信：424329

41.在概念视图层面, HBase 中的每个表是采用了基于列的存储方式
选项A：对
选项B：错
正确答案问询微信：424329

42.大数据开发的两大核心技术是Hadoop和MapReduce
选项A：对
选项B：错
正确答案问询微信：424329

43.Pregel的消息模式采用异步和批量的方式传递消息,却无法缓解远程读取的延迟
选项A：对
选项B：错
正确答案问询微信：424329

44.Hadoop安装时要配置SSH,这是由于Hadoop数据节点需要启动集群中所有机器的Hadoop守护进程,这个过程需要通过SSH登录来实现。
选项A：对
选项B：错
正确答案问询微信：424329

45.传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中,之后由用户通过查询操作和数据管理系统进行交互
选项A：对
选项B：错
正确答案问询微信：424329

46.Hbase和传统数据库一样都是列式数据库
选项A：对
选项B：错
正确答案问询微信：424329

47.在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在
选项A：对
选项B：错
正确答案问询微信：424329

48.Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记
选项A：对
选项B：错
正确答案问询微信：424329

49.Pig是Hadoop项目中一种数据仓库工具。
选项A：对
选项B：错
正确答案问询微信：424329

50.从物理存储层面, HBase 中的每个表是由许多行组成的
选项A：对
选项B：错
正确答案问询微信：424329

提供优质的教育资源