南开23春学期(高起专1903、专升本1903)《大数据开发技术(一)》在线作业一

奥鹏南开大学新学期作业参考

南开23春学期(高起专1903、专升本1903)《大数据开发技术(一)》在线作业一插图

南开大学23春学期(高起专1903、专升本1903)《大数据开发技术(一)》在线作业

1.UMP系统中面对中等规模用户如何进行资源调度()
选项A:可以共享同一个MySQL实例
选项B:每个用户独占一个MySQL实例
选项C:会占用多个独立的MySQL实例
选项D:随机分配MySQL实例
正确答案问询微信:424329

2.Hbase在寻址过程客户端只需询问Zookeeper服务器,不需要链接()
选项A:Master
选项B:Region
选项C:Zookeeper
选项D:Chubby
正确答案问询微信:424329

3.以下说法不正确的是()。
选项A:MapReduce的核心思想就是“分面治之”
选项B:HDFS是对GFS的开源实现
选项C:MapReduce是一种分布式计算模型
选项D:HDFS采用HBase作为其底层数据存储
正确答案问询微信:424329

4.Hbase中-ROOT-表有()个Region
选项A:1
选项B:10
选项C:10-1000
选项D:0
正确答案问询微信:424329

5.HDFS中FSDataOutputStream封装了()
选项A:HDFSOutputStream
选项B:DFSOutputStream
选项C:DataOutputStream
选项D:FSOutputStream
正确答案问询微信:424329

6.静态数据采取()计算模式
选项A:批量
选项B:实时
选项C:大数据
选项D:动态
正确答案问询微信:424329

7.SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层
选项A:Client Layer
选项B:Services Layer
选项C:Platform Layer
选项D:Infrastructure Layer
正确答案问询微信:424329

8.应用于存储、索引并管理面向文档的数据或者类似的半结构化数据,比如,用于后台具有大量读写操作的网站的数据库是哪种()
选项A:列族数据库
选项B:键值数据库
选项C:图数据库
选项D:文档数据库
正确答案问询微信:424329

9.关于Reduce端Shuffle过程,说法正确的是()。
选项A:Reduce领取数据先放入缓存,来自不同Map机器,先合并,再归并,写入磁盘
选项B:多个溢写文件归并最后只能形成一个大文件
选项C:当数据很少时,也要溢写到磁盘
选项D:Reduce任务通过RPC向JobTracker询问Map任务是否已经完成
正确答案问询微信:424329

10.Storm框架不适用于哪个领域()。
选项A:实时分析
选项B:实时交通
选项C:远程RPC
选项D:历史记录查询
正确答案问询微信:424329

11.以下哪种属于列族数据库()
选项A:MongoDB
选项B:Redis
选项C:Hbase
选项D:Neo4j
正确答案问询微信:424329

12.Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。
选项A:ShuffleGrouping
选项B:AllGrouping
选项C:GlobalGrouping
选项D:FiedlsGrouping
正确答案问询微信:424329

13.以下哪个是HDFS的局限性()。
选项A:吞吐率
选项B:数据集
选项C:兼容性
选项D:延迟
正确答案问询微信:424329

14.R是哪种可视化工具()
选项A:信息图表
选项B:地图工具
选项C:时间线工具
选项D:分析工具
正确答案问询微信:424329

15.关于Strom中Bolt说法错误的是()。
选项A:Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
选项B:Bolt是一个被动的角色,Spout是一个主动的角色
选项C:Bolt不仅可以处理Tuple还可以创建新的Tuple
选项D:Bolt是Streams的状态转换过程的抽象含义
正确答案问询微信:424329

16.针对流数据,“量子恒道”可处理每天()级的实时流数据
选项A:TB
选项B:PB
选项C:GB
选项D:MB
正确答案问询微信:424329

17.应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()
选项A:列族数据库
选项B:键值数据库
选项C:图数据库
选项D:文档数据库
正确答案问询微信:424329

18.关于分布式并行编程,以下说法错误的是()。
选项A:“摩尔定律”,CPU性能奥鹏南开大学新学期作业参考大约每隔12个月翻一番
选项B:“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
选项C:分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
选项D:谷歌公司最先提出了分布式并行编程模型MapReduce
正确答案问询微信:424329

19.以下哪个不属于MongoDB的特点
选项A:提供了面向文档的存储
选项B:可以设置任何属性索引
选项C:具有很好的垂直可扩展性
选项D:支持丰富的查询表达式
正确答案问询微信:424329

20.关于MapReduce中Shuffle过程,说法错误的是()。
选项A:Shuffle过程中为每个Map任务分配一个缓存
选项B:Shuffle过程中分区默认采用哈希函数
选项C:Shulle过程的合并会改变最终结果
选项D:Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。
正确答案问询微信:424329

21.Leaflet是哪种可视化工具()
选项A:信息图表
选项B:地图工具
选项C:时间线工具
选项D:分析工具
正确答案问询微信:424329

22.HDFS中ClientProtocal的()方法可以查找下一个数据块
选项A:getBlock
选项B:getBlockLocations
选项C:getLocation
选项D:nextBlock
正确答案问询微信:424329

23.使用Amazon云环境部署Hadoop的说法中错误的是()。
选项A:Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
选项B:Hadoop自带有一套脚本,用于在EC2上面运行Hadoop
选项C:在EC2上运行Hadoop尤其适用于一些工作流
选项D:Amazon EC2为Hadoop提供了存储服务
正确答案问询微信:424329

24.UMP系统借助于()来实现集群内部的负载均衡
选项A:Mnesia
选项B:LVS
选项C:RabbitMQ
选项D:Zookeeper
正确答案问询微信:424329

25.UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移
选项A:Controller服务器
选项B:Procy服务器
选项C:愚公系统
选项D:Agent服务器
正确答案问询微信:424329

26.Amazon RDS属于()
选项A:关系数据库
选项B:键值数据库
选项C:NoSQL数据库
选项D:数据仓库
正确答案问询微信:424329

27.以下哪种属于键值数据库()
选项A:MongoDB
选项B:Redis
选项C:Hbase
选项D:Neo4j
正确答案问询微信:424329

28.SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层
选项A:Client Layer
选项B:Services Layer
选项C:Platform Layer
选项D:Infrastructure Layer
正确答案问询微信:424329

29.行式数据库采用()存储模型
选项A:NSM
选项B:DSM
选项C:Hbase
选项D:MySQL
正确答案问询微信:424329

30.Hbase中采用()保证系统出错时及时恢复
选项A:MemStore
选项B:Hlog
选项C:StoreFile
选项D:客户端
正确答案问询微信:424329

31.已得到广泛应用的分布式文件系统主要包括()。
选项A:GFS
选项B:MapReduce
选项C:Hbase
选项D:HDFS
正确答案问询微信:424329

32.关于Map端Shuffle过程中的合并与归并,说法正确的是()。
选项A:两个键值对和,如果合并,会得到
选项B:合并不会改变最终结果
选项C:两个键值对和,如果归并,会得到
选项D:两个键值对和,如果归并,会得到>
正确答案问询微信:424329

33.以下属于Hadoop的安装方式的有()。
选项A:单机模式
选项B:多机模式
选项C:分布式模式
选项D:并行模式
选项E:伪分布式模式
正确答案问询微信:424329

34.以下哪种数据库属于NoSQL数据库()
选项A:关系数据库
选项B:键值数据库
选项C:文档数据库
选项D:分布式数据库
正确答案问询微信:424329

35.以下属于流计算框架的是()。
选项A:Twitter Storm
选项B:Spark
选项C:MapReduce
选项D:Pregel
选项E:Yahoo! S4
正确答案问询微信:424329

36.流计算系统的需求有()。
选项A:实时性
选项B:廉价
选项C:高性能
选项D:高带宽
选项E:分布式
正确答案问询微信:424329

37.HDFS提供了()可以通过客户端访问文件系统。
选项A:类似Shell的命令行
选项B:可视化窗口
选项C:Java API
选项D:Web API
正确答案问询微信:424329

38.MapReduce与传统并行计算框架的对比中,说法正确的是()。
选项A:MapReduce属于共享式集群架构,容错性好
选项B:传统并行计算框架比MapReduce硬件更加便宜
选项C:传统并行计算框架适用于实时、细粒度计算
选项D:MapReduce适用于数据密集型,传统并行计算框架适用于计算密集型
正确答案问询微信:424329

39.以下哪种数据库是针对在线业务的,并且抛弃了关系模型()
选项A:MongoDB
选项B:MySQL
选项C:Oracle
选项D:Redis
正确答案问询微信:424329

40.以下哪些是数据可视化时间线工具()
选项A:Echarts
选项B:Timetoast
选项C:Xtimeline
选项D:R
正确答案问询微信:424329

41.感知式系统的广泛使用
人类社会数据量第三次大的飞跃最终导致了大数据的产生。
选项A:对
选项B:错
正确答案问询微信:424329

42.早期对于流计算的研究多数是基于对传统数据库处理的流式化,即实时数据库,很少研究流计算框架
选项A:对
选项B:错
正确答案问询微信:424329

43.分布式离线分析可以实现秒级别的实时分析响应。
选项A:对
选项B:错
正确答案问询微信:424329

44.MapReduce中TaskTracker使用“slot”等量划分本节点上的资源量。
选项A:对
选项B:错
正确答案问询微信:424329

45.CAP理论告诉我们,一个分布式系统可以同时满足一致性、可用性和分区容忍性这三个需求
选项A:对
选项B:错
正确答案问询微信:424329

46.MapReduce执行程序时可以直接运行.class文件
选项A:对
选项B:错
正确答案问询微信:424329

47.云数据库不可以满足企业动态变化的数据存储需求
选项A:对
选项B:错
正确答案问询微信:424329

48.在传统的文件系统中,为了提高磁盘读写效率,一般以数据块为单位
选项A:对
选项B:错
正确答案问询微信:424329

49.在Pregel中, “标志位”和输入消息队列是分开保存的
选项A:对
选项B:错
正确答案问询微信:424329

50.Linux系统中只有Ubuntu可以安装Hadoop。
选项A:对
选项B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网