南开大学22秋学期（高起本1709-1803、全层次1809-2103）《大数据开发技术（一）》在线作业三

奥鹏南开在线作业满分答案参考

22秋学期（高起本1709-1803、全层次1809-2103）《大数据开发技术（一）》在线作业-00003

1.以下说法不正确的是()。
选项A：MapReduce的核心思想就是“分面治之”
选项B：HDFS是对GFS的开源实现
选项C：MapReduce是一种分布式计算模型
选项D：HDFS采用HBase作为其底层数据存储
满分答案问询微信：424329

2.Google Chart API是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
满分答案问询微信：424329

3.流数据采取()计算模式
选项A：批量
选项B：实时
选项C：大数据
选项D：动态
满分答案问询微信：424329

4.UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移
选项A：Controller服务器
选项B：Procy服务器
选项C：愚公系统
选项D：Agent服务器
满分答案问询微信：424329

5.MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。
选项A：M
选项B：N
选项C：M-1
选项D：N-1
满分答案问询微信：424329

6.UMP系统借助于()来实现分布式数据库服务
选项A：Mnesia
选项B：LVS
选项C：RabbitMQ
选项D：Zookeeper
满分答案问询微信：424329

7.关于Reduce端Shuffle过程,说法正确的是()。
选项A：Reduce领取数据先放入缓存，来自不同Map机器，先合并，再归并，写入磁盘
选项B：多个溢写文件归并最后只能形成一个大文件
选项C：当数据很少时，也要溢写到磁盘
选项D：Reduce任务通过RPC向JobTracker询问Map任务是否已经完成
满分答案问询微信：424329

8.以下属于Hadoop2.0的特性是()。
选项A：MapReduce
选项B：HDFS
选项C：YARN
选项D：SPARK
满分答案问询微信：424329

9.以下哪种不属于为大数据时代提供关键技术支撑的信息科技变化()。
选项A：网络宽带不断增加
选项B：存储设备容量不断增加
选项C：CPU处理能大幅提升
选项D：存储设备尺寸不断减小
满分答案问询微信：424329

10.Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。
选项A：ShuffleGrouping
选项B：AllGrouping
选项C：GlobalGrouping
选项D：FiedlsGrouping
满分答案问询微信：424329

11.应用于专门用于处理具有高度相互关联关系的数据,比较适合于社交网络的数据库是哪种()
选项A：列族数据库
选项B：键值数据库
选项C：图数据库
选项D：文档数据库
满分答案问询微信：424329

12.NoSQL中的CAP理论中的C代表()
选项A：一致性
选项B：可用性
选项C：分区容忍性
选项D：可扩展性
满分答案问询微信：424329

13.使用Amazon云环境部署Hadoop的说法中错误的是()。
选项A：Hadoop不仅可以运行在企业内部的集群中，也可以运行在云计算环境中
选项B：Hadoop自带有一套脚本，用于在EC2上面运行Hadoop
选项C：在EC2上运行Hadoop尤其适用于一些工作流
选项D：Amazon EC2为Hadoop提供了存储服务
满分答案问询微信：424329

14.HDFS中ClientProtocol的()方法通知名称节点关闭文件
选项A：close
选项B：finish
选项C：exit
选项D：complete
满分答案问询微信：424329

15.关于Strom中Bolt说法错误的是()奥鹏南开在线作业满分答案参考。
选项A：Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
选项B：Bolt是一个被动的角色，Spout是一个主动的角色
选项C：Bolt不仅可以处理Tuple还可以创建新的Tuple
选项D：Bolt是Streams的状态转换过程的抽象含义
满分答案问询微信：424329

16.HDFS读数据过程中()具体实现了FileSystem
选项A：DistributedFileSystem
选项B：GFSSystem
选项C：FileSystem
选项D：HDFSSystem
满分答案问询微信：424329

17.Amazon SimpleDB属于()
选项A：关系数据库
选项B：键值数据库
选项C：NoSQL数据库
选项D：数据仓库
满分答案问询微信：424329

18.Google Fusion Tables是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
满分答案问询微信：424329

19.Hbase中采用()保证系统出错时及时恢复
选项A：MemStore
选项B：Hlog
选项C：StoreFile
选项D：客户端
满分答案问询微信：424329

20.HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
选项A：Master
选项B：Region
选项C：Zookeeper
选项D：Chubby
满分答案问询微信：424329

21.Hbase中()文件记录了-ROOT-表的位置
选项A：Master
选项B：Region
选项C：Zookeeper
选项D：Chubby
满分答案问询微信：424329

22.以下不属于物联网关键技术的是()。
选项A：RFID
选项B：传感器
选项C：交换机
选项D：矩阵式二维码
满分答案问询微信：424329

23.Hbase中-ROOT-表有()个Region
选项A：1
选项B：10
选项C：10-1000
选项D：0
满分答案问询微信：424329

24.HDFS中SecondaryNameNode可减少()重启的时间
选项A：NameNode
选项B：SecondaryNameNode
选项C：DataNode
选项D：Block
满分答案问询微信：424329

25.Hbase中Zookeeper文件记录了()的位置
选项A：.META.表
选项B：-ROOT-表
选项C：Region
选项D：Master
满分答案问询微信：424329

26.SQL Azure体系结构层中哪层是硬件和操作系统
选项A：Client Layer
选项B：Services Layer
选项C：Platform Layer
选项D：Infrastructure Layer
满分答案问询微信：424329

27.MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。
选项A：数据向计算靠拢
选项B：计算向数据靠拢
选项C：计算向网络靠拢
选项D：计算与数据并行
满分答案问询微信：424329

28.对于不同顶点之间的信息交换,Pregel采用了()
选项A：远程数据读取
选项B：共享内存
选项C：纯消息传递模型
选项D：共享消息
满分答案问询微信：424329

29.Hbase中客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的()位置信息,用来加快后续数据访问过程
选项A：Master
选项B：Slaver
选项C：Region
选项D：客户端
满分答案问询微信：424329

30.hadoop fs -() 命令可以显示指定的文件的详细信息
选项A：ll
选项B：ls
选项C：dir
选项D：show
满分答案问询微信：424329

31.HDFS中NameNode保存的核心数据结构是()
选项A：FsImage
选项B：DataNode
选项C：Block
选项D：EditLog
满分答案问询微信：424329

32.以下哪些属于典型的大数据应用()。
选项A：谷歌搜索
选项B：谷歌流感趋势
选项C：谷歌统计
选项D：《纸牌屋》制作
选项E：《黑镜子》制作
满分答案问询微信：424329

33.Hbase系统结构中包括()
选项A：Zookeeper服务器
选项B：客户端
选项C：Master服务器
选项D：Region服务器
满分答案问询微信：424329

34.以下哪些是数据可视化地图工具()
选项A：Google Fusion Tables
选项B：Modest Maps
选项C：Leaflet
选项D：Google Chart API
满分答案问询微信：424329

35.以下图计算软件哪种属于以图顶点为中心的、基于消息传递批处理的并行引擎
选项A：Giraph
选项B：Pregel
选项C：Hama
选项D：DEX
满分答案问询微信：424329

36.以下哪种数据库属于NoSQL数据库()
选项A：关系数据库
选项B：键值数据库
选项C：文档数据库
选项D：分布式数据库
满分答案问询微信：424329

37.NoSQL数据库与关系数据库相比适用于哪些领域()
选项A：电信
选项B：银行
选项C：互联网企业大数据处理
选项D：传统企业的数据分析
满分答案问询微信：424329

38.以下哪些可以提供计算服务()。
选项A：Spark
选项B：Tez
选项C：Mahout
选项D：MapReduce
选项E：YARN
满分答案问询微信：424329

39.以下说法正确的是()。
选项A：Kafka是一种高吞吐量的分布式发布订阅消息系统
选项B：Spark是并行框架
选项C：Pig是一个基于Hadoop的大规模数据计算平台
选项D：Storm是一种流计算框架
满分答案问询微信：424329

40.流计算处理流程三个主要阶段是()。
选项A：实时采集
选项B：实时存储
选项C：实时计算
选项D：实时查询
满分答案问询微信：424329

41.分布式文件系统中文件块会被复制为多个副本,存储在不同的节点上,而且,存储同一文件块的不同副本的各个节点,会分布在不同的机架上。
选项A：对
选项B：错
满分答案问询微信：424329

42.数据产生方式的运营式系统阶段的数据产生方式是主动的。
选项A：对
选项B：错
满分答案问询微信：424329

43.在概念视图层面, HBase 中的每个表是采用了基于列的存储方式
选项A：对
选项B：错
满分答案问询微信：424329

44.Hbase和传统数据库一样都是列式数据库
选项A：对
选项B：错
满分答案问询微信：424329

45.Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。
选项A：对
选项B：错
满分答案问询微信：424329

46.UMP系统中的Mnesia不错支持事务
选项A：对
选项B：错
满分答案问询微信：424329

47.Storm框架是实时计算系统,所以不能使用数据库。
选项A：对
选项B：错
满分答案问询微信：424329

48.HBase中包含一个Region服务器和许多个Master服务器
选项A：对
选项B：错
满分答案问询微信：424329

49.Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记
选项A：对
选项B：错
满分答案问询微信：424329

50.Storm中的Tuple是一个Key-Value的Map,但也可以填入一个Value-List。
选项A：对
选项B：错
满分答案问询微信：424329

提供优质的教育资源