南开大学22秋学期（高起本1709-1803、全层次1809-2103）《大数据开发技术（一）》在线作业一

奥鹏南开在线作业满分答案参考

22秋学期（高起本1709-1803、全层次1809-2103）《大数据开发技术（一）》在线作业-00001

1.使用Amazon云环境部署Hadoop的说法中错误的是()。
选项A：Hadoop不仅可以运行在企业内部的集群中，也可以运行在云计算环境中
选项B：Hadoop自带有一套脚本，用于在EC2上面运行Hadoop
选项C：在EC2上运行Hadoop尤其适用于一些工作流
选项D：Amazon EC2为Hadoop提供了存储服务
满分答案问询微信：424329

2.以下哪个是HDFS的局限性()。
选项A：吞吐率
选项B：数据集
选项C：兼容性
选项D：延迟
满分答案问询微信：424329

3.日志的获取属于流计算的哪个步骤()。
选项A：实时采集
选项B：实时存储
选项C：实时计算
选项D：实时查询
满分答案问询微信：424329

4.以下哪种数据库适合于批量数据处理和即席查询()
选项A：MySQL
选项B：Oracle
选项C：Hbase
选项D：NosSQL
满分答案问询微信：424329

5.R是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
满分答案问询微信：424329

6.以下哪个不属于MongoDB的特点
选项A：提供了面向文档的存储
选项B：可以设置任何属性索引
选项C：具有很好的垂直可扩展性
选项D：支持丰富的查询表达式
满分答案问询微信：424329

7.关于Hadoop集群,以下说法错误的是()。
选项A：SecondaryNameNode可以和NameNode共用一台机器
选项B：JobTracker指派的任务由TaskTracker执行
选项C：SecondaryNameNode可以和DataNode共用一台机器
选项D：NameNode可以和JobTracker共用一台机器
满分答案问询微信：424329

8.D3是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
满分答案问询微信：424329

9.HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
选项A：垂直扩展
选项B：水平扩展
选项C：拓扑扩展
选项D：叠加
满分答案问询微信：424329

10.()是一个通用文件系统的抽象基类,可以被分布式文件系统继承
选项A：DistributedFileSystem
选项B：GFSSystem
选项C：FileSystem
选项D：HDFSSystem
满分答案问询微信：424329

11.关于Reduce端Shuffle过程,说法正确的是()。
选项A：Reduce领取数据先放入缓存，来自不同Map机器，先合并，再归并，写入磁盘
选项B：多个溢写文件归并最后只能形成一个大文件
选项C：当数据很少时，也要溢写到磁盘
选项D：Reduce任务通过RPC向JobTracker询问Map任务是否已经完成
满分答案问询微信：424329

12.关于MapReduce工作流程,说法错误的是()。
选项A：不同的Map任务之间不会进行通信
选项B：不同的Reduce任务之间不会发生任何信息交换
选项C：用户可以显式地从一台机器向另一台机器发送消息
选项D：所有的数据交换都是通过MapReduce框架自身去实现的
满分答案问询微信：424329

13.HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
选项A：Master
选项B：Region
选项C：Zookeeper
选项D：Chubby
满分答案问询微信：424329

14.以下哪种属于图数据库()
选项A：MongoDB
选项B：Redis
选项C：Hbase
选项D：Neo4j
满分答案问询微信：424329

15.Amazon RDS属于()
选项A：关系数据库
选项B：键值数据库
选项C：NoSQL数据库
选项D：数据仓库
满分答案问询微信：424329

16.以下说法不正确的是()。
选项A：MapReduce的核心思想就是“分面治之”
选项B：HDFS是对GFS的开源实现
选项C：MapReduce是一种分布式计算模型
选项D：HDFS采用HBase作为其底层数据存储
满分答案问询微信：424329

17.以下针对Hive的说法不正确的是()。
选项A：Hive是一个基于Hadoop的数据仓库工具
选项B：Hive是关系数据库
选项C：Hive QL是一种查询语言
选项D：Hive可以提供查询分析存储等功能
满分答案问询微信：424329

18.以下亚马逊的产品中哪个是数据仓库
选项A：ElastiCache
选项B：RDS
选项C：DynamoDB
选项D：Redshift
满分答案问询微信：424329

19.对于不同顶点之间的信息交换,Pregel采用了()
选项A：远程数据读取
选项B：共享内存
选项C奥鹏南开在线作业满分答案参考：纯消息传递模型
选项D：共享消息
满分答案问询微信：424329

20.SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层
选项A：Client Layer
选项B：Services Layer
选项C：Platform Layer
选项D：Infrastructure Layer
满分答案问询微信：424329

21.在Storm的工作流程中,对于Supervisor说法错误的是()。
选项A：Supervisor会去Zookeeper集群上认领自己的Task
选项B：Supervisor节点首先将提交的Topology进行分片，分成一个个Task，分配给相应的Nimbus
选项C：Supervisor会将Task和相关的信息提交到Zookeeper集群上
选项D：Supervisor会通知自己的Worker进程进行Task的处理
满分答案问询微信：424329

22.以下说法不正确的是()。
选项A：Zookeeper提供分布式锁之类的基本服务
选项B：Mahout提供了分布式存储服务
选项C：Flume提供了日志管理服务
选项D：Sqoop主要被用于数据交互操作
满分答案问询微信：424329

23.NoSQL中的CAP理论中的P代表()
选项A：一致性
选项B：可用性
选项C：分区容忍性
选项D：可扩展性
满分答案问询微信：424329

24.Echarts是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
满分答案问询微信：424329

25.Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。
选项A：ShuffleGrouping
选项B：AllGrouping
选项C：GlobalGrouping
选项D：FiedlsGrouping
满分答案问询微信：424329

26.应用于存储、索引并管理面向文档的数据或者类似的半结构化数据,比如,用于后台具有大量读写操作的网站的数据库是哪种()
选项A：列族数据库
选项B：键值数据库
选项C：图数据库
选项D：文档数据库
满分答案问询微信：424329

27.Hbase在寻址过程客户端只需询问Zookeeper服务器,不需要链接()
选项A：Master
选项B：Region
选项C：Zookeeper
选项D：Chubby
满分答案问询微信：424329

28.以下亚马逊的产品中哪个是关系数据库
选项A：RDS
选项B：SimpleDB
选项C：DynamoDB
选项D：Redshift
满分答案问询微信：424329

29.Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。
选项A：ShuffleGrouping
选项B：AllGrouping
选项C：GlobalGrouping
选项D：FiedlsGrouping
满分答案问询微信：424329

30.以下不属于物联网关键技术的是()。
选项A：RFID
选项B：传感器
选项C：交换机
选项D：矩阵式二维码
满分答案问询微信：424329

31.以下包含在Hadoop项目中的有()。
选项A：Ambari
选项B：Redis
选项C：MongoDB
选项D：Pig
选项E：Sqoop
满分答案问询微信：424329

32.以下哪些应用场景属于大规模图或者网络的呈现形式?()
选项A：社交网络
选项B：传染病传播途径
选项C：交通事故对路网的影响
选项D：广告推荐
满分答案问询微信：424329

33.MapReduce可以解决哪些计算问题()。
选项A：矩阵乘法
选项B：关系代数运算
选项C：聚合运算
选项D：关系投影运算
满分答案问询微信：424329

34.关于MapReduce,说法正确的是()。
选项A：MapReduce框架采用了Master/Slave架构，包括一个Master和若干个Slave
选项B：Hadoop框架是用Java实现的，因此MapReduce应用程序要用Java来写
选项C：MapReduce模型的核心是Map函数和Reduce函数
选项D：MapReduce将一个存储在分布式文件系统中的大规模数据集，切分成许多独立的分片
满分答案问询微信：424329

35.以下哪种数据库属于NoSQL数据库()
选项A：关系数据库
选项B：键值数据库
选项C：文档数据库
选项D：分布式数据库
满分答案问询微信：424329

36.以下哪些属于典型的大数据应用()。
选项A：谷歌搜索
选项B：谷歌流感趋势
选项C：谷歌统计
选项D：《纸牌屋》制作
选项E：《黑镜子》制作
满分答案问询微信：424329

37.NoSQL数据库与关系数据库相比有哪些优势()
选项A：支持事务ACID四性
选项B：可以支持超大规模数据存储
选项C：以完善的关系代数理论作为基础
选项D：具有强大的横向扩展能力
满分答案问询微信：424329

38.以下哪些是云数据库产品()
选项A：Dynamo
选项B：SimpleDB
选项C：RDS
选项D：SQL Server
满分答案问询微信：424329

39.MapReduce的main函数中设置输出类型的方法有()。
选项A：setOutputKeyClass
选项B：setOutputClass
选项C：setOutputValueClass
选项D：setKeyValueClass
满分答案问询微信：424329

40.以下哪个应用适合用Pregel来解决()
选项A：数据库的笛卡尔积
选项B：单元最短路径
选项C：二分匹配
选项D：求极值
满分答案问询微信：424329

41.UMP系统中的Mnesia不错支持事务
选项A：对
选项B：错
满分答案问询微信：424329

42.Hadoop伪分布式配置中需将副本数量调成1
选项A：对
选项B：错
满分答案问询微信：424329

43.Hbase中列族支持动态扩展,可以很轻松地添加一个列族或列
选项A：对
选项B：错
满分答案问询微信：424329

44.在HBase 的概念视图中, 一个表可以视为一个稀疏、多维的映射关系。
选项A：对
选项B：错
满分答案问询微信：424329

45.Hbase和传统数据库一样都是行式数据库
选项A：对
选项B：错
满分答案问询微信：424329

46.Hbase中缓存刷新,每次刷写都生成一个新的StoreFile文件,因此,每个Store包含多个StoreFile文件
选项A：对
选项B：错
满分答案问询微信：424329

47.云数据库不可以满足大企业的海量数据存储需求
选项A：对
选项B：错
满分答案问询微信：424329

48.数据实时计算阶段对采集的数据进行实时的分析和计算。流处理系统接收数据采集系统不断发来的实时数据,实时地进行分析计算,不需要反馈实时结果。
选项A：对
选项B：错
满分答案问询微信：424329

49.在分布式文件系统中,如果一个文件小于一个数据块的大小,它会占用整个数据块的存储空间。
选项A：对
选项B：错
满分答案问询微信：424329

50.Pregel将PageRank处理对象看成是连通图,而MapReduce则将其看成是键值对
选项A：对
选项B：错
满分答案问询微信：424329

提供优质的教育资源