南开大学23年秋学期《大数据开发技术(一)》在线作业二
奥鹏南开大学23年秋季新学期作业参考
23秋学期(仅限-高起专1909、专升本1909)《大数据开发技术(一)》在线作业-00002
Google Fusion Tables是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
NoSQL中的CAP理论中的A代表()
A:一致性
B:可用性
C:分区容忍性
D:可扩展性
正确答案问询微信:424329
关于分布式并行编程,以下说法错误的是()。
A:“摩尔定律”,CPU性能大约每隔12个月翻一番
B:“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C:分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D:谷歌公司最先提出了分布式并行编程模型MapReduce
正确答案问询微信:424329
以下说法不正确的是()。
A:Zookeeper提供分布式锁之类的基本服务
B:Mahout提供了分布式存储服务
C:Flume提供了日志管理服务
D:Sqoop主要被用于数据交互操作
正确答案问询微信:424329
UMP系统借助于()来实现各个节点之间的通信
A:Mnesia
B:LVS
C:RabbitMQ
D:Zookeeper
正确答案问询微信:424329
关于MapReduce工作流程,说法错误的是()。
A:不同的Map任务之间不会进行通信
B:不同的Reduce任务之间不会发生任何信息交换
C:用户可以显式地从一台机器向另一台机器发送消息
D:所有的数据交换都是通过MapReduce框架自身去实现的
正确答案问询微信:424329
关于Storm中Topology说法错误的是()。
A:Topology可视为流转换图
B:Topology可以被提交到Storm集群执行
C:在Topology里面可以指定每个组件的并行度, Storm会在集群里面分配那么多的线程来同时计算
D:Topology里面的每一个组件都是串行运行的
正确答案问询微信:424329
在Storm的工作流程中,对于Supervisor说法错误的是()。
A:Supervisor会去Zookeeper集群上认领自己的Task
B:Supervisor节点首先将提交的Topology进行分片,分成一个个Task,分配给相应的Nimbus
C:Supervisor会将Task和相关的信息提交到Zookeeper集群上
D:Supervisor会通知自己的Worker进程进行Task的处理
正确答案问询微信:424329
以下哪种属于图数据库()
A:MongoDB
B:Redis
C:Hbase
D:Neo4j
正确答案问询微信:424329
Hbase中()文件记录了-ROOT-表的位置
A:Master
B:Region
C:Zookeeper
D:Chubby
正确答案问询微信:424329
Xtimeline是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器
正确答案问询微信:424329
Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。
A:ShuffleGrouping
B:AllGrouping
C:GlobalGrouping
D:FiedlsGrouping
正确答案问询微信:424329
日志的获取属于流计算的哪个步骤()。
A:实时采集
B:实时存储
C:实时计算
D:实时查询
正确答案问询微信:424329
HDFS中FSDataInputStream封装了()
A:HDFSInputStream
B:DFSInputStream
C:DataInputStream
D:FSInputStream
正确答案问询微信:424329
HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
A:Master
B:Region
C:Zookeeper
D:Chubby
正确答案问询微信:424329
HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量()冗余因子
A:大于
B:小于
C:等于
D:大于等于
正确答案问询微信:424329
很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。
A:动态
B:存量
C:实时
D:静态
正确答案问询微信:424329
1秒定律体现了大数据的哪个特征()。
A:数据量大
B:数据产生速度快
C:数据存储快
D:数据计算快
正确答案问询微信:424329
优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活
提供嵌入式文档功能的数据库是()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329
奥鹏南开大学23年秋季新学期作业参考
Google Chart API是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
应用于专门用于处理具有高度相互关联关系的数据,比较适合于社交网络的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329
以下哪个是HDFS的局限性()。
A:吞吐率
B:数据集
C:兼容性
D:延迟
正确答案问询微信:424329
以下不属于物联网关键技术的是()。
A:RFID
B:传感器
C:交换机
D:矩阵式二维码
正确答案问询微信:424329
Gephi是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
关于Hadoop集群,以下说法错误的是()。
A:SecondaryNameNode可以和NameNode共用一台机器
B:JobTracker指派的任务由TaskTracker执行
C:SecondaryNameNode可以和DataNode共用一台机器
D:NameNode可以和JobTracker共用一台机器
正确答案问询微信:424329
MongoDB将数据存储为一个()
A:关系
B:属性
C:字段
D:文档
正确答案问询微信:424329
HDFS中NameNode将从SecondaryNameNode接收到的新的FsImage替换旧的FsImage文件,同时将edit.new替换##文件
A:edit
B:edit.old
C:FsImage
D:EditLog
正确答案问询微信:424329
以下说法不正确的是()。
A:MapReduce的核心思想就是“分面治之”
B:HDFS是对GFS的开源实现
C:MapReduce是一种分布式计算模型
D:HDFS采用HBase作为其底层数据存储
正确答案问询微信:424329
HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
A:垂直扩展
B:水平扩展
C:拓扑扩展
D:叠加
正确答案问询微信:424329
以下包含在Hadoop项目中的有()。
A:Ambari
B:Redis
C:MongoDB
D:Pig
E:Sqoop
正确答案问询微信:424329
流计算系统的需求有()。
A:实时性
B:廉价
C:高性能
D:高带宽
E:分布式
正确答案问询微信:424329
Hbase提供了哪些访问接口?
A:Pig
B:Hive
C:Zookeeper
D:Java API
正确答案问询微信:424329
以下哪个是HDFS的局限性()。
A:延迟高
B:只允许对文件执行追加操作,不能执行随机写操作
C:用MapReduce处理大量小文件时,会产生过多的Map任务,线程管理开销会大大增加
D:拥有复杂的数据模型
正确答案问询微信:424329
HDFS要实现的目标
A:流数据读写
B:大数据集的操作
C:复杂的文件模型
D:强大的跨平台兼容性
正确答案问询微信:424329
以下属于流计算框架的是()。
A:Twitter Storm
B:Spark
C:MapReduce
D:Pregel
E:Yahoo! S4
正确答案问询微信:424329
NoSQL数据库与关系数据库相比适用于哪些领域()
A:电信
B:银行
C:互联网企业大数据处理
D:传统企业的数据分析
正确答案问询微信:424329
Pregel作为分布式图计算的计算框架,主要用于()
A:图遍历
B:最短路径
C:PageRank计算
D:MapReduce
正确答案问询微信:424329
HDFS的命名空间包含()
A:节点
B:目录
C:文件
D:块
正确答案问询微信:424329
Storm中Topology里面组件可以是()。
A:Spout
B:Stream
C:Tuple
D:Bolt
正确答案问询微信:424329
Facebook主要将Hadoop平台用于日志处理、推荐系统等方面
A:对
B:错
正确答案问询微信:424329
HDFS集群中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。
A:对
B:错
正确答案问询微信:424329
Hadoop是典型的批处理模型
A:对
B:错
正确答案问询微信:424329
Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储
A:对
B:错
正确答案问询微信:424329
"hadoop dfs"和"hdfs dfs"两条命令都只是用于HDFS文件系统
A:对
B:错
正确答案问询微信:424329
UMP系统采用数据访问IP黑名单确保安全性
A:对
B:错
正确答案问询微信:424329
在Pregel中, “标志位”和输入消息队列是分开保存的
A:对
B:错
正确答案问询微信:424329
在HBase 的概念视图中, 一个表可以视为一个稀疏、多维的映射关系。
A:对
B:错
正确答案问询微信:424329
MapReduce执行程序时可以直接运行.class文件
A:对
B:错
正确答案问询微信:424329
感知式系统的广泛使用
人类社会数据量第三次大的飞跃最终导致了大数据的产生。
A:对
B:错
正确答案问询微信:424329