南开大学23秋学期《大数据开发技术(一)》在线作业三
奥鹏南开大学23年秋季新学期作业参考
23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《大数据开发技术(一)》在线作业-00003
关于Strom中Bolt说法错误的是()。
A:Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
B:Bolt是一个被动的角色,Spout是一个主动的角色
C:Bolt不仅可以处理Tuple还可以创建新的Tuple
D:Bolt是Streams的状态转换过程的抽象含义
正确答案问询微信:424329
HDFS中ClientProtocol的()方法通知名称节点关闭文件
A:close
B:finish
C:exit
D:complete
正确答案问询微信:424329
以下亚马逊的产品中哪个是键值数据库
A:RDS
B:SimpleDB
C:DynamoDB
D:Redshift
正确答案问询微信:424329
以下说法不正确的是()。
A:MapReduce的核心思想就是“分面治之”
B:HDFS是对GFS的开源实现
C:MapReduce是一种分布式计算模型
D:HDFS采用HBase作为其底层数据存储
正确答案问询微信:424329
SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层
A:Client Layer
B:Services Layer
C:Platform Layer
D:Infrastructure Layer
正确答案问询微信:424329
静态数据采取()计算模式
A:批量
B:实时
C:大数据
D:动态
正确答案问询微信:424329
Modest Maps是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
关于Hadoop集群,以下说法错误的是()。
A:SecondaryNameNode可以和NameNode共用一台机器
B:JobTracker指派的任务由TaskTracker执行
C:SecondaryNameNode可以和DataNode共用一台机器
D:NameNode可以和JobTracker共用一台机器
正确答案问询微信:424329
以下哪个是HDFS的局限性()。
A:吞吐率
B:数据集
C:兼容性
D:延迟
正确答案问询微信:424329
HDFS中FSDataInputStream封装了()
A:HDFSInputStream
B:DFSInputStream
C:DataInputStream
D:FSInputStream
正确答案问询微信:424329
优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活
提供嵌入式文档功能的数据库是()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329
Pregel计算模型中每个顶点ID的类型是()
A:String
B:Int
C:Double
D:结构体
正确答案问询微信:424329
Timetoast是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
UMP系通过()来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器
正确答案问询微信:424329
Storm框架不适用于哪个领域()。
A:实时分析
B:实时交通
C:远程RPC
D:历史记录查询
正确答案问询微信:424329
应用于分布式数据存储与管理
数据在地理上分布于多个数据中心的应用程序的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329
Gephi是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
A:垂直扩展
B:水平扩展
C:拓扑扩展
D:叠加
正确答案问询微信:424329
以下哪层不属于物联网体系架构()。
A:应用层
B:采集层
C:网络层
D:感知层
正确答案问询微信:424329
Hbase中Zookeeper文件记录了()的位置
A:.META.表
B:-ROOT-表
C:Region
D:Master
正确答案问询微信:424329
以下针对Hive的说法不正确的是()。
A:Hive是一个基于Hadoop的数据仓库工具
B:Hive是关系数据库
C:Hive QL是一种查询语言
D:Hive可以提供查询分析存储等功能
正确答案问询微信:424329
HDFS中FSDataOutputStream封装了()
A:HDFSOutputStream
B:DFSOutputStream
C:DataOutputStream
D:FSOutputStream
正确答案问询微信:424329
Hadoop中执行MapReduce任务不含哪种方式()。
A:Mahout
B:Hadoop jar
C:Shell脚本
D:Python
正确答案问询微信:424329
hadoop fs -() 命令可以将指定的文件的内容输出到标准输出
A:cat
B:append
C:add
D:write
正确答案问询微信:424329
Hbase中采用()保证系统出错时及时恢复
A:MemStore
B:Hlog
C:StoreFile
D:客户端
正确答案问询微信:424329
对于不同顶点之间的信息交换,Pregel采用了()
A:远程数据读取
B:共享内存
C:纯消息传递模型
D:共享消息
正确答案问询微信:424329
UMP系奥鹏南开大学23年秋季新学期作业参考统中面对多个小规模用户如何进行资源调度()
A:可以共享同一个MySQL实例
B:每个用户独占一个MySQL实例
C:会占用多个独立的MySQL实例
D:随机分配MySQL实例
正确答案问询微信:424329
MapReduce处理关系的()运算时,Map过程需要记录元组的信息及该元组来源。
A:投影
B:差
C:交
D:并
正确答案问询微信:424329
UMP系统借助于()来实现各个节点之间的通信
A:Mnesia
B:LVS
C:RabbitMQ
D:Zookeeper
正确答案问询微信:424329
NoSQL中的CAP理论中的C代表()
A:一致性
B:可用性
C:分区容忍性
D:可扩展性
正确答案问询微信:424329
MapReduce可以解决哪些计算问题()。
A:矩阵乘法
B:关系代数运算
C:聚合运算
D:关系投影运算
正确答案问询微信:424329
以下亚马逊的产品中哪个属于存储部分
A:EC2
B:EBS
C:S3
D:ELB
正确答案问询微信:424329
以下包含在Hadoop项目中的有()。
A:Ambari
B:Redis
C:MongoDB
D:Pig
E:Sqoop
正确答案问询微信:424329
Hbase的Region服务器中用户数据首先被写入到()
A:MemStore
B:Hlog
C:StoreFile
D:客户端
正确答案问询微信:424329
以下哪些可以提供计算服务()。
A:Spark
B:Tez
C:Mahout
D:MapReduce
E:YARN
正确答案问询微信:424329
以下哪种数据库属于NoSQL数据库()
A:SimpleDB
B:BigTable
C:MongoDB
D:GraphDB
正确答案问询微信:424329
大数据的特征是()。
A:数据体量大
B:数据产生速度快
C:数据种类多
D:数据计算快
E:数据价值高
正确答案问询微信:424329
哪些是谷歌在后Hadoop时代的新“三驾马车”()
A:MapReduce
B:Caffeine
C:Dremel
D:Pregel
正确答案问询微信:424329
流计算的采集阶段需要保证()。
A:实时性
B:大量
C:低延迟
D:稳定可靠
正确答案问询微信:424329
关于MapReduce,说法正确的是()。
A:MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave
B:Hadoop框架是用Java实现的,因此MapReduce应用程序要用Java来写
C:MapReduce模型的核心是Map函数和Reduce函数
D:MapReduce将一个存储在分布式文件系统中的大规模数据集,切分成许多独立的分片
正确答案问询微信:424329
亚马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层
A:对
B:错
正确答案问询微信:424329
CAP理论告诉我们,一个分布式系统可以同时满足一致性、可用性和分区容忍性这三个需求
A:对
B:错
正确答案问询微信:424329
Hbase中表在水平方向由一个或者多个列族组成,一个列族中可以包含任意多个列,同一个列族里面的数据存储在一起
A:对
B:错
正确答案问询微信:424329
Pregel将PageRank处理对象看成是连通图,而MapReduce则将其看成是键值对
A:对
B:错
正确答案问询微信:424329
Facebook主要将Hadoop平台用于日志处理、推荐系统等方面
A:对
B:错
正确答案问询微信:424329
Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储
A:对
B:错
正确答案问询微信:424329
大数据开发的两大核心技术是Hadoop和MapReduce
A:对
B:错
正确答案问询微信:424329
Storm中的Tuple是一个Key-Value的Map,但也可以填入一个Value-List。
A:对
B:错
正确答案问询微信:424329
HBase中执行更新操作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍然保留
A:对
B:错
正确答案问询微信:424329
图算法如果用MapReduce实现,需要一系列的MapReduce的调用。从一个阶段到下一个阶段,它需要传递整个图的状态,会产生大量不必要的序列化和反序列化开销。而Pregel使用超步简化了这个过程
A:对
B:错
正确答案问询微信:424329