南开大学23年秋学期《大数据开发技术(一)》在线作业一

奥鹏南开大学23年秋季新学期作业参考

23秋学期(仅限-高起专1909、专升本1909)《大数据开发技术(一)》在线作业-00001

以下亚马逊的产品中哪个是NoSQL数据库
A:RDS
B:SimpleDB
C:DynamoDB
D:Redshift
正确答案问询微信:424329

()可解决HDFS中名称节点运行期间EditLog不断变大的问题
A:NameNode
B:SecondaryNameNode
C:DataNode
D:Block
正确答案问询微信:424329

UMP系统中面对多个小规模用户如何进行资源调度()
A:可以共享同一个MySQL实例
B:每个用户独占一个MySQL实例
C:会占用多个独立的MySQL实例
D:随机分配MySQL实例
正确答案问询微信:424329

针对流数据,“量子恒道”可处理每天()级的实时流数据
A:TB
B:PB
C:GB
D:MB
正确答案问询微信:424329

UMP系通过()来实现实现数据路由的基本功能
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器
正确答案问询微信:424329

R是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329

Hbase中()是最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求
A:Master
B:Slaver
C:Regio服务器n
D:客户端
正确答案问询微信:424329

Amazon DynamoDB属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
正确答案问询微信:424329

针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
A:Time Tunnel
B:Spark
C:Super Mario
D:Storm
正确答案问询微信:424329

以下哪种不属于为大数据时代提供关键技术支撑的信息科技变化()。
A:网络宽带不断增加
B:存储设备容量不断增加
C:CPU处理能大幅提升
D:存储设备尺寸不断减小
正确答案问询微信:424329

Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。
A:ShuffleGrouping
B:AllGrouping
C:GlobalGrouping
D:FiedlsGrouping
正确答案问询微信:424329

关于MapReduce中Shuffle过程,说法错误的是()。
A:Shuffle过程中为每个Map任务分配一个缓存
B:Shuffle过程中分区默认采用哈希函数
C:Shulle过程的合并会改变最终结果
D:Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。
正确答案问询微信:424329

NoSQL中的CAP理论中的A代表()
A:一致性
B:可用性
C:分区容忍性
D:可扩展性
正确答案问询微信:424329

以下亚马逊的产品中哪个是分布式内存缓存
A:ElastiCache
B:RDS
C:DynamoDB
D:Redshift
正确答案问询微信:424329

Map Task和Reduce Task均由()启动。
A:Client
B:Job Tracker
C:Task
D:Task Tracker
正确答案问询微信:424329

应用于专门用于处理具有高度相互关联关系的数据,比较适合于社交网络的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329

HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
A:垂直扩展
B:水平扩展
C:拓扑扩展
D:叠加
正确答案问询微信:424329

Amazon Redshift属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
正确答案问询微信:424329

以下说法不正确的是()。
A:Zookeeper提供分布式锁之类的基本服务
B:Mahout提供了分布式存储服务
C:Flume提供了日志管理服务
D:Sqoop主要被用于数据交互操作
正确答案问询微信:424329

SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层
A:Client Layer
B:Services Layer
C:Platform Layer
D:Infrastructure Layer
正确答案问询微信:424329

列式数据库采用()存储模型
A:NSM
B:DSM
C:Hbase
D:MySQL
正确答案问询微信:424329

Amazon RDS属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
正确答案问询微信:424329

在Storm的工作流程中,对于Supervisor说法错误的是()。
A:Supervisor会去Zookeeper集群上认领自己的Task
B:Supervisor节点首先将提交的Topology进行分片,分成一个个Task,分配给相应的Nimbus
C:Supervisor会将Task和相关的信息提交到Zookeeper集群上
D:Supervisor会通知自己的Worker进程进行Task的处理
正确答案问询微信:424329

MapReduce中最优的Reduce任务个数取决于集群中可用的()的数目。
A:Split
B:Slot
C:Map
D:Shuffle
正确答案问询微信:424329

Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。
A:ShuffleGrouping
B:AllGrouping
C:GlobalGrouping
D:FiedlsGrouping
正确答案问询微信:424329

大数据摩尔定律体现了大数据的哪个体征()。
A:数据体量大
B:数据产生速度快
C:数据种类多
D:数据计算快
E:数据价值高
正确答案问询微信:424329

Amazon SimpleDB属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
正确答案问询微信:424329

关于Storm中Topology说法错误的是()。
A:Topology可视为流转换图
B:Topology可以被提交到Storm集群执行
C:在Topology里面可以指定每个组件的并行度, Storm会在集群里面分配那么多的线程来同时计算
D:Topology里面的每一个组件都是串行运行的
正确答案问询微信:424329

UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器
正确答案问询微信:424329

以下哪种属于图数据库()
A:MongoDB
B:Redis
C:Hbase
D:Neo4j
正确答案问询微信:424329

流计算的采集阶段需要保证()。
A:实时性
B:大量
C:低延迟
D:稳定可靠
正确答案问询微信:424329

HDFS中NameNode保存的核心数据结构是()
A:FsImage
B:DataNode
C:Block
D:EditLog
正确答案问询微信:424329

关系数据库与NoSQL数据库相比适用于哪些领域()
A:电信
B:银行
C:互联网企业大数据处理
D:传统企业的数据分析
正确答案问询微信:424329

HDFS的命名空间包含()
A:节点
B:目录
C:文件
D:块
正确答案问询微信:424329

以下哪些是数据可视化时间线工具()
A:Echarts
B:Timetoast
C:Xtimeline
D:R
正确答案问询微信:424329

关于MapReduce,说法正确的是()。
A:MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave
B:Hadoop框架是用Java实现的,因此MapReduce应用程序要用Java来写
C:MapReduce模型的核心是Map函数和Reduce函数
D:MapReduce将一个存储在分布式文件系统中的大规模数据集,切分成许多独立的分片
正确答案问询微信:424329

以下哪种数据库属于NoSQL数据库()
A:MongoDB
B:Oracle
C:Neo4j
D:Redis
E:Hbase
正确答案问询微信:424329

流计算是针对流数据的实时计算,可以应用在()场景中
A:广告投放
B:气候模拟预测
C:机器翻译
D:推荐系统
正确答案问询微信:424329

哪些是谷歌在后Hadoop时代的新“三驾马车”()
A:MapReduce
B:Caffeine
C:Dremel
D:Pregel
正确答案问询微信:424329

大数据的特征是()。
A:数据体量大
B:数据产生速度快
C:数据种类多
D:数据计算快
E:数据价值高
正确答案问询微信:424329

Hbase中列族支持动态扩展,可以很轻松地添加一个列族或列
A:对
B:错
正确答案问询微信:424329

NoSQL数据库可以完全取代关系数据库
A:对
B:错
正确答案问询微信:424329

HDFS只允许一个文件有一个写入者,不允许多个用户对同一个文件执行写操作
A:对
B:错
正确答案问询微信:424329

HDFS读数据过程中读取请求获得的输入流是FSInputStream
A:对
B:错
正确答案问询微信:424329

Hbase中缓存刷新,每次刷写都生成一个新的StoreFile文件,因此,每个Store包含多个StoreFile文件
A:对
B:错
正确答案问询微信:424329

图算法如果用MapReduce实现,需要一系列的MapReduce的调用。从一个阶段到下一个阶段,它需要传递整个图的状态,会产生大量不必要的序列化和反序列化开销。而Pregel使用超步简化了这个过程
A:对
B:错
正确答案问询微信:424329

传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。
A:对
B:错
正确答案问询微信:424329

Hbase中表在垂直方向由一个或者多个列族组奥鹏南开大学23年秋季新学期作业参考成,一个列族中可以包含任意多个列,同一个列族里面的数据存储在一起
A:对
B:错
正确答案问询微信:424329

Hadoop是典型的批处理模型
A:对
B:错
正确答案问询微信:424329

Pregel将PageRank处理对象看成是连通图,而MapReduce则将其看成是键值对
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网