南开大学23年春《大数据开发技术(一)》在线作业一
奥鹏南开大学新学期作业参考
23春学期(仅限-高起专1903、专升本1903)《大数据开发技术(一)》在线作业-00001
UMP系统中面对中等规模用户如何进行资源调度()
A:可以共享同一个MySQL实例
B:每个用户独占一个MySQL实例
C:会占用多个独立的MySQL实例
D:随机分配MySQL实例
正确答案问询微信:424329
Hbase在寻址过程客户端只需询问Zookeeper服务器,不需要链接()
A:Master
B:Region
C:Zookeeper
D:Chubby
正确答案问询微信:424329
以下说法不正确的是()。
A:MapReduce的核心思想就是“分面治之”
B:HDFS是对GFS的开源实现
C:MapReduce是一种分布式计算模型
D:HDFS采用HBase作为其底层数据存储
正确答案问询微信:424329
Hbase中-ROOT-表有()个Region
A:1
B:10
C:10-1000
D:0
正确答案问询微信:424329
HDFS中FSDataOutputStream封装了()
A:HDFSOutputStream
B:DFSOutputStream
C:DataOutputStream
D:FSOutputStream
正确答案问询微信:424329
静态数据采取()计算模式
A:批量
B:实时
C:大数据
D:动态
正确答案问询微信:424329
SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层
A:Client Layer
B:Services Layer
C:Platform Layer
D:Infrastructure Layer
正确答案问询微信:424329
应用于存储、索引并管理面向文档的数据或者类似的半结构化数据,比如,用于后台具有大量读写操作的网站的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329
关于Reduce端Shuffle过程,说法正确的是()。
A:Reduce领取数据先放入缓存,来自不同Map机器,先合并,再归并,写入磁盘
B:多个溢写文件归并最后只能形成一个大文件
C:当数据很少时,也要溢写到磁盘
D:Reduce任务通过RPC向JobTracker询问Map任务是否已经完成
正确答案问询微信:424329
奥鹏南开大学新学期作业参考 代做2元一门
Storm框架不适用于哪个领域()。
A:实时分析
B:实时交通
C:远程RPC
D:历史记录查询
正确答案问询微信:424329
以下哪种属于列族数据库()
A:MongoDB
B:Redis
C:Hbase
D:Neo4j
正确答案问询微信:424329
Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。
A:ShuffleGrouping
B:AllGrouping
C:GlobalGrouping
D:FiedlsGrouping
正确答案问询微信:424329
以下哪个是HDFS的局限性()。
A:吞吐率
B:数据集
C:兼容性
D:延迟
正确答案问询微信:424329
R是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
关于Strom中Bolt说法错误的是()。
A:Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
B:Bolt是一个被动的角色,Spout是一个主动的角色
C:Bolt不仅可以处理Tuple还可以创建新的Tuple
D:Bolt是Streams的状态转换过程的抽象含义
正确答案问询微信:424329
针对流数据,“量子恒道”可处理每天()级的实时流数据
A:TB
B:PB
C:GB
D:MB
正确答案问询微信:424329
应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329
关于分布式并行编程,以下说法错误的是()。
A:“摩尔定律”,CPU性能大约每隔12个月翻一番
B:“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C:分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D:谷歌公司最先提出了分布式并行编程模型MapReduce
正确答案问询微信:424329
以下哪个不属于MongoDB的特点
A:提供了面向文档的存储
B:可以设置任何属性索引
C:具有很好的垂直可扩展性
D:支持丰富的查询表达式
正确答案问询微信:424329
关于MapReduce中Shuffle过程,说法错误的是()。
A:Shuffle过程中为每个Map任务分配一个缓存
B:Shuffle过程中分区默认采用哈希函数
C:Shulle过程的合并会改变最终结果
D:Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。
正确答案问询微信:424329
Leaflet是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
HDFS中ClientProtocal的()方法可以查找下一个数据块
A:getBlock
B:getBlockLocations
C:getLocation
D:nextBlock
正确答案问询微信:424329
使用Amazon云环境部署Hadoop的说法中错误的是()。
A:Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
B:Hadoop自带有一套脚本,用于在EC2上面运行Hadoop
C:在EC2上运行Hadoop尤其适用于一些工作流
D:Amazon EC2为Hadoop提供了存储服务
正确答案问询微信:424329
UMP系统借助于()来实现集群内部的负载均衡
A:Mnesia
B:LVS
C:RabbitMQ
D:Zookeeper
正确答案问询微信:424329
UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器
正确答案问询微信:424329
Amazon RDS属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
正确答案问询微信:424329
以下哪种属于键值数据库()
A:MongoDB
B:Redis
C:Hbase
D:Neo4j
正确答案问询微信:424329
SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层
A:Client Layer
B:Services Layer
C:Platform Layer
D:Infrastructure Layer
正确答案问询微信:424329
行式数据库采用()存储模型
A:NSM
B:DSM
C:Hbase
D:MySQL
正确答案问询微信:424329
Hbase中采用()保证系统出错时及时恢复
A:MemStore
B:Hlog
C:StoreFile
D:客户端
正确答案问询微信:424329
已得到广泛应用的分布式文件系统主要包括()。
A:GFS
B:MapReduce
C:Hbase
D:HDFS
正确答案问询微信:424329
关于Map端Shuffle过程中的合并与归并,说法正确的是()。
A:两个键值对和,如果合并,会得到
B:合并不会改变最终结果
C:两个键值对和,如果归并,会得到
D:两个键值对和,如果归并,会得到>
正确答案问询微信:424329
以下属于Hadoop的安装方式的有()。
A:单机模式
B:多机模式
C:分布式模式
D:并行模式
E:伪分布式模式
正确答案问询微信:424329
以下哪种数据库属于NoSQL数据库()
A:关系数据库
B:键值数据库
C:文档数据库
D:分布式数据库
正确答案问询微信:424329
以下属于流计算框架的是()。
A:Twitter Storm
B:Spark
C:MapReduce
D:Pregel
E:Yahoo! S4
正确答案问询微信:424329
流计算系统的需求有()。
A:实时性
B:廉价
C:高性能
D:高带宽
E:分布式
正确答案问询微信:424329
HDFS提供了()可以通过客户端访问文件系统。
A:类似Shell的命令行
B:可视化窗口
C:Java API
D:Web API
正确答案问询微信:424329
MapReduce与传统并行计算框架的对比中,说法正确的是()。
A:MapReduce属于共享式集群架构,容错性好
B:传统并行计算框架比MapReduce硬件更加便宜
C:传统并行计算框架适用于实时、细粒度计算
D:MapReduce适用于数据密集型,传统并行计算框架适用于计算密集型
正确答案问询微信:424329
以下哪种数据库是针对在线业务的,并且抛弃了关系模型()
A:MongoDB
B:MySQL
C:Oracle
D:Redis
正确答案问询微信:424329
以下哪些是数据可视化时间线工具()
A:Echarts
B:Timetoast
C:Xtimeline
D:R
正确答案问询微信:424329
感知式系统的广泛使用
人类社会数据量第三次大的飞跃最终导致了大数据的产生。
A:对
B:错
正确答案问询微信:424329
早期对于流计算的研究多数是基于对传统数据库处理的流式化,即实时数据库,很少研究流计算框架
A:对
B:错
正确答案问询微信:424329
分布式离线分析可以实现秒级别的实时分析响应。
A:对
B:错
正确答案问询微信:424329
MapReduce中TaskTracker使用“slot”等量划分本节点上的资源量。
A:对
B:错
正确答案问询微信:424329
CAP理论告诉我们,一个分布式系统可以同时满足一致性、可用性和分区容忍性这三个需求
A:对
B:错
正确答案问询微信:424329
MapReduce执行程序时可以直接运行.class文件
A:对
B:错
正确答案问询微信:424329
云数据库不可以满足企业动态变化的数据存储需求
A:对
B:错
正确答案问询微信:424329
在传统的文件系统中,为了提高磁盘读写效率,一般以数据块为单位
A:对
B:错
正确答案问询微信:424329
在Pregel中, “标志位”和输入消息队列是分开保存的
A:对
B:错
正确答案问询微信:424329
Linux系统中只有Ubuntu可以安装Hadoop。
A:对
B:错
正确答案问询微信:424329