南开大学23年春学期《大数据开发技术(一)》在线作业二

奥鹏南开大学新学期作业参考

23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《大数据开发技术(一)》在线作业-00002

关于Storm中Topology说法错误的是()。
A:Topology可视为流转换图
B:Topology可以被提交到Storm集群执行
C:在Topology里面可以指定每个组件的并行度, Storm会在集群里面分配那么多的线程来同时计算
D:Topology里面的每一个组件都是串行运行的
正确答案问询微信:424329

Leaflet是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329

Google Chart API是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329

Weka是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329

Hbase中Zookeeper文件记录了()的位置
A:.META.表
B:-ROOT-表
C:Region
D:Master
正确答案问询微信:424329

优点是查找速度快,可扩展性强,容易进行分布式扩展,复杂性低的数据库是()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329

SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层
A:Client Layer
B:Services Layer
C:Platform Layer
D:Infrastructure Layer
正确答案问询微信:424329

NoSQL中的CAP理论中的P代表()
A:一致性
B:可用性
C:分区容忍性
D:可扩展性
正确答案问询微信:424329

UMP系统中面对分库分表用户如何进行资源调度()
A:可以共享同一个MySQL实例
B:每个用户独占一个MySQL实例
C:会占用多个独立的MySQL实例
D:随机分配MySQL实例
正确答案问询微信:424329

信息技术发展史上的第三次信息化浪潮解决的问题是什么()。
A:信息处理
B:信息增长
C:信息爆炸
D:信息传输
正确答案问询微信:424329

hadoop fs -() 命令可以将指定的文件的内容输出到标准输出
A:cat
B:append
C:add
D:write
正确答案问询微信:424329

Hadoop中执行MapReduce任务不含哪种方式()。
A:Mahout
B:Hadoop jar
C:Shell脚本
D:Python
正确答案问询微信:424329

应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329

Echarts是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329

MapReduce中最优的Reduce任务个数取决于集群中可用的()的数目。
A:Split
B:Slot
C:Map
D:Shuffle
正确答案问询微信:424329

优点是扩展性好,灵活性好,大量写操作时性能高的数据库是()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329

UMP系统借助于()来实现高效和可靠的协同工作
A:Mnesia
B:LVS
C:RabbitMQ
D:Zookeeper
正确答案问询微信:424329

对于不同顶点之间的信息交换,Pregel采用了()
A:远程数据读取
B:共享内存
C:纯消息传递模型
D:共享消息
正确答案问询微信:424329

Hbase中客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的()位置信息,用来加快后续数据访问过程
A:Master
B:Slaver
C:Region
D:客户端
正确答案问询微信:424329

流数据采取()计算模式
A:批量
B:实时
C:大数据
D:动态
正确答案问询微信:424329

应用于存储、索引并管理面向文档的数据或者类似的半结构化数据,比如,用于后台具有大量读写操作的网站的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329

Amazon RDS属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
正确答案问询微信:424329

优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()
A:列族奥鹏南开大学新学期作业参考 代做2元一门数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329

Hbase中采用()保证系统出错时及时恢复
A:MemStore
B:Hlog
C:StoreFile
D:客户端
正确答案问询微信:424329

Google Cloud SQL是谷歌公司推出的基于()的云数据库
A:MySQL
B:SQL Server
C:Hbase
D:Oracle
正确答案问询微信:424329

针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
A:Time Tunnel
B:Spark
C:Super Mario
D:Storm
正确答案问询微信:424329

HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量()冗余因子
A:大于
B:小于
C:等于
D:大于等于
正确答案问询微信:424329

NoSQL中的CAP理论中的A代表()
A:一致性
B:可用性
C:分区容忍性
D:可扩展性
正确答案问询微信:424329

Pregel计算模型以()作为输入
A:有向图
B:无向图
C:矢量图
D:树
正确答案问询微信:424329

HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
A:垂直扩展
B:水平扩展
C:拓扑扩展
D:叠加
正确答案问询微信:424329

以下哪些是云计算关键技术()。
A:虚拟化
B:分布式计算
C:分布式存储
D:物联网
E:单租户
正确答案问询微信:424329

以下哪种数据库适合于小批量的数据处理()
A:MySQL
B:Oracle
C:Hbase
D:NosSQL
正确答案问询微信:424329

HDFS要实现的目标
A:流数据读写
B:大数据集的操作
C:复杂的文件模型
D:强大的跨平台兼容性
正确答案问询微信:424329

以下哪个是HDFS的局限性()。
A:延迟高
B:只允许对文件执行追加操作,不能执行随机写操作
C:用MapReduce处理大量小文件时,会产生过多的Map任务,线程管理开销会大大增加
D:拥有复杂的数据模型
正确答案问询微信:424329

Hbase中Zookeeper提供了()
A:分布式同步
B:组服务
C:域名服务
D:配置维护
正确答案问询微信:424329

以下属于Hadoop的安装方式的有()。
A:单机模式
B:多机模式
C:分布式模式
D:并行模式
E:伪分布式模式
正确答案问询微信:424329

关系数据库与NoSQL数据库相比有哪些优势()
A:支持事务ACID四性
B:可以支持超大规模数据存储
C:以完善的关系代数理论作为基础
D:具有强大的横向扩展能力
正确答案问询微信:424329

以下亚马逊的产品中哪个属于计算部分
A:EC2
B:EBS
C:S3
D:ELB
正确答案问询微信:424329

Hbase系统结构中包括()
A:Zookeeper服务器
B:客户端
C:Master服务器
D:Region服务器
正确答案问询微信:424329

Hadoop配置文件中说法错误的是()。
A:core-site.xml中hadoop.tmp.dir表示存放临时数据的目录,仅为NameNode的数据
B:core-site.xml中fs.defaultFS表示HDFS路径的逻辑名称
C:hdfs-site.xml中dfs.namenode.name.dir表示存储fsimage文件的地方
D:hdfs-site.xml中dfs.replication表示副本的数量,伪分布式要设置为0
E:hdfs-site.xml中dfs.datanode.data.dir表示HDFS数据存放block的地方
正确答案问询微信:424329

HDFS只允许一个文件有一个写入者,不允许多个用户对同一个文件执行写操作
A:对
B:错
正确答案问询微信:424329

Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。
A:对
B:错
正确答案问询微信:424329

Hbase中每个Region 使用一个Hlog
A:对
B:错
正确答案问询微信:424329

Hbase和传统数据库一样都是列式数据库
A:对
B:错
正确答案问询微信:424329

MapReduce和Spark都属于大数据批处理计算的产品。
A:对
B:错
正确答案问询微信:424329

Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储
A:对
B:错
正确答案问询微信:424329

HDFS 在设计上采取了多种机制保证在硬件出错的环境中实现数据的完整性。
A:对
B:错
正确答案问询微信:424329

"hadoop dfs"和"hdfs dfs"两条命令都只是用于HDFS文件系统
A:对
B:错
正确答案问询微信:424329

大数据开发的两大核心技术是Hadoop和MapReduce
A:对
B:错
正确答案问询微信:424329

阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网