南开大学23年春《大数据开发技术(一)》在线作业二

奥鹏南开大学新学期作业参考

23春学期(仅限-高起专1903、专升本1903)《大数据开发技术(一)》在线作业-00002

以下亚马逊的产品中哪个是数据仓库
A:ElastiCache
B:RDS
C:DynamoDB
D:Redshift
正确答案问询微信:424329

以下亚马逊的产品中哪个是NoSQL数据库
A:RDS
B:SimpleDB
C:DynamoDB
D:Redshift
正确答案问询微信:424329

关于Reduce端Shuffle过程,说法正确的是()。
A:Reduce领取数据先放入缓存,来自不同Map机器,先合并,再归并,写入磁盘
B:多个溢写文件归并最后只能形成一个大文件
C:当数据很少时,也要溢写到磁盘
D:Reduce任务通过RPC向JobTracker询问Map任务是否已经完成
正确答案问询微信:424329

Hbase奥鹏南开大学新学期作业参考 代做2元一门中-ROOT-表有()个Region
A:1
B:10
C:10-1000
D:0
正确答案问询微信:424329

NoSQL中的CAP理论中的C代表()
A:一致性
B:可用性
C:分区容忍性
D:可扩展性
正确答案问询微信:424329

优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329

以下哪种不属于为大数据时代提供关键技术支撑的信息科技变化()。
A:网络宽带不断增加
B:存储设备容量不断增加
C:CPU处理能大幅提升
D:存储设备尺寸不断减小
正确答案问询微信:424329

UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器
正确答案问询微信:424329

Amazon SimpleDB属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
正确答案问询微信:424329

Pregel计算模型以()作为输入
A:有向图
B:无向图
C:矢量图
D:树
正确答案问询微信:424329

HDFS中NameNode将从SecondaryNameNode接收到的新的FsImage替换旧的FsImage文件,同时将edit.new替换##文件
A:edit
B:edit.old
C:FsImage
D:EditLog
正确答案问询微信:424329

Google Fusion Tables是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329

针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
A:Time Tunnel
B:Spark
C:Super Mario
D:Storm
正确答案问询微信:424329

Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。
A:ShuffleGrouping
B:AllGrouping
C:GlobalGrouping
D:FiedlsGrouping
正确答案问询微信:424329

应用于专门用于处理具有高度相互关联关系的数据,比较适合于社交网络的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329

R是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329

Amazon Redshift属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
正确答案问询微信:424329

以下说法不正确的是()。
A:MapReduce的核心思想就是“分面治之”
B:HDFS是对GFS的开源实现
C:MapReduce是一种分布式计算模型
D:HDFS采用HBase作为其底层数据存储
正确答案问询微信:424329

HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
A:垂直扩展
B:水平扩展
C:拓扑扩展
D:叠加
正确答案问询微信:424329

HDFS中()记录了每个文件中各个块所在的数据节点的位置信息
A:NameNode
B:SecondaryNameNode
C:DataNode
D:Block
正确答案问询微信:424329

SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流
A:Client Layer
B:Services Layer
C:Platform Layer
D:Infrastructure Layer
正确答案问询微信:424329

Google Chart API是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329

Echarts是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329

Hadoop启动所有进程的命令为()。
A:all-start.sh
B:all-start.exe
C:start-all.sh
D:start-all.exe
正确答案问询微信:424329

Pregel计算模型中每个顶点ID的类型是()
A:String
B:Int
C:Double
D:结构体
正确答案问询微信:424329

Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。
A:ShuffleGrouping
B:AllGrouping
C:GlobalGrouping
D:FiedlsGrouping
正确答案问询微信:424329

UMP系通过()来实现实现管理每台物理机上的MySQL实例
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器
正确答案问询微信:424329

UMP系统中面对分库分表用户如何进行资源调度()
A:可以共享同一个MySQL实例
B:每个用户独占一个MySQL实例
C:会占用多个独立的MySQL实例
D:随机分配MySQL实例
正确答案问询微信:424329

应用于分布式数据存储与管理
数据在地理上分布于多个数据中心的应用程序的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案问询微信:424329

在做人口调查时,采用对一个总样本为1亿人口的数据随机抽取1000人进行抽样调查体现了大数据的哪种思维方式()。
A:相关而非因果
B:全样而非抽样
C:效率而非精确
D:全面而非特别
正确答案问询微信:424329

以下哪些是数据可视化信息图表工具()
A:大数据魔镜
B:D3
C:Google Chart API
D:Google Fusion Tables
正确答案问询微信:424329

HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
A:FsImage
B:DataNode
C:Block
D:EditLog
正确答案问询微信:424329

以下哪个是HDFS的局限性()。
A:延迟高
B:只允许对文件执行追加操作,不能执行随机写操作
C:用MapReduce处理大量小文件时,会产生过多的Map任务,线程管理开销会大大增加
D:拥有复杂的数据模型
正确答案问询微信:424329

以下哪种数据库属于NoSQL数据库()
A:关系数据库
B:键值数据库
C:文档数据库
D:分布式数据库
正确答案问询微信:424329

以下哪种数据库适合于小批量的数据处理()
A:MySQL
B:Oracle
C:Hbase
D:NosSQL
正确答案问询微信:424329

以下属于Hadoop的安装方式的有()。
A:单机模式
B:多机模式
C:分布式模式
D:并行模式
E:伪分布式模式
正确答案问询微信:424329

Hbase系统结构中包括()
A:Zookeeper服务器
B:客户端
C:Master服务器
D:Region服务器
正确答案问询微信:424329

HDFS要实现的目标
A:流数据读写
B:大数据集的操作
C:复杂的文件模型
D:强大的跨平台兼容性
正确答案问询微信:424329

NoSQL数据库与关系数据库相比适用于哪些领域()
A:电信
B:银行
C:互联网企业大数据处理
D:传统企业的数据分析
正确答案问询微信:424329

传统的数据处理流程的前提是()。
A:存储的数据是旧的
B:存储的数据是实时的
C:需要用户主动发出查询
D:不需要用户主动发出查询
正确答案问询微信:424329

Hadoop可以在单节点上以伪分布式的方式运行,Hadoop进程以分离的Java进程来运行,节点既作为NameNode也作为DataNode,同时,读取的是HDFS中的文件。
A:对
B:错
正确答案问询微信:424329

云数据库可以满足中小企业的低成本数据存储需求
A:对
B:错
正确答案问询微信:424329

HDFS集群中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。
A:对
B:错
正确答案问询微信:424329

MapReduce中TaskTracker使用“slot”等量划分本节点上的资源量。
A:对
B:错
正确答案问询微信:424329

HDFS读数据过程中读取请求获得的输入流是FSInputStream
A:对
B:错
正确答案问询微信:424329

在传统的文件系统中,为了提高磁盘读写效率,一般以数据块为单位
A:对
B:错
正确答案问询微信:424329

Hadoop安装时要配置SSH,这是由于Hadoop数据节点需要启动集群中所有机器的Hadoop守护进程,这个过程需要通过SSH登录来实现。
A:对
B:错
正确答案问询微信:424329

在HBase 的概念视图中, 一个表可以视为一个稀疏、多维的映射关系。
A:对
B:错
正确答案问询微信:424329

大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高的延迟
A:对
B:错
正确答案问询微信:424329

HBase中包含了丰富的操作,其中会涉及复杂的多表连接。
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网