南开大学23年春《大数据开发技术(一)》在线作业三
奥鹏南开大学新学期作业参考
23春学期(仅限-高起专1903、专升本1903)《大数据开发技术(一)》在线作业-00003
Amazon Redshift属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
正确答案问询微信:424329
MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。
A:数据向计算靠拢
B:计算向数据靠拢
C:计算向网络靠拢
D:计算与数据并行
正确答案问询微信:424329
以下亚马逊的产品中哪个是数据仓库
A:ElastiCache
B:RDS
C:DynamoDB
D:Redshift
正确答案问询微信:424329
关于Storm中Topology说法错误的是()。
A:Topology可视为流转换图
B:Topology可以被提交到Storm集群执行
C:在Topology里面可以指定每个组件的并行度, Storm会在集群里面分配那么多的线程来同时计算
D:Topology里面的每一个组件都是串行运行的
正确答案问询微信:424329
BigTable采用()作为底层数据存储
A:HDFS
B:GFS
C:Hbase
D:传统文件系统
正确答案问询微信:424329
以下不属于物联网关键技术的是()。
A:RFID
B:传感器
C:交换机
D:矩阵式二维码
正确答案问询微信:424329
以下说法不正确的是()。
A:MapReduce的核心思想就是“分面治之”
B:HDFS是对GFS的开源实现
C:MapReduce是一种分布式计算模型
D:HDFS采用HBase作为其底层数据存储
正确答案问询微信:424329
SQL Azure体系结构层中哪层是硬件和操作系统
A:Client Layer
B:Services Layer
C:Platform Layer
D:Infrastructure Layer
正确答案问询微信:424329
hadoop fs -() 命令可以显示指定的文件的详细信息
A:ll
B:ls
C:dir
D:show
正确答案问询微信:424329
关于Reduce端Shuffle过程,说法正确的是()。
A:Reduce领取数据先放入缓存,来自不同Map机器,先合并,再归并,写入磁盘
B:多个溢写文件归并最后只能形成一个大文件
C:当数据很少时,也要溢写到磁盘
D:Reduce任务通过RPC向JobTracker询问Map任务是否已经完成
正确答案问询微信:424329
Hbase中客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的()位置信息,用来加快后续数据访问过程
A:Master
B:Slaver
C:Region
D:客户端
正确答案问询微信:424329
以下针对Hive的说法不正确的是()。
A:Hive是一个基于Hadoop的数据仓库工具
B:Hive是关系数据库
C:Hive QL是一种查询语言
D:Hive可以提供查询分析存储等功能
正确答案问询微信:424329
D3是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
Google Cloud SQL是谷歌公司推出的基于()的云数据库
A:MySQL
B:SQL Server
C:Hbase
D:Oracle
正确答案问询微信:424329
对于不同顶点之间的信息交换,Pregel采用了()
A:远程数据读取
B:共享内存
C:纯消息传递模型
D:共享消息
正确答案问询微信:424329
Weka是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案问询微信:424329
HDFS读数据过程中()具体实现了FileSystem
A:DistributedFileSystem
B:GFSSystem
C:FileSystem
D:HDFSSystem
正确答案问询微信:424329
以下哪种属于文档数据库()
A:MongoDB
B:Redis
C:Hbase
D:Neo4j
正确答案问询微信:424329
UMP系统中面对中等规模用户如何进行资源调度()
A:可以共享同一个MySQL实例
B:每个用户独占一个MySQL实例
C:会占用多个独立的MySQL实例
D:随机分配MySQL实例
正确答案问询微信:424329
关于分布式并行编程,以下说法错误的是()。
A:“摩尔定律”,CPU性能大约每隔12个月翻一番
B:“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C:分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D:谷歌公司最先提出了分布式并行编程模型MapReduce
正确答案问询微信:424329
hadoop fs -() 命令可以将指定的文件的内容输出到标准输出
A:cat
B:append
C:add
D:write
正确答案问询微信:424329
Amazon RDS属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
正确答案问询微信:424329
以下哪层不属于物联网体系架构()。
A:应用层
B:采集层
C:网络层
D:感知层
正确答案问询微信:424329
很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。
A:动态
B:存量
C:实时
D:静态
正确答案问询微信:424329
以下哪个命令是Ubuntu中创建系统用户的命令()。
A:adduser
B:useradd
C:sudo
D:sudo user
正确答案问询微信:424329
Pregel计算模型中每个顶点ID的类型是()
A:String
B:Int
C:Double
D:结构体
正确答案问询微信:424329
关于Strom中Bolt说法错误的是()。
A:Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
B:Bolt是一个被动的角色,Spout是一个主动的角色
C:Bolt不仅可以处理Tuple还可以创建新的Tuple
D:Bolt是Streams的状态转换过程的抽象含义
正确答案问询微信:424329
HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
A:垂直扩展
B:水平扩展
C:拓扑扩展
D:叠加
正确答案问询微信:424329
1秒定律体现了大数据的哪个特征()。
A:数据量大
B:数据产生速度快
C:数据存储快
D:数据计算快
正确答案问询微信:424329
Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。
A:Shuffle奥鹏南开大学新学期作业参考 代做2元一门Grouping
B:AllGrouping
C:GlobalGrouping
D:FiedlsGrouping
正确答案问询微信:424329
以下属于流计算框架的是()。
A:Twitter Storm
B:Spark
C:MapReduce
D:Pregel
E:Yahoo! S4
正确答案问询微信:424329
以下哪种数据库属于NoSQL数据库()
A:SimpleDB
B:BigTable
C:MongoDB
D:GraphDB
正确答案问询微信:424329
传统的数据处理流程的前提是()。
A:存储的数据是旧的
B:存储的数据是实时的
C:需要用户主动发出查询
D:不需要用户主动发出查询
正确答案问询微信:424329
以下哪些是云数据库产品()
A:Dynamo
B:SimpleDB
C:RDS
D:SQL Server
正确答案问询微信:424329
HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
A:FsImage
B:DataNode
C:Block
D:EditLog
正确答案问询微信:424329
关系数据库与NoSQL数据库相比适用于哪些领域()
A:电信
B:银行
C:互联网企业大数据处理
D:传统企业的数据分析
正确答案问询微信:424329
以下哪种数据库属于NoSQL数据库()
A:MySQL
B:DynamoDB
C:InfiniteGraph
D:MongoDB
正确答案问询微信:424329
以下哪些属于典型的大数据应用()。
A:谷歌搜索
B:谷歌流感趋势
C:谷歌统计
D:《纸牌屋》制作
E:《黑镜子》制作
正确答案问询微信:424329
HDFS要实现的目标
A:流数据读写
B:大数据集的操作
C:复杂的文件模型
D:强大的跨平台兼容性
正确答案问询微信:424329
关于MapReduce,说法正确的是()。
A:MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave
B:Hadoop框架是用Java实现的,因此MapReduce应用程序要用Java来写
C:MapReduce模型的核心是Map函数和Reduce函数
D:MapReduce将一个存储在分布式文件系统中的大规模数据集,切分成许多独立的分片
正确答案问询微信:424329
"hadoop dfs"和"hdfs dfs"两条命令都只是用于HDFS文件系统
A:对
B:错
正确答案问询微信:424329
Hadoop平台在大数据发展的成熟期时开始大行其道
A:对
B:错
正确答案问询微信:424329
关系数据库的关键特性包括完善的事务机制和高效的查询机制
A:对
B:错
正确答案问询微信:424329
MapReduce中TaskTracker使用“slot”等量划分本节点上的资源量。
A:对
B:错
正确答案问询微信:424329
Hadoop可以在单节点上以伪分布式的方式运行,Hadoop进程以分离的Java进程来运行,节点既作为NameNode也作为DataNode,同时,读取的是HDFS中的文件。
A:对
B:错
正确答案问询微信:424329
云数据库可以满足中小企业的低成本数据存储需求
A:对
B:错
正确答案问询微信:424329
文件块的大小和副本个数只能由系统指定。
A:对
B:错
正确答案问询微信:424329
Linux系统中只有Ubuntu可以安装Hadoop。
A:对
B:错
正确答案问询微信:424329
Hbase中表在垂直方向由一个或者多个列族组成,一个列族中可以包含任意多个列,同一个列族里面的数据存储在一起
A:对
B:错
正确答案问询微信:424329
在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在
A:对
B:错
正确答案问询微信:424329