南开23春学期(高起本:1709-2103、专升本高起专:1903-2103)《大数据开发技术(一)》在线作业三
奥鹏南开大学新学期作业参考

南开大学23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《大数据开发技术(一)》在线作业
1.优点是查找速度快,可扩展性强,容易进行分布式扩展,复杂性低的数据库是()
选项A:列族数据库
选项B:键值数据库
选项C:图数据库
选项D:文档数据库
正确答案问询微信:424329
2.以下针对Hive的说法不正确的是()。
选项A:Hive是一个基于Hadoop的数据仓库工具
选项B:Hive是关系数据库
选项C:Hive QL是一种查询语言
选项D:Hive可以提供查询分析存储等功能
正确答案问询微信:424329
3.很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。
选项A:动态
选项B:存量
选项C:实时
选项D:静态
正确答案问询微信:424329
4.Hadoop启动所有进程的命令为()。
选项A:all-start.sh
选项B:all-start.exe
选项C:start-all.sh
选项D:start-all.exe
正确答案问询微信:424329
5.以下亚马逊的产品中哪个是NoSQL数据库
选项A:RDS
选项B:SimpleDB
选项C:DynamoDB
选项D:Redshift
正确答案问询微信:424329
6.HDFS中()记录了每个文件中各个块所在的数据节点的位置信息
选项A:NameNode
选项B:SecondaryNameNode
选项C:DataNode
选项D:Block
正确答案问询微信:424329
7.BigTable采用()作为底层数据存储
选项A:HDFS
选项B:GFS
选项C:Hbase
选项D:传统文件系统
正确答案问询微信:424329
8.以下亚马逊的产品中哪个是分布式内存缓存
选项A:ElastiCache
选项B:RDS
选项C:DynamoDB
选项D:Redshift
正确答案问询微信:424329
9.关于Hadoop集群网络拓扑,以下说法错误的是()。
选项A:普通的Hadoop集群结构由一个两阶网络构成
选项B:Hadoop集群中每个机架有30-40个服务器,配置一个1GB的交换机,并向上传输到一个核心交换机或者路由器
选项C:在相同的机架中的节点间的带宽的总和,要等于不同机架间的节点间的带宽总和
选项D:一般来说机架内部网络环境比机架间网络环境好
正确答案问询微信:424329
10.MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。
选项A:M
选项B:N
选项C:M-1
选项D:N-1
正确答案问询微信:424329
11.UMP系统借助于()来实现各个节点之间的通信
选项A:Mnesia
选项B:LVS
选项C:RabbitMQ
选项D:Zookeeper
正确答案问询微信:424329
12.MapReduce中()会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。
选项A:Client
选项B:Job Tracker
选项C:Task
选项D:Task Tracker
正确答案问询微信:424329
13.HDFS中NameNode将从SecondaryNameNode接收到的新的FsImage替换旧的FsImage文件,同时将edit.new替换##文件
选项A:edit
选项B:edit.old
选项C:FsImage
选项D:EditLog
正确答案问询微信:424329
14.对于不同顶点之间的信息交换,Pregel采用了()
选项A:远程数据读取
选项B:共享内存
选项C:纯消息传递模型
选项D:共享消息
正确答案问询微信:424329
15.优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活
提供嵌入式文档功能的数据库是()
选项A:列族数据库
选项B:键值数据库
选项C:图数据库
选项D:文档数据库
正确答案问询微信:424329
16.Hbase中()文件记录了-ROOT-表的位置
选项A:Master
选项B:Region
选项C:Zookeeper
选项D:Chubby
正确答案问询微信:424329
17.HDFS中SecondaryNameNode可减少()重启的时间
选项A:NameNode
选项B:SecondaryNameNode
选项C:DataNode
选项D:Block
正确答案问询微信:424329
18.Hbase中Zookeeper文件记录了()的位置
选项A:.META.表
选项B:-ROOT-表
选项C:Region
选项D:Master
正确答案问询微信:424329
19.以下哪种属于图数据库()
选项A:MongoDB
选项B:Redis
选项C:Hbase
选项D:Neo4j
正确答案问询微信:424329
20.UMP系统中面对分库分表用户如何进行资源调度()
选项A:可以共享同一个MySQL实例
选项B:每个用户独占一个MySQL实例
选项C:会占用多个独立的MySQL实例
选项D:随机分配MySQL实例
正确答案问询微信:424329
21.MongoDB将数据存储为一个()
选项A:关系
选项B:属性
选项C:字段
选项D:文档
正确答案问询微信:424329
22.1秒定律体现了大数据的哪个特征()。
选项A:数据量大
选项B:数据产生速度快
选项C:数据存储快
选项D:数据计算快
正确答案问询微信:424329
23.Pregel计算模型中每个顶点ID的类型是()
选项A:String
选项B:Int
选项C:Double
选项D:结构体
正确答案问询微信:424329
24.Hbase中采用()保证系统出错时及时恢复
选项A:MemStore
选项B:Hlog
选项C:StoreFile
选项D:客户端
正确答案问询微信:424329
25.Storm框架在处理()上比MapReduce更有优势。
选项A:静态数据
选项B:流数据
选项C:批量数据
选项D:网络数据
正确答案问询微信:424329
26.以下哪个是HDFS的局限性()。
选项A:吞吐率
选项B:数据集
选项C:兼容性
选项D:延迟
正确答案问询微信:424329
27.HDFS读数据过程中()具体实现了FileSystem
选项A:DistributedFileSystem
选项B:GFSSystem
选项C:FileSystem
选项D:HDFSSystem
正确答案问询微信:424329
28.Amazon DynamoDB属于()
选项A:关系数据库
选项B:键值数据库
选项C:NoSQL数据库
选项D:数据仓库
正确答案问询微信:424329
29.列式数据库采用()存储模型
选项A:NSM
选项B:DSM
选项C:Hbase
选项D:MySQL
正确答案问询微信:424329
30.应用于专门用于处理具有高度相互关联关系的数据,比较适合于社交网络的数据库是哪种()
选项A:列族数据库
选项B:键值数据库
选项C:图数据库
选项D:文档数据库
正确答案问询微信:424329
31.Hbase提供了哪些访问接口?
选项A:Pig
选项B:Hive
选项C:Zookeeper
选项D:Java API
正确答案问询微信:424329
32.哪些是谷歌在后Hadoop时代的新“三驾马车”()
选项A:MapReduce
选项B:Caffeine
选项C:Dremel
选项D:Pregel
正确答案问询微信:424329
33.以下属于流计算框架的是()。
选项A:Twitter Storm
选项B:Spark
选项C:MapReduce
选项D:Pregel
选项E:Yahoo! S4
正确答案问询微信:424329
34.流计算处理流程三个主要阶段是()。
选项A:实时采集
选项B:实时存储
选项C:实时计算
选项D:实时查询
正奥鹏南开大学新学期作业参考确答案问询微信:424329
35.以下哪些应用场景属于大规模图或者网络的呈现形式?()
选项A:社交网络
选项B:传染病传播途径
选项C:交通事故对路网的影响
选项D:广告推荐
正确答案问询微信:424329
36.关于MapReduce,说法正确的是()。
选项A:MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave
选项B:Hadoop框架是用Java实现的,因此MapReduce应用程序要用Java来写
选项C:MapReduce模型的核心是Map函数和Reduce函数
选项D:MapReduce将一个存储在分布式文件系统中的大规模数据集,切分成许多独立的分片
正确答案问询微信:424329
37.以下哪些是数据可视化地图工具()
选项A:Google Fusion Tables
选项B:Modest Maps
选项C:Leaflet
选项D:Google Chart API
正确答案问询微信:424329
38.关于Map端Shuffle过程中的合并与归并,说法正确的是()。
选项A:两个键值对和,如果合并,会得到
选项B:合并不会改变最终结果
选项C:两个键值对和,如果归并,会得到
选项D:两个键值对和,如果归并,会得到>
正确答案问询微信:424329
39.MapReduce的main函数中设置输出类型的方法有()。
选项A:setOutputKeyClass
选项B:setOutputClass
选项C:setOutputValueClass
选项D:setKeyValueClass
正确答案问询微信:424329
40.HDFS要实现的目标
选项A:流数据读写
选项B:大数据集的操作
选项C:复杂的文件模型
选项D:强大的跨平台兼容性
正确答案问询微信:424329
41.传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。
选项A:对
选项B:错
正确答案问询微信:424329
42.Hadoop安装时要配置SSH,这是由于Hadoop数据节点需要启动集群中所有机器的Hadoop守护进程,这个过程需要通过SSH登录来实现。
选项A:对
选项B:错
正确答案问询微信:424329
43.大数据虽然商业价值高,但是其价值密度低。
选项A:对
选项B:错
正确答案问询微信:424329
44.HDFS读数据过程中读取请求获得的输入流是FSInputStream
选项A:对
选项B:错
正确答案问询微信:424329
45.在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在
选项A:对
选项B:错
正确答案问询微信:424329
46.Hbase和传统数据库一样都是列式数据库
选项A:对
选项B:错
正确答案问询微信:424329
47.HDFS中的NameNode的操作日志文件EditLog中记录了所有针对文件的创建、删除、重命名等操作
选项A:对
选项B:错
正确答案问询微信:424329
48.关系数据库的关键特性包括完善的事务机制和高效的查询机制
选项A:对
选项B:错
正确答案问询微信:424329
49.Map函数的任务就是将输入的一系列具有相同键的键值对以某种方式组合起来,输出处理后的键值对,输出结果会合并成一个文件。
选项A:对
选项B:错
正确答案问询微信:424329
50.Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储
选项A:对
选项B:错
正确答案问询微信:424329