南开23春学期(高起专1903、专升本1903)《大数据开发技术(一)》在线作业二
奥鹏南开大学新学期作业参考

南开大学23春学期(高起专1903、专升本1903)《大数据开发技术(一)》在线作业
1.以下亚马逊的产品中哪个是数据仓库
选项A:ElastiCache
选项B:RDS
选项C:DynamoDB
选项D:Redshift
正确答案问询微信:424329
2.以下亚马逊的产品中哪个是NoSQL数据库
选项A:RDS
选项B:SimpleDB
选项C:DynamoDB
选项D:Redshift
正确答案问询微信:424329
3.关于Reduce端Shuffle过程,说法正确的是()。
选项A:Reduce领取数据先放入缓存,来自不同Map机器,先合并,再归并,写入磁盘
选项B:多个溢写文件归并最后只能形成一个大文件
选项C:当数据很少时,也要溢写到磁盘
选项D:Reduce任务通过RPC向JobTracker询问Map任务是否已经完成
正确答案问询微信:424329
4.Hbase中-ROOT-表有()个Region
选项A:1
选项B:10
选项C:10-1000
选项D:0
正确答案问询微信:424329
5.NoSQL中的CAP理论中的C代表()
选项A:一致性
选项B:可用性
选项C:分区容忍性
选项D:可扩展性
正确答案问询微信:424329
6.优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()
选项A:列族数据库
选项B:键值数据库
选项C:图数据库
选项D:文档数据库
正确答案问询微信:424329
7.以下哪种不属于为大数据时代提供关键技术支撑的信息科技变化()。
选项A:网络宽带不断增加
选项B:存储设备容量不断增加
选项C:CPU处理能大幅提升
选项D:存储设备尺寸不断减小
正确答案问询微信:424329
8.UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移
选项A:Controller服务器
选项B:Procy服务器
选项C:愚公系统
选项D:Agent服务器
正确答案问询微信:424329
9.Amazon SimpleDB属于()
选项A:关系数据库
选项B:键值数据库
选项C:NoSQL数据库
选项D:数据仓库
正确答案问询微信:424329
10.Pregel计算模型以()作为输入
选项A:有向图
选项B:无向图
选项C:矢量图
选项D:树
正确答案问询微信:424329
11.HDFS中NameNode将从SecondaryNameNode接收到的新的FsImage替换旧的FsImage文件,同时将edit.new替换##文件
选项A:edit
选项B:edit.old
选项C:FsImage
选项D:EditLog
正确答案问询微信:424329
12.Google Fusion Tables是哪种可视化工具()
选项A:信息图表
选项B:地图工具
选项C:时间线工具
选项D:分析工具
正确答案问询微信:424329
13.针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
选项A:Time Tunnel
选项B:Spark
选项C:Super Mario
选项D:Storm
正确答案问询微信:424329
14.Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。
选项A:ShuffleGrouping
选项B:AllGrouping
选项C:GlobalGrouping
选项D:FiedlsGrouping
正确答案问询微信:424329
15.应用于专门用于处理具有高度相互关联关系的数据,比较适合于社交网络的数据库是哪种()
选项A:列族数据库
选项B:键值数据库
选项C:图数据库
选项D:文档数据库
正确答案问询微信:424329
16.R是哪种可视化工具()
选项A:信息图表
选项B:地图工具
选项C:时间线工具
选项D:分析工具
正确答案问询微信:424329
17.Amazon Redshift属于()
选项A:关系数据库
选项B:键值数据库
选项C:NoSQL数据库
选项D:数据仓库
正确答案问询微信:424329
18.以下说法不正确的是()。
选项A:MapReduce的核心思想就是“分面治之”
选项B:HDFS是对GFS的开源实现
选项C:MapReduce是一种分布式计算模型
选项D:HDFS采用HBase作为其底层数据存储
正确答案问询微信:424329
19.HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
选项A:垂直扩展
选项B:水平扩展
选项C:拓扑扩展
选项D:叠加
正确答案问询微信:424329
20.HDFS中()记录了每个文件中各个块所在的数据节点的位置信息
选项A:NameNode
选项B:SecondaryNameNode
选项C:DataNode
选项D:Block
正确答案问询微信:424329
21.SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流
选项A:Client Layer
选项B:Services Layer
选项C:Platform Layer
选项D:Infrastructure Layer
正确答案问询微信:424329
22.Google Chart API是哪种可视化工具()
选项A:信息图表
选项B:地图工具
选项C:时间线工具
选项D:分析工具
正确答案问询微信:424329
23.Echarts是哪种可视化工具()
选项A:信息图表
选项B:地图工具
选项C:时间线工具
选项D:分析工具
正确答案问询微信:424329
24.Hadoop启动所有进程的命令为()。
选项A:all-start.sh
选项B:all-start.exe
选项C:start-all.sh
选项D:start-all.exe
正确答案问询微信:424329
25.Pregel计算模型中每个顶点ID的类型是()
选项A:String
选项B:Int
选项C:Double
选项D:结构体
正确答案问询微信:424329
26.Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。
选项A:ShuffleGrouping
选项B:AllGrouping
选项C:GlobalGrouping
选项D:FiedlsGrouping
正确答案问询微信:424329
27.UMP系通过()来实现实现管理每台物理机上的MySQL实例
选项A:Controller服务器
选项B:Procy服务器
选项C:愚公系统
选项D:Agent服务器
正确答案问询微信:424329
28.UMP系统中面对分库分表用户如何进行资源调度()
选项A:可以共享同一个MySQL实例
选项B:每个用户独占一个MySQL实例
选项C:会占用多个独立的MySQL实例
选项D:随机分配MySQL实例
正确答案问询微信:424329
29.应用于分布式数据存储与管理
数据在地理上分布于多个数据中心的应用程序的数据库是哪种()
选项A:列族数据库
选项B:键值数据库
选项C:图数据库
选项D:文档数据库
正确答案问询微信:424329
30.在做人口调查时,采用对一个总样本为1亿人口的数据随机抽取1000人进行抽样调查体现了大数据的哪种思维方式()。
选项A:相关而非因果
选项B:全样而非抽样
选项C:效率而非精确
选项D:全面而非特别
正确答案问询微信:424329
31.以下哪些是数据可视化信息图表工具()
选项A:大数据魔镜
选项B:D3
选项C:Google Chart API
选项D:Google Fusion Tables
正确答案问询微信:424329
32.HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
选项A:FsImage
选项B:DataNode
选项C:Block
选项D:EditLog
正确答案问询微信:424329
33.以下哪个是HDFS的局限性()。
选项A:延迟高
选项B:只允许对文件执行追加操作,不能执行随机写操作
选项C:用MapReduce处理大量小文件时,会产生过多的Map任务,线程管理开销会大大增加
选项D:拥有复杂的数据模型
正确答案问询微信:424329
34.以下哪种数据库属于NoSQL数据库()
选项A:关系数据库
选项B:键值数据库
选项C:文档数据库
选项D:分布式数据库
正确答案问询微信:424329
35.以下哪种数据库适合于小批量的数据处理()
选项A:MySQL
选项B:Oracle
选项C:Hbase
选项D:NosSQL
正确答案问询微信:424329
36.以下属于Hadoop的安装方式的有()。
选项A:单机模式
选项B:多机模式
选项C:分布式模式
选项D:并行模式
选项E:伪分布式模式
正确答案问询微信:424329
37.Hbase系统结构中包括()奥鹏南开大学新学期作业参考
选项A:Zookeeper服务器
选项B:客户端
选项C:Master服务器
选项D:Region服务器
正确答案问询微信:424329
38.HDFS要实现的目标
选项A:流数据读写
选项B:大数据集的操作
选项C:复杂的文件模型
选项D:强大的跨平台兼容性
正确答案问询微信:424329
39.NoSQL数据库与关系数据库相比适用于哪些领域()
选项A:电信
选项B:银行
选项C:互联网企业大数据处理
选项D:传统企业的数据分析
正确答案问询微信:424329
40.传统的数据处理流程的前提是()。
选项A:存储的数据是旧的
选项B:存储的数据是实时的
选项C:需要用户主动发出查询
选项D:不需要用户主动发出查询
正确答案问询微信:424329
41.Hadoop可以在单节点上以伪分布式的方式运行,Hadoop进程以分离的Java进程来运行,节点既作为NameNode也作为DataNode,同时,读取的是HDFS中的文件。
选项A:对
选项B:错
正确答案问询微信:424329
42.云数据库可以满足中小企业的低成本数据存储需求
选项A:对
选项B:错
正确答案问询微信:424329
43.HDFS集群中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。
选项A:对
选项B:错
正确答案问询微信:424329
44.MapReduce中TaskTracker使用“slot”等量划分本节点上的资源量。
选项A:对
选项B:错
正确答案问询微信:424329
45.HDFS读数据过程中读取请求获得的输入流是FSInputStream
选项A:对
选项B:错
正确答案问询微信:424329
46.在传统的文件系统中,为了提高磁盘读写效率,一般以数据块为单位
选项A:对
选项B:错
正确答案问询微信:424329
47.Hadoop安装时要配置SSH,这是由于Hadoop数据节点需要启动集群中所有机器的Hadoop守护进程,这个过程需要通过SSH登录来实现。
选项A:对
选项B:错
正确答案问询微信:424329
48.在HBase 的概念视图中, 一个表可以视为一个稀疏、多维的映射关系。
选项A:对
选项B:错
正确答案问询微信:424329
49.大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高的延迟
选项A:对
选项B:错
正确答案问询微信:424329
50.HBase中包含了丰富的操作,其中会涉及复杂的多表连接。
选项A:对
选项B:错
正确答案问询微信:424329