南开23春学期（高起专1903、专升本1903）《大数据开发技术（一）》在线作业二

奥鹏南开大学新学期作业参考

南开大学23春学期（高起专1903、专升本1903）《大数据开发技术（一）》在线作业

1.以下亚马逊的产品中哪个是数据仓库
选项A：ElastiCache
选项B：RDS
选项C：DynamoDB
选项D：Redshift
正确答案问询微信：424329

2.以下亚马逊的产品中哪个是NoSQL数据库
选项A：RDS
选项B：SimpleDB
选项C：DynamoDB
选项D：Redshift
正确答案问询微信：424329

3.关于Reduce端Shuffle过程,说法正确的是()。
选项A：Reduce领取数据先放入缓存，来自不同Map机器，先合并，再归并，写入磁盘
选项B：多个溢写文件归并最后只能形成一个大文件
选项C：当数据很少时，也要溢写到磁盘
选项D：Reduce任务通过RPC向JobTracker询问Map任务是否已经完成
正确答案问询微信：424329

4.Hbase中-ROOT-表有()个Region
选项A：1
选项B：10
选项C：10-1000
选项D：0
正确答案问询微信：424329

5.NoSQL中的CAP理论中的C代表()
选项A：一致性
选项B：可用性
选项C：分区容忍性
选项D：可扩展性
正确答案问询微信：424329

6.优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()
选项A：列族数据库
选项B：键值数据库
选项C：图数据库
选项D：文档数据库
正确答案问询微信：424329

7.以下哪种不属于为大数据时代提供关键技术支撑的信息科技变化()。
选项A：网络宽带不断增加
选项B：存储设备容量不断增加
选项C：CPU处理能大幅提升
选项D：存储设备尺寸不断减小
正确答案问询微信：424329

8.UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移
选项A：Controller服务器
选项B：Procy服务器
选项C：愚公系统
选项D：Agent服务器
正确答案问询微信：424329

9.Amazon SimpleDB属于()
选项A：关系数据库
选项B：键值数据库
选项C：NoSQL数据库
选项D：数据仓库
正确答案问询微信：424329

10.Pregel计算模型以()作为输入
选项A：有向图
选项B：无向图
选项C：矢量图
选项D：树
正确答案问询微信：424329

11.HDFS中NameNode将从SecondaryNameNode接收到的新的FsImage替换旧的FsImage文件,同时将edit.new替换##文件
选项A：edit
选项B：edit.old
选项C：FsImage
选项D：EditLog
正确答案问询微信：424329

12.Google Fusion Tables是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
正确答案问询微信：424329

13.针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
选项A：Time Tunnel
选项B：Spark
选项C：Super Mario
选项D：Storm
正确答案问询微信：424329

14.Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。
选项A：ShuffleGrouping
选项B：AllGrouping
选项C：GlobalGrouping
选项D：FiedlsGrouping
正确答案问询微信：424329

15.应用于专门用于处理具有高度相互关联关系的数据,比较适合于社交网络的数据库是哪种()
选项A：列族数据库
选项B：键值数据库
选项C：图数据库
选项D：文档数据库
正确答案问询微信：424329

16.R是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
正确答案问询微信：424329

17.Amazon Redshift属于()
选项A：关系数据库
选项B：键值数据库
选项C：NoSQL数据库
选项D：数据仓库
正确答案问询微信：424329

18.以下说法不正确的是()。
选项A：MapReduce的核心思想就是“分面治之”
选项B：HDFS是对GFS的开源实现
选项C：MapReduce是一种分布式计算模型
选项D：HDFS采用HBase作为其底层数据存储
正确答案问询微信：424329

19.HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
选项A：垂直扩展
选项B：水平扩展
选项C：拓扑扩展
选项D：叠加
正确答案问询微信：424329

20.HDFS中()记录了每个文件中各个块所在的数据节点的位置信息
选项A：NameNode
选项B：SecondaryNameNode
选项C：DataNode
选项D：Block
正确答案问询微信：424329

21.SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流
选项A：Client Layer
选项B：Services Layer
选项C：Platform Layer
选项D：Infrastructure Layer
正确答案问询微信：424329

22.Google Chart API是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
正确答案问询微信：424329

23.Echarts是哪种可视化工具()
选项A：信息图表
选项B：地图工具
选项C：时间线工具
选项D：分析工具
正确答案问询微信：424329

24.Hadoop启动所有进程的命令为()。
选项A：all-start.sh
选项B：all-start.exe
选项C：start-all.sh
选项D：start-all.exe
正确答案问询微信：424329

25.Pregel计算模型中每个顶点ID的类型是()
选项A：String
选项B：Int
选项C：Double
选项D：结构体
正确答案问询微信：424329

26.Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。
选项A：ShuffleGrouping
选项B：AllGrouping
选项C：GlobalGrouping
选项D：FiedlsGrouping
正确答案问询微信：424329

27.UMP系通过()来实现实现管理每台物理机上的MySQL实例
选项A：Controller服务器
选项B：Procy服务器
选项C：愚公系统
选项D：Agent服务器
正确答案问询微信：424329

28.UMP系统中面对分库分表用户如何进行资源调度()
选项A：可以共享同一个MySQL实例
选项B：每个用户独占一个MySQL实例
选项C：会占用多个独立的MySQL实例
选项D：随机分配MySQL实例
正确答案问询微信：424329

29.应用于分布式数据存储与管理
数据在地理上分布于多个数据中心的应用程序的数据库是哪种()
选项A：列族数据库
选项B：键值数据库
选项C：图数据库
选项D：文档数据库
正确答案问询微信：424329

30.在做人口调查时,采用对一个总样本为1亿人口的数据随机抽取1000人进行抽样调查体现了大数据的哪种思维方式()。
选项A：相关而非因果
选项B：全样而非抽样
选项C：效率而非精确
选项D：全面而非特别
正确答案问询微信：424329

31.以下哪些是数据可视化信息图表工具()
选项A：大数据魔镜
选项B：D3
选项C：Google Chart API
选项D：Google Fusion Tables
正确答案问询微信：424329

32.HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。
选项A：FsImage
选项B：DataNode
选项C：Block
选项D：EditLog
正确答案问询微信：424329

33.以下哪个是HDFS的局限性()。
选项A：延迟高
选项B：只允许对文件执行追加操作，不能执行随机写操作
选项C：用MapReduce处理大量小文件时，会产生过多的Map任务，线程管理开销会大大增加
选项D：拥有复杂的数据模型
正确答案问询微信：424329

34.以下哪种数据库属于NoSQL数据库()
选项A：关系数据库
选项B：键值数据库
选项C：文档数据库
选项D：分布式数据库
正确答案问询微信：424329

35.以下哪种数据库适合于小批量的数据处理()
选项A：MySQL
选项B：Oracle
选项C：Hbase
选项D：NosSQL
正确答案问询微信：424329

36.以下属于Hadoop的安装方式的有()。
选项A：单机模式
选项B：多机模式
选项C：分布式模式
选项D：并行模式
选项E：伪分布式模式
正确答案问询微信：424329

37.Hbase系统结构中包括()奥鹏南开大学新学期作业参考
选项A：Zookeeper服务器
选项B：客户端
选项C：Master服务器
选项D：Region服务器
正确答案问询微信：424329

38.HDFS要实现的目标
选项A：流数据读写
选项B：大数据集的操作
选项C：复杂的文件模型
选项D：强大的跨平台兼容性
正确答案问询微信：424329

39.NoSQL数据库与关系数据库相比适用于哪些领域()
选项A：电信
选项B：银行
选项C：互联网企业大数据处理
选项D：传统企业的数据分析
正确答案问询微信：424329

40.传统的数据处理流程的前提是()。
选项A：存储的数据是旧的
选项B：存储的数据是实时的
选项C：需要用户主动发出查询
选项D：不需要用户主动发出查询
正确答案问询微信：424329

41.Hadoop可以在单节点上以伪分布式的方式运行,Hadoop进程以分离的Java进程来运行,节点既作为NameNode也作为DataNode,同时,读取的是HDFS中的文件。
选项A：对
选项B：错
正确答案问询微信：424329

42.云数据库可以满足中小企业的低成本数据存储需求
选项A：对
选项B：错
正确答案问询微信：424329

43.HDFS集群中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。
选项A：对
选项B：错
正确答案问询微信：424329

44.MapReduce中TaskTracker使用“slot”等量划分本节点上的资源量。
选项A：对
选项B：错
正确答案问询微信：424329

45.HDFS读数据过程中读取请求获得的输入流是FSInputStream
选项A：对
选项B：错
正确答案问询微信：424329

46.在传统的文件系统中,为了提高磁盘读写效率,一般以数据块为单位
选项A：对
选项B：错
正确答案问询微信：424329

47.Hadoop安装时要配置SSH,这是由于Hadoop数据节点需要启动集群中所有机器的Hadoop守护进程,这个过程需要通过SSH登录来实现。
选项A：对
选项B：错
正确答案问询微信：424329

48.在HBase 的概念视图中, 一个表可以视为一个稀疏、多维的映射关系。
选项A：对
选项B：错
正确答案问询微信：424329

49.大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高的延迟
选项A：对
选项B：错
正确答案问询微信：424329

50.HBase中包含了丰富的操作,其中会涉及复杂的多表连接。
选项A：对
选项B：错
正确答案问询微信：424329

提供优质的教育资源