南开大学22秋学期(高起本1709-1803、全层次1809-2103)《大数据导论》在线作业三
奥鹏南开在线作业满分答案参考
22秋学期(高起本1709-1803、全层次1809-2103)《大数据导论》在线作业-00003
1.PaaS是()的简称
选项A:软件即服务
选项B:平台即服务
选项C:基础设施即服务
选项D:硬件即服务
满分答案问询微信:424329
2.GFS中的文件切分成()的块进行存储
选项A:32MB
选项B:64MB
选项C:128MB
选项D:1G
满分答案问询微信:424329
3.DAS代表的意思是()
选项A:两个异步存储
选项B:数据归档软件
选项C:连接一个可选的存储
选项D:直连存储
满分答案问询微信:424329
4.()是Microsoft Office的核心组件
选项A:SQL
选项B:WORD
选项C:PPT
选项D:EXCEL
满分答案问询微信:424329
5.大数据的最显著特征是() 。
选项A:数据规模大
选项B:数据类型多样
选项C:数据处理速度快
选项D:数据价值密度高
满分答案问询微信:424329
6.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
选项A:ggplot2
选项B:network
选项C:ggmaps
选项D:animation
满分答案问询微信:424329
7.医疗健康数据的基本情况不包括以下哪项?
选项A:诊疗数据
选项B:个人健康管理数据
选项C:公共安全数据
选项D:健康档案数据
满分答案问询微信:424329
8.基础设施即服务的英文简称是
选项A:IaaS
选项B:PaaS
选项C:SaaS
满分答案问询微信:424329
9.数据清洗的方法不包括
选项A:缺失值处理
选项B:噪声数据清除
选项C:一致性检查
选项D:重复数据记录处理
满分答案问询微信:424329
10.以下不是数据仓库基本特征的是()
选项A:数据仓库是面向主题的
选项B:数据仓库是面向事务的
选项C:数据仓库的数据是相对稳定的
选项D:数据仓库的数据是反映历史变化的
满分答案问询微信:424329
11.下列哪个工具常用来开发移动友好地交互地图()
选项A:Leaflet
选项B:Visual.ly
选项C:BPizza Pie Charts
选项D:Gephi
满分答案问询微信:424329
12.SAN是一种()
选项A:存储设备
选项B:专为数据存储而设计构建的网络
选项C:光纤交换机
选项D:HBA
满分答案问询微信:424329
13.大数据的特点不包含
选项A:数据体量大
选项B:价值密度高
选项C:处理速度快
选项D:数据不统一
满分答案问询微信:424329
14.下列哪个R语言扩展包可以创建带有点和边的网络图()
选项A:ggplot2
选项B:network
选项C:ggmaps
选项D:animation
满分答案问询微信:424329
15.用于描述相等时间间隔下连续数据随时间变化趋势的是()
选项A:折线图
选项B:散点图
选项C:条形图
选项D:饼图
满分答案问询微信:424329
16.大数据在医疗中的应用有()
选项A:流行性疾病预防
选项B:慢性病健康管理
选项C:临床决策支持
选项D:医疗器械研发
满分答案问询微信:424329
17.常见的非结构化数据有()
选项A:web网页
选项B:即时消息
选项C:富文本文档
选项D:实时多媒体数据
满分答案问询微信:424329
18.交通数据处理包括以下几个步骤()
选项A:数据清洗
选项B:数据映射
选项C:数据组织
选项D:数据聚类
满分答案问询微信:424329
19.大数据采集主要包括()四种。
选项A:系统日志采集
选项B:网络数据采集
选项C:数据库采集
选项D:其他数据采集
满分答案问询微信:424329
20.数据归约(Data Reduction)主要有()
选项A:维度规约
选项B:样本规约
选项C:数据聚集
选项D:离散化概念分层
满分答案问询微信:424329
21.网络数据采集常用的是通过##或##等方式从网站上获取数据信息。
选项A:网络爬虫
选项B:网站公开API
选项C:手动获取
满分答案问询微信:424329
22.常见的分类方法有
选项A:决策树
选项B:贝叶斯网络
选项C:遗传算法
选项D:FP算法
满分答案问询微信:424329
23.层次方法可以分为()
选项A:K均值算法
选项B:K中心点算法
选项C:凝聚法
选项D:分裂法
满分答案问询微信:424329
24.下列正确的是()
选项A:D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用
选项B:D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行
选项C:D3采用的是Selectors API的第一级标准
选项D:基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。
满分答案问询微信:424329
25.云计算的特点是()
选项A:大规模
选项B:高扩展性
选项C:虚拟化
选项D:按需分配
满分答案问询微信:424329
26.数据变换的常用方法有##,##,##,##
选项A:中心化变换
选项B:极差规格化变换
选项C:标准化变换
选项D:对数变换
满分答案问询微信:424329
27.大数据在教育中的应用
选项A:网上公开课
选项B:慕课
选项C:智慧校园
选项D:翻转课堂
满分答案问询微信:424329
28.关于R语言扩展包下列正确的是()
选项A:network可创建带有点和边的网络图
选项B:animation可制作一系列的图像并将它们串联起来做成动画
选项C:ggmaps通过树图来可视化层次型数据
选项D:protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
满分答案问询微信:424329
29.数据处理的两种方法是##,##
选项A:批处理
选项B:流处理
选项C:单个处理
选项D:交叉处理
满分答案问询微信:424329
30.医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()
选项A:多态性
选项B:时效性
选项C:不完整性
选项D:冗余性
满分答案问询微信:424329
31.数据分析是大数据价值链中最终和最重要的阶段,其目的是挖掘数据中潜在的价值以提供相应的建议或决策。通过分析不同领域中的数据集可以使数据在不同层面发挥最大价值。
选项A:对
选项B:错
满分答案问询微信:424329
32.由于数据变成资源,成为有价值的东西,数据私有化和独占问题就是客观存在的,成为关注的焦点。数据产权界定问题日益突出,在数据权属确定的情况下,数据商品化将成为必然选择
选项A:对
选项B:错
满分答案问询微信:424329
33.多维数据指的是具有多个维度属性的数据变量。
选项A:对
选项B:错
满分答案问询微信:424329
34.标签云将关键词根据词频或其他规则进行排序,按照一定规律进行布局排列,用大小、颜色、字体等图形属性对关键词进行可视化。
选项A:对
选项B:错
满分答案问询微信:424329
35.数据缺失是大数据库中常见的问题,产生的原因也是多种多样的。主要包括机械原因和人为原因。
选项A:对
选项B:错
满分答案问询微信:424329
36.数据仓库是一个面向主题的(subject oriented)、集成的(integrate),相对稳定的(non-volatile)、反映历史变化(time variant)的数据集合,以用于支持管理决策过程。
选项A:对
选项B:错
满分答案问询微信:424329
37.Python是一种面向对象的解释型计算机程序设计语言
选项A:对
选项B:错
满分答案问询微信:424329
38.预处理之后的数据需要被组织在数据库或数据仓库中。
选项A:对
选项B:错
满分答案问询微信:424329
39.用户可以容易地分析空间情况(道路网络内部)随时间的任何变化,或奥鹏南开在线作业满分答案参考分析道路段上的交通状况的时间变化,或者利用历史数据跟踪单个车辆的即时状态。
选项A:对
选项B:错
满分答案问询微信:424329
40.地图属于数据可视化的一种
选项A:对
选项B:错
满分答案问询微信:424329
41.Twitter作为主流社交网络平台,不仅仅是一个海量公共数据集,它还是一个带有时间刻度的海量公共数据集——用于捕捉特定时间中(在一些情况下,也是在特定空间中)数百万人关于所有主题事项的想法。
选项A:对
选项B:错
满分答案问询微信:424329
42.一个属性如果能由另一个或一组属性导出,则这个属性可能是冗余的。
选项A:对
选项B:错
满分答案问询微信:424329
43.基于大数据研究个体或群体行为,发现活动中蕴含的空间认知规律及空间行为和交互模式,建立以人为本的地理信息服务,进而支持个体或群体时空行为决策。
选项A:对
选项B:错
满分答案问询微信:424329
44.有些冗余可以被相关分析检测到。
选项A:对
选项B:错
满分答案问询微信:424329
45.R语言是闭源的
选项A:对
选项B:错
满分答案问询微信:424329
46.弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息重构它。
选项A:对
选项B:错
满分答案问询微信:424329
47.空间视图提供了交通堵塞的概览
选项A:对
选项B:错
满分答案问询微信:424329
48.数据流要表现出流数据的特征,反映的是系统中流动的数据;
选项A:对
选项B:错
满分答案问询微信:424329
49.规则性分析(Prescriptive Analysis)用于解决决策制定和提高分析效率
选项A:对
选项B:错
满分答案问询微信:424329
50.R是一种开源编程语言和软件环境,用于数据挖掘、数据分析和可视化。
选项A:对
选项B:错
满分答案问询微信:424329