南开大学23秋学期《大数据导论》在线作业二
奥鹏南开大学23年秋季新学期作业参考
23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《大数据导论》在线作业-00002
以下哪项不是数据可视化工具的特性()
A:实时性
B:简单操作
C:更丰富的展现
D:仅需一种数据支持方式即可
正确答案问询微信:424329
GFS中的文件切分成()的块进行存储
A:32MB
B:64MB
C:128MB
D:1G
正确答案问询微信:424329
下面哪一项不是中国发展大数据产业的基础()。
A:信息化积累了丰富的数据资源
B:大数据技术创新取得明显突破
C:大数据应用推动势头良好
D:大数据产业支撑薄弱
正确答案问询微信:424329
哪个选项不属于大数据4V特点?
A:Volume
B:Valid
C:Variety
D:Value
正确答案问询微信:424329
数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329
医疗健康数据的基本情况不包括以下哪项?
A:诊疗数据
B:个人健康管理数据
C:公共安全数据
D:健康档案数据
正确答案问询微信:424329
大数据的特点不包含
A:数据体量大
B:价值密度高
C:处理速度快
D:数据不统一
正确答案问询微信:424329
用于描述数据分散情况的是()
A:分布图
B:箱式图
C:饼图
D:折线图
正确答案问询微信:424329
下列不属于商业大数据类型的是
A:传统企业数据
B:机器和传感器数据
C:社交数据
D:电子商务数据
正确答案问询微信:424329
基础设施即服务的英文简称是
A:IaaS
B:PaaS
C:SaaS
正确答案问询微信:424329
IaaS是()的简称
A:软件即服务
B:平台即服务
C:基础设施即服务
D:硬件即服务
正确答案问询微信:424329
下列哪个R语言扩展包可以创建带有点和边的网络图()
A:ggplot2
B:network
C:ggmaps
D:animation
正确答案问询微信:424329
数据仓库是随着时间变化的,下列不正确的是()
A:数据仓库随时间变化不断增加新内容
B:捕捉到的新数据会覆盖原来的快照
C:数据仓库随事件变化不断删去旧的数据内容
D:数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案问询微信:424329
下列哪个工具常用来开发移动友好地交互地图()
A:Leaflet
B:Visual.ly
C:BPizza Pie Charts
D:Gephi
正确答案问询微信:424329
PaaS是()的简称
A:软件即服务
B:平台即服务
C:基础设施即服务
D:硬件即服务
正确答案问询微信:424329
数据归约(Data Reduction)主要有()
A:维度规约
B:样本规约
C:数据聚集
D:离散化概念分层
正确答案问询微信:424329
常见的分类方法有
A:决策树
B:贝叶斯网络
C:遗传算法
D:FP算法
正确答案问询微信:424329
大数据在社交网络中的应用
A:用户偏好、情感、社交网络结构
B:用户画像、精准推荐
C:舆情监控、突发事件预警
D:预测外部趋势
正确答案问询微信:424329
医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()
A:多态性
B:时效性
C:不完整性
D:冗余性
正确答案问询微信:424329
大数据存储的特点与挑战有()
A:容量问题
B:延迟问题
C:安全问题
D:成本问题
正确答案问询微信:424329
常见的非结构化数据有()
A:web网页
B:即时消息
C:富文本文档
D:实时多媒体数据
正确答案问询微信:424329
数据归约(Data Reduction)主要有有()
A:维度规约
B:样本规约
C:数据聚集
D:离散化概念分层
正确答案问询微信:424329
最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的()等。
A:用户行为数据
B:日志式的活动数据
C:事件信息
正确答案问询微信:424329
统计图表的可视化方法主要包括()
A:散点图
B:折线图
C:条形图
D:饼图
正确答案问询微信:424329
云计算的特点是()
A:大规模
B:高扩展性
C:虚拟化
D:按需分配
正确答案问询微信:424329
下列正确的是()
A:D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用
B:D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行
C:D3采用的是Selectors API的第一级标准
D:基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。
正确答案问询微信:424329
百度大数据引擎主要包含三大组件()
A:开放云
B:数据工厂
C:百度大脑。
正确答案问询微信:424329
主流分布式计算平台有()
A:google
B:IBM
C:baidu
D:Amazon
正确答案问询微信:424329
层次方法可以分为()
A:K均值算法
B:K奥鹏南开大学23年秋季新学期作业参考中心点算法
C:凝聚法
D:分裂法
正确答案问询微信:424329
数据分析的类型根据数据分析深度可以分为()
A:描述性分析
B:预测性分析s
C:规则性分析
正确答案问询微信:424329
Human mobility 即“人类移动性”,表示人类个体或群体在地理空间中具有特定意义的“移动(Movement)”所隐含的社会系统要素时空分布与演化规律。
A:对
B:错
正确答案问询微信:424329
数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。
A:对
B:错
正确答案问询微信:424329
分箱方法通过考察数据的”近邻”(即周围的值)来光滑有序数据的值。这些有序的值被分布到一些”箱”中。由于分箱法考察临近的值,因此进行全局光滑。
A:对
B:错
正确答案问询微信:424329
大数据的挑战仅仅来自于数据的增长。
A:对
B:错
正确答案问询微信:424329
分类是根据在数据中发现的描述对象及其关系的信息,将数据对象分组。
组内相似度高,组间差异性大。
A:对
B:错
正确答案问询微信:424329
Python是一种面向对象的解释型计算机程序设计语言
A:对
B:错
正确答案问询微信:424329
大数据需要对多种数据混合访问,催生出了新的、需要考虑安全性的问题。
A:对
B:错
正确答案问询微信:424329
大数据在行业应用很广泛,行业领域包括电视媒体,汽车行业,医疗行业,保险行业等等。
A:对
B:错
正确答案问询微信:424329
离群点检测的任务是识别特征显著不同于其他数据的观测值,这样的点称为异常点、离群点或孤立点。
A:对
B:错
正确答案问询微信:424329
NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。
A:对
B:错
正确答案问询微信:424329
数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式
A:对
B:错
正确答案问询微信:424329
高质量的数据是能够满足应用需求的数据。
A:对
B:错
正确答案问询微信:424329
数据缺失是大数据库中常见的问题,产生的原因也是多种多样的。主要包括机械原因和人为原因。
A:对
B:错
正确答案问询微信:424329
海量数据存储系统的扩展能力也要得到相应等级的提升,扩展还必须简便。
A:对
B:错
正确答案问询微信:424329
大数据采集主要分为大数据智能感知层和基础支撑层
A:对
B:错
正确答案问询微信:424329
数据的集中存储增加了数据泄露风险。
A:对
B:错
正确答案问询微信:424329
Spark的亮点是充分利用内存承载工作集,而且能保证容错。
A:对
B:错
正确答案问询微信:424329
Twitter作为主流社交网络平台,不仅仅是一个海量公共数据集,它还是一个带有时间刻度的海量公共数据集——用于捕捉特定时间中(在一些情况下,也是在特定空间中)数百万人关于所有主题事项的想法。
A:对
B:错
正确答案问询微信:424329
通常将统计指标的数值按长度顺序排列所形成的数列,称为时间序列。
A:对
B:错
正确答案问询微信:424329
NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。
A:对
B:错
正确答案问询微信:424329