南开大学23年春学期《大数据导论》在线作业三

奥鹏南开大学新学期作业参考

23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《大数据导论》在线作业-00003

下列不属于Google云计算平台技术架构的是()
A:并行数据处理MapReduce
B:分布式锁Chubby
C:结构化数据表BigTable
D:弹性云计算EC2
正确答案问询微信:424329

第一个提出大数据概念的公司是( )。
A:麦肯锡公司
B:谷歌公司
C:微软公司
D:脸谱公司
正确答案问询微信:424329

MapReduce中的Map和Reduce函数使用()进行输入输出
A:key/value对
B:随机数值
C:其他计算结果
正确答案问询微信:424329

下列不属于商业大数据类型的是
A:传统企业数据
B:机器和传感器数据奥鹏南开大学新学期作业参考 代做2元一门
C:社交数据
D:电子商务数据
正确答案问询微信:424329

下列哪个工具常用来开发移动友好地交互地图()
A:Leaflet
B:Visual.ly
C:BPizza Pie Charts
D:Gephi
正确答案问询微信:424329

以下不是数据仓库基本特征的是()
A:数据仓库是面向主题的
B:数据仓库是面向事务的
C:数据仓库的数据是相对稳定的
D:数据仓库的数据是反映历史变化的
正确答案问询微信:424329

大数据的特点不包含
A:数据体量大
B:价值密度高
C:处理速度快
D:数据不统一
正确答案问询微信:424329

医疗健康数据的基本情况不包括以下哪项?
A:诊疗数据
B:个人健康管理数据
C:公共安全数据
D:健康档案数据
正确答案问询微信:424329

数据清洗的方法不包括
A:缺失值处理
B:噪声数据清除
C:一致性检查
D:重复数据记录处理
正确答案问询微信:424329

基础设施即服务的英文简称是
A:IaaS
B:PaaS
C:SaaS
正确答案问询微信:424329

用于描述数据分散情况的是()
A:分布图
B:箱式图
C:饼图
D:折线图
正确答案问询微信:424329

数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329

以下哪项不是数据可视化工具的特性()
A:实时性
B:简单操作
C:更丰富的展现
D:仅需一种数据支持方式即可
正确答案问询微信:424329

下列哪个R语言扩展包可以创建带有点和边的网络图()
A:ggplot2
B:network
C:ggmaps
D:animation
正确答案问询微信:424329

哪个选项不属于大数据4V特点?
A:Volume
B:Valid
C:Variety
D:Value
正确答案问询微信:424329

下列正确的是()
A:D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用
B:D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行
C:D3采用的是Selectors API的第一级标准
D:基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。
正确答案问询微信:424329

借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。
A:消费能力
B:趋势报告
C:购物结果
正确答案问询微信:424329

层次方法可以分为()
A:K均值算法
B:K中心点算法
C:凝聚法
D:分裂法
正确答案问询微信:424329

统计图表的可视化方法主要包括()
A:散点图
B:折线图
C:条形图
D:饼图
正确答案问询微信:424329

数据归约(Data Reduction)主要有有()
A:维度规约
B:样本规约
C:数据聚集
D:离散化概念分层
正确答案问询微信:424329

对于数值属性,我们使用()来评估一个属性的值如何随另一个属性变化。
A:欧式距离
B:相关系数
C:协方差
正确答案问询微信:424329

一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A:一个名字节点
B:若干个名字节点
C:一个数据节点
D:若干个数据节点
正确答案问询微信:424329

大数据存储的特点与挑战有()
A:容量问题
B:延迟问题
C:安全问题
D:成本问题
正确答案问询微信:424329

数据预处理的过程主要是
A:数据清洗
B:数据集成
C:数据变换
D:数据规约
正确答案问询微信:424329

大数据四大特征包括( )
A:数据量大
B:数据类型繁多
C:数据价值密度相对较低
D:处理速度快,时效性要求高
正确答案问询微信:424329

数据工厂包括
A:低能耗数据中心
B:超大规模讲分布式架构
C:新一代智能自动化运维
D:超强云安全
正确答案问询微信:424329

数据分析的类型根据数据分析深度可以分为()
A:描述性分析
B:预测性分析s
C:规则性分析
正确答案问询微信:424329

云计算是##,##,##的发展?,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
A:流计算
B:分布式计算
C:并行计算
D:网络计算
正确答案问询微信:424329

大数据在医疗中的应用有()
A:流行性疾病预防
B:慢性病健康管理
C:临床决策支持
D:医疗器械研发
正确答案问询微信:424329

医疗大数据的来源主要包括()
A:制药企业/生命科学
B:临床医疗/实验室数据
C:费用报销/利用率
D:健康管理/社交网络
正确答案问询微信:424329

由于数据变成资源,成为有价值的东西,数据私有化和独占问题就是客观存在的,成为关注的焦点。数据产权界定问题日益突出,在数据权属确定的情况下,数据商品化将成为必然选择
A:对
B:错
正确答案问询微信:424329

所有关系型数据中的数据全部为结构化数据。半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。
A:对
B:错
正确答案问询微信:424329

云计算出现后,数据存储服务衍生出了新的商业模式,数据中心的出现降低了公司的计算和存储成本。
A:对
B:错
正确答案问询微信:424329

大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。
A:对
B:错
正确答案问询微信:424329

数据的大量聚集,使得黑客一次成功的攻击能够获得更多的数据,无形中降低了黑客的进攻成本,增加了“收益率“。
A:对
B:错
正确答案问询微信:424329

交通数据集通常包括空间和时间特性而且跨越大范围的时间空间。数据聚类可以有效的减小数据规模为随后的分析提供便利。
A:对
B:错
正确答案问询微信:424329

R是一种开源编程语言和软件环境,用于数据挖掘、数据分析和可视化。
A:对
B:错
正确答案问询微信:424329

通常将统计指标的数值按长度顺序排列所形成的数列,称为时间序列。
A:对
B:错
正确答案问询微信:424329

分箱方法通过考察数据的”近邻”(即周围的值)来光滑有序数据的值。这些有序的值被分布到一些”箱”中。由于分箱法考察临近的值,因此进行全局光滑。
A:对
B:错
正确答案问询微信:424329

饼图以二维或者三维的形式表示某一数据相对于数据总量的大小,用于数据之间比重的比较。
A:对
B:错
正确答案问询微信:424329

利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。
A:对
B:错
正确答案问询微信:424329

大数据需要对多种数据混合访问,催生出了新的、需要考虑安全性的问题。
A:对
B:错
正确答案问询微信:424329

在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意数据的结构。这旨在确保源系统中的函数依赖和参照约束与目标系统中的匹配。
A:对
B:错
正确答案问询微信:424329

通过大数据的分析将会更精确地预测未来的天气,帮助农民做好自然灾害的预防工作,帮助政府实现农业的精细化管理和科学决策。
A:对
B:错
正确答案问询微信:424329

数据仓库是一个面向主题的(subject oriented)、集成的(integrate),相对稳定的(non-volatile)、反映历史变化(time variant)的数据集合,以用于支持管理决策过程。
A:对
B:错
正确答案问询微信:424329

NAS代表的意思是网络附加存储
A:对
B:错
正确答案问询微信:424329

云存储不仅是存储设备或技术,更是一种服务的创新。
A:对
B:错
正确答案问询微信:424329

大数据的挑战仅仅来自于数据的增长。
A:对
B:错
正确答案问询微信:424329

Kafka是一种高吞吐量的的分布式发布订阅消息系统
A:对
B:错
正确答案问询微信:424329

离散化可以有效地克服数据中隐藏的缺陷,使模型结果更加稳定。
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网