南开23春学期(高起本:1709-2103、专升本高起专:1903-2103)《大数据导论》在线作业三

奥鹏南开大学新学期作业参考

南开23春学期(高起本:1709-2103、专升本高起专:1903-2103)《大数据导论》在线作业三插图

南开大学23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《大数据导论》在线作业

1.下列不属于Google云计算平台技术架构的是()
选项A:并行数据处理MapReduce
选项B:分布式锁Chubby
选项C:结构化数据表BigTable
选项D:弹性云计算EC2
正确答案问询微信:424329

2.第一个提出大数据概念的公司是( )。
选项A:麦肯锡公司
选项B:谷歌公司
选项C:微软公司
选项D:脸谱公司
正确答案问询微信:424329

3.MapReduce中的Map和Reduce函数使用()进行输入输出
选项A:key/value对
选项B:随机数值
选项C:其他计算结果
正确答案问询微信:424329

4.下列不属于商业大数据类型的是
选项A:传统企业数据
选项B:机器和传感器数据
选项C:社交数据
选项D:电子商务数据
正确答案问询微信:424329

5.下列哪个工具常用来开发移动友好地交互地图()
选项A:Leaflet
选项B:Visual.ly
选项C:BPizza Pie Charts
选项D:Gephi
正确答案问询微信:424329

6.以下不是数据仓库基本特征的是()
选项A:数据仓库是面向主题的
选项B:数据仓库是面向事务的
选项C:数据仓库的数据是相对稳定的
选项D:数据仓库的数据是反映历史变化的
正确答案问询微信:424329

7.大数据的特点不包含
选项A:数据体量大
选项B:价值密度高
选项C:处理速度快
选项D:数据不统一
正确答案问询微信:424329

8.医疗健康数据的基本情况不包括以下哪项?
选项A:诊疗数据
选项B:个人健康管理数据
选项C:公共安全数据
选项D:健康档案数据
正确答案问询微信:424329

9.数据清洗的方法不包括
选项A:缺失值处理
选项B:噪声数据清除
选项C:一致性检查
选项D:重复数据记录处理
正确答案问询微信:424329

10.基础设施即服务的英文简称是
选项A:IaaS
选项B:PaaS
选项C:SaaS
正确答案问询微信:424329

11.用于描述数据分散情况的是()
选项A:分布图
选项B:箱式图
选项C:饼图
选项D:折线图
正确答案问询微信:424329

12.数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
选项A:运营式系统阶段
选项B:用户原创内容阶段
选项C:感知式系统阶段
正确答案问询微信:424329

13.以下哪项不是数据可视化工具的特性()
选项A:实时性
选项B:简单操作
选项C:更丰富的展现
选项D:仅需一种数据支持方式即可
正确答案问询微信:424329

14.下列哪个R语言扩展包可以创建带有点和边的网络图()
选项A:ggplot2
选项B:network
选项C:ggmaps
选项D:animation
正确答案问询微信:424329

15.哪个选项不属于大数据4V特点?
选项A:Volume
选项B:Valid
选项C:Variety
选项D:Value
正确答案问询微信:424329

16.下列正确的是()
选项A:D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用
选项B:D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行
选项C:D3采用的是Selectors API的第一级标准
选项D:基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。
正确答案问询微信:424329

17.借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。
选项A:消费能力
选项B:趋势报告
选项C:购物结果
正确答案问询微信:424329

18.层次方法可以分为()
选项A:K均值算法
选项B:K中心点算法
选项C:凝聚法
选项D:分裂法
正确答案问询微信:424329

19.统计图表的可视化方法主要包括()
选项A:散点图
选项B:折线图
选项C:条形图
选项D:饼图
正确答案问询微信:424329

20.数据归约(Data Reduction)主要有有()
选项A:维度规约
选项B:样本规约
选项C:数据聚集
选项D:离散化概念分层
正确答案问询微信:424329

21.对于数值属性,我们使用()来评估一个属性的值如何随另一个属性变化。
选项A:欧式距离
选项B:相关系数
选项C:协方差
正确答案问询微信:424329

22.一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
选项A:一个名字节点
选项B:若干个名字节点
选项C:一个数据节点
选项D:若干个数据节点
正确答案问询微信:424329

23.大数据存储的特点与挑战有()
选项A:容量问题
选项B:延迟问题
选项C:安全问题
选项D:成本问题
正确答案问询微信:424329

24.数据预处理的过程主要是
选项A:数据清洗
选项B:数据集成
选项C:数据变换
选项D:数据规约
正确答案问询微信:424329

25.大数据四大特征包括( )
选项A:数据量大
选项B:数据类型繁多
选项C:数据价值密度相对较低
选项D:处理速度快,时效性要求高
正确答案问询微信:424329

26.数据工厂包括
选项A:低能耗数据中心
选项B:超大规模讲分布式架构
选项C:新一代智能自动化运维
选项D:超强云安全
正确答案问询微信:424329

27.数据分析的类型根据数据分析深度可以分为()
选项A:描述性分析
选项B:预测性分析s
选项C:规则性分析
正确答案问询微信:424329

28.云计算是##,##,##的发展?,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
选项A:流计算
选项B:分布式计算
选项C:并行计算
选项D:网络计算
正确答案问询微信:424329

29.大数据在医疗中的应用有()
选项A:流行性疾病预防
选项B:慢性病健康管理
选项C:临床决策支持
选项D:医疗器械研发
正确答案问询微信:424329

30.医疗大数据的来源主要包括()
选项A:制药企业/生命科学
选项B:临床医疗/实验室数据
选项C:费用报销/利用率
选项D:健康管理/社交网络
正确答案问询微信:424329

31.由于数据变成资源,成为有价值的东西,数据私有化和独占问题就是客观存在的,成为关注的焦点。数据产权界定问题日益突出,在数据权属确定的情况下,数据商品化将成为必然选择
选项A:对
选项B:错
正确答案问询微信:424329

32.所有关系型数据中的数据全部为结构化数据。半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。
选项A:对
选项B:错
正确答案问询微信:424329

33.云计算出现后,数据存储服务衍生出了新的商业模式,数据中心的出现降低了公司的计算和存储成本。
选项A:对
选项B:错
正确答案问询微信:424329

34.大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。
选项A:对
选项B:错
正确答案问询微信:424329

35.数据的大量聚集,使得黑客一次成功的攻击能够获得更多的数据,无形中降低了黑客的进攻成本,增加了“收益率“。
选项A:对
选项B:错
正确答案问询微信:424329

36.交通数据集通常包括空间和时间特性而且跨越大范围的时间空间。数据聚类可以有效的减小数据规模为随后的分析提供便利。
选项A:对
选项B:错
正确答案问询微信:424329

37.R是一种开源编程语言和软件环境,用于数据挖掘、数据分析和可视化。
选项A:对
选项B:错
正确答案问询微信:424329

38.通常将统计指标的数值按长奥鹏南开大学新学期作业参考度顺序排列所形成的数列,称为时间序列。
选项A:对
选项B:错
正确答案问询微信:424329

39.分箱方法通过考察数据的”近邻”(即周围的值)来光滑有序数据的值。这些有序的值被分布到一些”箱”中。由于分箱法考察临近的值,因此进行全局光滑。
选项A:对
选项B:错
正确答案问询微信:424329

40.饼图以二维或者三维的形式表示某一数据相对于数据总量的大小,用于数据之间比重的比较。
选项A:对
选项B:错
正确答案问询微信:424329

41.利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。
选项A:对
选项B:错
正确答案问询微信:424329

42.大数据需要对多种数据混合访问,催生出了新的、需要考虑安全性的问题。
选项A:对
选项B:错
正确答案问询微信:424329

43.在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意数据的结构。这旨在确保源系统中的函数依赖和参照约束与目标系统中的匹配。
选项A:对
选项B:错
正确答案问询微信:424329

44.通过大数据的分析将会更精确地预测未来的天气,帮助农民做好自然灾害的预防工作,帮助政府实现农业的精细化管理和科学决策。
选项A:对
选项B:错
正确答案问询微信:424329

45.数据仓库是一个面向主题的(subject oriented)、集成的(integrate),相对稳定的(non-volatile)、反映历史变化(time variant)的数据集合,以用于支持管理决策过程。
选项A:对
选项B:错
正确答案问询微信:424329

46.NAS代表的意思是网络附加存储
选项A:对
选项B:错
正确答案问询微信:424329

47.云存储不仅是存储设备或技术,更是一种服务的创新。
选项A:对
选项B:错
正确答案问询微信:424329

48.大数据的挑战仅仅来自于数据的增长。
选项A:对
选项B:错
正确答案问询微信:424329

49.Kafka是一种高吞吐量的的分布式发布订阅消息系统
选项A:对
选项B:错
正确答案问询微信:424329

50.离散化可以有效地克服数据中隐藏的缺陷,使模型结果更加稳定。
选项A:对
选项B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网