南开23春学期(高起本:1709-2103、专升本高起专:1903-2103)《大数据导论》在线作业二

奥鹏南开大学新学期作业参考

南开23春学期(高起本:1709-2103、专升本高起专:1903-2103)《大数据导论》在线作业二插图

南开大学23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《大数据导论》在线作业

1.DAS代表的意思是()
选项A:两个异步存储
选项B:数据归档软件
选项C:连接一个可选的存储
选项D:直连存储
正确答案问询微信:424329

2.下列不属于Google云计算平台技术架构的是()
选项A:并行数据处理MapReduce
选项B:分布式锁Chubby
选项C:结构化数据表BigTable
选项D:弹性云计算EC2
正确答案问询微信:424329

3.大数据的特点不包含
选项A:数据体量大
选项B:价值密度高
选项C:处理速度快
选项D:数据不统一
正确答案问询微信:424329

4.购物篮问题是##的典型案例
选项A:数据变换
选项B:关联规则挖掘
选项C:数据分类
正确答案问询微信:424329

5.GFS中的文件切分成()的块进行存储
选项A:32MB
选项B:64MB
选项C:128MB
选项D:1G
正确答案问询微信:424329

6.数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
选项A:运营式系统阶段
选项B:用户原创内容阶段
选项C:感知式系统阶段
正确答案问询微信:424329

7.下列不属于商业大数据类型的是
选项A:传统企业数据
选项B:机器和传感器数据
选项C:社交数据
选项D:电子商务数据
正确答案问询微信:424329

8.数据仓库是随着时间变化的,下列不正确的是()
选项A:数据仓库随时间变化不断增加新内容
选项B:捕捉到的新数据会覆盖原来的快照
选项C:数据仓库随事件变化不断删去旧的数据内容
选项D:数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案问询微信:424329

9.用于描述数据分散情况的是()
选项A:分布图
选项B:箱式图
选项C:饼图
选项D:折线图
正确答案问询微信:424329

10.哪个选项不属于大数据4V特点?
选项A:Volume
选项B:Valid
选项C:Variety
选项D:Value
正确答案问询微信:424329

11.MapReduce中的Map和Reduce函数使用()进行输入输出
选项A:key/value对
选项B:随机数值
选项C:其他计算结果
正确答案问询微信:424329

12.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
选项A:运营式系统阶段
选项B:用户原创内容阶段
选项C:感知式系统阶段
正确答案问询微信:424329

13.下列哪个工具常用来开发移动友好地交互地图()
选项A:Leaflet
选项B:Visual.ly
选项C:BPizza Pie Charts
选项D:Gephi
正确答案问询微信:424329

14.下列哪个R语言扩展包可以创建带有点和边的网络图()
选项A:ggplot2
选项B:network
选项C:ggmaps
选项D:animation
正确答案问询微信:424329

15.SAN是一种()
选项A:存储设备
选项B:专为数据存储而设计构建的网络
选项C:光纤交换机
选项D:HBA
正确答案问询微信:424329

16.开放云()
选项A:价值呈现:大数据应用价值呈现和创新不足
选项B:应用建设:周期长、门槛高、多冗余、体验差
选项C:组织流程:应用跨部门,缺乏流程贯串和使能业务生产
选项D:生态建设:无法有效构建和融入新的数字生态圈
正确答案问询微信:424329

17.互连网上出现的海量信息可以划分为三种,分别为( )
选项A:结构化信息
选项B:非结构化信息
选项C:半结构化信息
选项D:特殊化信息
正确答案问询微信:424329

18.下列正确的是()
选项A:D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用
选项B:D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行
选项C:D3采用的是Selectors API的第一级标准
选项D:基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。
正确答案问询微信:424329

19.大数据在教育中的应用
选项A:网上公开课
选项B:慕课
选项C:智慧校园
选项D:翻转课堂
正确答案问询微信:424329

20.大数据时代预测人类移动行为的数据来源有
选项A:志愿者定位数据
选项B:装有导航设备的出租车轨迹数据
选项C:手机终端定位于通讯记录
选项D:社会网络签到数据
正确答案问询微信:424329

21.下列属于传统统计学展示方法的是()
选项A:柱状图
选项B:饼状图
选项C:曲线图
选项D:网络图
正确答案问询微信:424329

22.##和##,它们把原数据变换或投影到较小的空间。
选项A:小波变换
选项B:中心化变换
选项C:主成分分析
选项D:对数变换
正确答案问询微信:424329

23.大数据四大特征包括( )
选项A:数据量大
选项B:数据类型繁多
选项C:数据价值密度相对较低
选项D:处理速度快,时效性要求高
正确答案问询微信:424329

24.按照数据量的大小,可将数据分析分为()
选项A:内存级数据分析
选项B:Bl级数据分析
选项C:海量级数据分析
选项D:巨量级数据分析
正确答案问询微信:424329

25.主流分布式计算平台有()
选项A:google
选项B:IBM
选项C:baidu
选项D:Amazon
正确答案问询微信:424329

26.KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了##、##、##、##。
选项A:数据集成
选项B:数据处理
选项C:数据分析
选项D:数据挖掘
正确答案问询微信:424329

27.离群点检测的应用包括()等。
选项A:欺诈检测
选项B:入侵检测
选项C:故障检测
选项D:疾病的不寻常模式
正确答案问询微信:424329

28.数据变换的常用方法有##,##,##,##
选项A:中心化变换
选项B:极差规格化变换
选项C:标准化变换
选项D:对数变换
正确答案问询微信:424329

29.大数据时代预测人类移动行为的数据特点是
选项A:多样化
选项B:数据量大
选项C:维数高
选项D:变化快
正确答案问询微信:424329

30.大数据带来的挑战有哪些( )。
选项A:会导致数据盲点
选项B:危及个人隐私
选项C:造成群体歧视
选项D:产生庞大能耗
正确答案问询微信:424329

31.箱式图用于描述数据的分散情况,主要数据节点包括:均值、中值、等中心值的度 量,标准偏差、方差等可变性度量。
选项A:对
选项B:错
正确答案问询微信:424329

32.交通数据涉及到交通车辆或者道路两旁安装的传感器生成和手机的数据集。
选项A:对
选项B:错
正确答案问询微信:424329

33.关联分析是从有噪声的、模糊的、随机的海量数据中,挖掘出隐藏的、事先不知道、但是有潜在关联的信息或知识的过程。
选项A:对
选项B:错
正确答案问询微信:424329

34.NAS代表的意思是网络附加存储
选项A:对
选项B:错
正确答案问询微信:424329

35.数据仓库是一个面向主题的(subject oriented)、集成的(integrate),相对稳定的(non-volatile)、反映历史变化(time variant)的数据集合,以用于支持管理决策过程。
选项A:对
选项B:错
正确答案问询微信:424329

36.Spark的亮点是充分利用内存承载工作集,而且能保证容错。
选项A:对
选项B:错
正确答案问询微信:424329

37.宁家骏委员指出,大数据要与“互联网+”医疗健康紧密结合起来,国家明确支持“互联网+”医疗、“互联网+”健康。
选项A:对
选项B:错
正确答案问询微信:424329

38.利用虚拟化方法减少物理存储空间的分配,最大限度提升存储空间利用率。
选项A:对
选项B:错
正确答案问询微信:424329

39.内存分析数据量比BI分析数据量大
选项A:对
选项B:错
正确答案问询微信:424329

40.数据可视化。将大型数据集中的数据通过图形图像方式表示,并利用数据分析和开发工具发现其中未知信息。
选项A:对
选项B:错
正确答案问询微信:424329

41.交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。
选项A:对
选项B:错
正确答案问询微信:424329

42.线性回归涉及找出拟合两个属性(或变量)的“最佳”直线,使一个属性可以用来预测另一个。
选项A:对
选项B:错
正确答案问询微信:424329

43.聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每奥鹏南开大学新学期作业参考个子集称为一个簇(Cluster)
选项A:对
选项B:错
正确答案问询微信:424329

44.用户可以感知不同属性之间的相关性,过滤掉噪声和不相关的轨迹,用于进一步调查有趣的案例。分析人员可以交互式地逐步优化设置以改进结果。
选项A:对
选项B:错
正确答案问询微信:424329

45.大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。
选项A:对
选项B:错
正确答案问询微信:424329

46.累加器只有驱动程序才能读取
选项A:对
选项B:错
正确答案问询微信:424329

47.数据挖掘方法侧重于从数据驱动的角度出发获取模式或规律。因此,针对海量人类移动数据,数据挖掘方法可以发挥其挖掘模式或规律的长处。
选项A:对
选项B:错
正确答案问询微信:424329

48.基于QQ用户位置变化轨迹,建立模型测算迁徙规模,分析人口迁徙方向及其影响因素。
选项A:对
选项B:错
正确答案问询微信:424329

49.利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。
选项A:对
选项B:错
正确答案问询微信:424329

50.不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态( )
选项A:对
选项B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网