南开23春学期(高起专1903、专升本1903)《大数据导论》在线作业三

奥鹏南开大学新学期作业参考

南开23春学期(高起专1903、专升本1903)《大数据导论》在线作业三插图

南开大学23春学期(高起专1903、专升本1903)《大数据导论》在线作业

1.第一个提出大数据概念的公司是( )。
选项A:麦肯锡公司
选项B:谷歌公司
选项C:微软公司
选项D:脸谱公司
正确答案问询微信:424329

2.下列哪个工具常用来开发移动友好地交互地图()
选项A:Leaflet
选项B:Visual.ly
选项C:BPizza Pie Charts
选项D:Gephi
正确答案问询微信:424329

3.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
选项A:ggplot2
选项B:network
选项C:ggmaps
选项D:animation
正确答案问询微信:424329

4.MapReduce中的Map和Reduce函数使用()进行输入输出
选项A:key/value对
选项B:随机数值
选项C:其他计算结果
正确答案问询微信:424329

5.医疗健康数据的基本情况不包括以下哪项?
选项A:诊疗数据
选项B:个人健康管理数据
选项C:公共安全数据
选项D:健康档案数据
正确答案问询微信:424329

6.购物篮问题是##的典型案例
选项A:数据变换
选项B:关联规则挖掘
选项C:数据分类
正确答案问询微信:424329

7.下面哪一项不是中国发展大数据产业的基础()。
选项A:信息化积累了丰富的数据资源
选项B:大数据技术创新取得明显突破
选项C:大数据应用推动势头良好
选项D:大数据产业支撑薄弱
正确答案问询微信:424329

8.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
选项A:运营式系统阶段
选项B:用户原创内容阶段
选项C:感知式系统阶段
正确答案问询微信:424329

9.SAN是一种()
选项A:存储设备
选项B:专为数据存储而设计构建的网络
选项C:光纤交换机
选项D:HBA
正确答案问询微信:424329

10.数据仓库是随着时间变化的,下列不正确的是()
选项A:数据仓库随时间变化不断增加新内容
选项B:捕捉到的新数据会覆盖原来的快照
选项C:数据仓库随事件变化不断删去旧的数据内容
选项D:数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案问询微信:424329

11.大数据的特点不包含
选项A:数据体量大
选项B:价值密度高
选项C:处理速度快
选项D:数据不统一
正确答案问询微信:424329

12.以下哪项不是数据可视化工具的特性()
选项A:实时性
选项B:简单操作
选项C:更丰富的展现
选项D:仅需一种数据支持方式即可
正确答案问询微信:424329

13.GFS中的文件切分成()的块进行存储
选项A:32MB
选项B:64MB
选项C:128MB
选项D:1G
正确答案问询微信:424329

14.()是Microsoft Office的核心组件
选项A:SQL
选项B:WORD
选项C:PPT
选项D:EXCEL
正确答案问询微信:424329

15.DAS代表的意思是()
选项A:两个异步存储
选项B:数据归档软件
选项C:连接一个可选的存储
选项D:直连存储
正确答案问询微信:424329

16.互连网上出现的海量信息可以划分为三种,分别为( )
选项A:结构化信息
选项B:非结构化信息
选项C:半结构化信息
选项D:特殊化信息
正确答案问询微信:424329

17.常见的非结构化数据有()
选项A:web网页
选项B:即时消息
选项C:富文本文档
选项D:实时多媒体数据
正确答案问询微信:424329

18.大数据时代预测人类移动行为的数据来源有
选项A:志愿者定位数据
选项B:装有导航设备的出租车轨迹数据
选项C:手机终端定位于通讯记录
选项D:社会网络签到数据
正确答案问询微信:424329

19.云计算是##,##,##的发展?,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
选项A:流计算
选项B:分布式计算
选项C:并行计算
选项D:网络计算
正确答案问询微信:424329

20.数据变换(Data Transformation)的方法有()
选项A:光滑
选项B:聚集
选项C:数据泛化
选项D:规范化
正确答案问询微信:424329

21.最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的()等。
选项A:用户行为数据
选项B:日志式的活动数据
选项C:事件信息
正确答案问询微信:424329

22.大数据存储的特点与挑战有()
选项A:容量问题
选项B:延迟问题
选项C:安全问题
选项D:成本问题
正确答案问询微信:424329

23.可使用##,##,##进行光滑。
选项A:最大值
选项B:箱中位数
选项C:箱边界
选项D:箱均值
正确答案问询微信:424329

24.数据工厂包括
选项A:低能耗数据中心
选项B:超大规模讲分布式架构
选项C:新一代智能自动化运维
选项D:超强云安全
正确答案问询微信:424329

25.基于大数据的临床决策支持系统的架构包括
选项A:支撑层
选项B:大数据分析层
选项C:网络层
选项D:应用层
正确答案问询微信:424329

26.一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
选项A:一个名字节点
选项B:若干个名字节点
选项C:一个数据节点
选项D:若干个数据节点
正确答案问询微信:424329

27.数据处理的两种方法是##,##
选项A:批处理
选项B:流处理
选项C:单个处理
选项D:交叉处理
正确答案问询微信:424329

28.按照数据量的大小,可将数据分析分为()
选项A:内存级数据分析
选项B:Bl级数据分析
选项C:海量级数据分析
选项D:巨量级数据分析
正确答案问询微信:424329

29.百度大脑包括()
选项A:深度学习
选项B:超大规模机器学习
选项C:大规模GPU并行化平台
正确答案问询微信:424329

30.常见的分类方法有
选项A:决策树
选项B:贝叶斯网络
选项C:遗传算法
选项D:FP算法
正确答案问询微信:424329

31.城市公共交通规划、教育资源配置、医疗资源配置、商业中心建设、房地产规划、产业规划、城市建设等都可以借助于大数据技术进行良好的规划和动态调整。
选项A:对
选项B:错
正确答案问询微信:424329

32.交通数据涉及到交通车辆或者道路两旁安装的传感器生成和手机的数据集。
选项A:对
选项B:错
正确答案问询微信:424329

33.箱式图用于描述数据的分散情况,主要数据节点包括:均值、中值、等中心值的度 量,标准偏差、方差等可变性度量。
选项A:对
选项B:错
正确答案问询微信:424329

34.数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件。
选项A:对
选项B:错
正确答案问询微信:424329

35.交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。
选项A:对
选项B:错
正确答案问询微信:424329

36.事件是Flume的基本数据单位
选项A:对
选项B:错
正确答案问询微信:424329

37.数据获取方式分为主动式获取和被动式获取
选项A:对
选项B:错
正确答案问询微信:424329

38.大数据的挑战仅仅来自于数据的增长。
选项A:对
选项B:错
正确答案问询微信:424329

39.不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态( )
选项A:对
选项B:错
正确答案问询微信:424329

40.宁家骏委员指出,大数据要与“互联网+”医疗健康紧密结合起来,国家明确支持“互联网+”医疗、“互联网+”健康。
选项A:对
选项B:错
正确答案问询微信:424329

41.Human mobility 即“人类移动性”,表示人类个体或群体在地理空间中具有特定意义的“移动(Movement)”所隐含的社会系统要素时空分布与演化规律。
选项A:对
选项B:错
正确答案问询微信:424329

42.内存分析数据量比BI分析数据量大
选项A:对
选项B:错
正确答案问询微信:424329

43.FP是一种最有影响的挖掘布尔关联规则频繁项集的算法
选项A:对
选项B:错
正确答案问询微信:424329

44.内存级分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。
选项A:对
选项B:错
正确答案问询微信:424329

45.在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等 领域的半结构化数据和非结构化数据
选项A:对
选项B:错
正确答案问询微信:424329

46.利用大数据技术对电子病历中的数字化信息进行分析处理,既能够让医生的诊疗有迹可循,还可以发现最有效的临床路径,从而及时为医生提供最佳的诊疗建议。
选项A:对
选项B:错
正确答案问询微信:424329

47.基于大数据的智慧医疗系统的建立,能显著的提高医疗机构的信息化水平,为医院、患者带去更多的利益。
选项A:对
选项B:错
正确答案问询微信:424329

48.数据仓库中的元数据分为技术元数据和业务元数据
选项A:对
选项B:错
正确答案问询微信:424329

49.数据流要表现出流数据的特征,反映的是系统中流动的数据;
选项A:对
选项B:错
正确答案问询微信:424329

50.云存储是指通过集群应用、网络技奥鹏南开大学新学期作业参考术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。
选项A:对
选项B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网