南开大学23年秋学期《大数据导论》在线作业二

奥鹏南开大学23年秋季新学期作业参考

23秋学期(仅限-高起专1909、专升本1909)《大数据导论》在线作业-00002

医疗健康数据的基本情况不包括以下哪项?
A:诊疗数据
B:个人健康管理数据
C:公共安全数据
D:健康档案数据
正确答案问询微信:424329

基础设施即服务的英文简称是
A:IaaS
B:PaaS
C:SaaS
正确答案问询微信:424329

SAN是一种()
A:存储设备
B:专为数据存储而设计构建的网络
C:光纤交换机
D:HBA
正确答案问询微信:424329

GFS中的文件切分成()的块进行存储
A:32MB
B:64MB
C:128MB
D:1G
正确答案问询微信:424329

数据清洗的方法不包括
A:缺失值处理
B:噪声数据清除
C:一致性检查
D:重复数据记录处理
正确答案问询微信:424329

哪个选项不属于大数据4V特点?
A:Volume
B:Valid
C:Variety
D:Value
正确答案问询微信:424329

大数据的最显著特征是() 。
A:数据规模大
B:数据类型多样
C:数据处理速度快
D:数据价值密度高
正确答案问询微信:424329

以下哪项不是数据可视化工具的特性()
A:实时性
B:简单操作
C:更丰富的展现
D:仅需一种数据支持方式即可
正确答案问询微信:424329

DAS代表的意思是()
A:两个异步存储
B:数据归档软件
C:连接一个可选的存储
D:直连存储
正确答案问询微信:424329

下列哪个R语言扩展包可以创建带有点和边的网络图()
A:ggplot2
B:network
C:ggmaps
D:animation
正确答案问询微信:424329

用于描述相等时间间隔下连续数据随时间变化趋势的是()
A:折线图
B:散点图
C:条形图
D:饼图
正确答案问询微信:424329

以下不是数据仓库基本特征的是()
A:数据仓库是面向主题的
B:数据仓库是面向事务的
C:数据仓库的数据是相对稳定的
D:数据仓库的数据是反映历史变化的
正确答案问询微信:424329

数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329

数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329

下列不属于Google云计算平台技术架构的是()
A:并行数据处理MapReduce
B:分布式锁Chubby
C:结构化数据表BigTable
D:弹性云计算EC2
正确答案问询微信:424329

以下可以用于数据可视化的是()。
A:R语言
B:Excel
C:RapidMiner
D:Weka
正确答案问询微信:424329

常见的非结构化数据有()
A:web网页
B:即时消息
C:富文本文档
D:实时多媒体数据
正确答案问询微信:424329

数据清洗(Data Cleaning)的方法有()
A:填充空缺值
B:清除数据中的噪声
C:识别或删除离群点并解决不一致性
正确答案问询微信:424329

数据变换的常用方法有##,##,##,##
A:中心化变换
B:极差规格化变换
C:标准化变换
D:对数变换
正确答案问询微信:424329

医疗大数据的来源主要包括()
A:制药企业/生命科学
B:临床医疗/实验室数据
C:费用报销/利用率
D:健康管理/社交网络
正确答案问询微信:424329

医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()
A:多态性
B:时效性
C:不完整性
D:冗余性
正确答案问询微信:424329

百度大脑包括()
A:深度学习
B:超大规模机器学习
C:大规模GPU并行化平台
正确答案问询微信:424329

关于R语言扩展包下列正确的是()
A:network可创建带有点和边的网络图
B:animation可制作一系列的图像并将它们串联起来做成动画
C:ggmaps通过树图来可视化层次型数据
D:protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
正确答案问询微信:424329

云计算的特点是()
A:大规模
B:高扩展性
C:虚拟化
D:按需分配
正确答案问询微信:424329

按照数据量的大小,可将数据分析分为()
A:内存级数据分析
B:Bl级数据分析
C:海量级数据分析
D:巨量级数据分析
正确答案问询微信:424329

一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A:一个名字节点
B:若干个名字节点
C:一个数据节点
D:若干个数据节点
正确答案问询微信:424329

传感器工作模式类别包括()
A:基于位置
B:基于活动
C:基于设备
正确答案问询微信:424329

下列正确的是()
A:D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用
B:D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运奥鹏南开大学23年秋季新学期作业参考行
C:D3采用的是Selectors API的第一级标准
D:基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。
正确答案问询微信:424329

数据处理的两种方法是##,##
A:批处理
B:流处理
C:单个处理
D:交叉处理
正确答案问询微信:424329

层次方法可以分为()
A:K均值算法
B:K中心点算法
C:凝聚法
D:分裂法
正确答案问询微信:424329

基于大数据研究个体或群体行为,发现活动中蕴含的空间认知规律及空间行为和交互模式,建立以人为本的地理信息服务,进而支持个体或群体时空行为决策。
A:对
B:错
正确答案问询微信:424329

数据可根据产生主体的不同分为两类:少量企业应用产生的数据和量个人用户产生的数据
A:对
B:错
正确答案问询微信:424329

分类是在给定数据基础上构建分类函数或分类模型,将数据划分到预定义的目标类中的某一种类别。
A:对
B:错
正确答案问询微信:424329

聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster)
A:对
B:错
正确答案问询微信:424329

原始交通数据记录是离散样本点而且可能不能映射到城市的道路网络中。
A:对
B:错
正确答案问询微信:424329

概念描述(concept description):对含有大量数据的数据集合进行概述性的总结并获得简明、准确的描述。
A:对
B:错
正确答案问询微信:424329

数据挖掘方法侧重于从数据驱动的角度出发获取模式或规律。因此,针对海量人类移动数据,数据挖掘方法可以发挥其挖掘模式或规律的长处。
A:对
B:错
正确答案问询微信:424329

发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。
A:对
B:错
正确答案问询微信:424329

数据规模大,难理解,分析过程离不开可视化技术,可视化将贯穿于大数据分析与结果展示的全过程,可视化己经成为很多领域研究的议题。
A:对
B:错
正确答案问询微信:424329

Flume的数据流由RDD贯穿始终。
A:对
B:错
正确答案问询微信:424329

由于数据变成资源,成为有价值的东西,数据私有化和独占问题就是客观存在的,成为关注的焦点。数据产权界定问题日益突出,在数据权属确定的情况下,数据商品化将成为必然选择
A:对
B:错
正确答案问询微信:424329

麦肯锡给出的大数据定义是大数据指的是大小超出常规的数据库工具获取、存储、管理、和分析能力的数据集。
A:对
B:错
正确答案问询微信:424329

FP-growth算法需要对数据库进行3次扫描
A:对
B:错
正确答案问询微信:424329

大数据虽然拥有大量的价值信息,但是价值密度较低
A:对
B:错
正确答案问询微信:424329

轨迹数据包含空间和时间属性,并且通常规模巨大且维度高
A:对
B:错
正确答案问询微信:424329

数据会吸引更多的潜在攻击者,成为更具吸引力的目标。
A:对
B:错
正确答案问询微信:424329

交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。
A:对
B:错
正确答案问询微信:424329

人类移动行为预测研究工作框架图,可以看到在人类移动行为预测工作中,大数据是基础,前沿技术是工具,而多样应用是驱动力。
A:对
B:错
正确答案问询微信:424329

云计算(Cloud Computing)?是一种分布在大规模数据中心、能动态的提供各种服务器资源以满足科研、电子商务等领域需求的计算平台。
A:对
B:错
正确答案问询微信:424329

数据流要表现出流数据的特征,反映的是系统中流动的数据;
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网