南开大学23年秋学期《大数据导论》在线作业一

奥鹏南开大学23年秋季新学期作业参考

23秋学期(仅限-高起专1909、专升本1909)《大数据导论》在线作业-00001

数据清洗的方法不包括
A:缺失值处理
B:噪声数据清除
C:一致性检查
D:重复数据记录处理
正确答案问询微信:424329

用于描述数据分散情况的是()
A:分布图
B:箱式图
C:饼图
D:折线图
正确答案问询微信:424329

下列不属于商业大数据类型的是
A:传统企业数据
B:机器和传感器数据
C:社交数据
D:电子商务数据
正确答案问询微信:424329

大数据的特点不包含
A:数据体量大
B:价值密度高
C:处理速度快
D:数据不统一
正确答案问询微信:424329

()是Microsoft Office的核心组件
A:SQL
B:WORD
C:PPT
D:EXCEL
正确答案问询微信:424329

医疗健康数据的基本情况不包括以下哪项?
A:诊疗数据
B:个人健康管理数据
C:公共安全数据
D:健康档案数据
正确答案问询微信:424329

下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A:ggplot2
B:network
C:ggmaps
D:animation
正确答案问询微信:424329

GFS中的文件切分成()的块进行存储
A:32MB
B:64MB
C:128MB
D:1G
正确答案问询微信:424329

下面哪一项不是中国发展大数据产业的基础()。
A:信息化积累了丰富的数据资源
B:大数据技术创新取得明显突破
C:大数据应用推动势头良好
D:大数据产业支撑薄弱
正确答案问询微信:424329

基础设施即服务的英文简称是
A:IaaS
B:PaaS
C:SaaS
正确答案问询微信:424329

SAN是一种()
A:存储设备
B:专为数据存储而设计构建的网络
C:光纤交换机
D:HBA
正确答案问询微信:424329

以下不是数据仓库基本特征的是()
A:数据仓库是面向主题的
B:数据仓库是面向事务的
C:数据仓库的数据是相对稳定的
D:数据仓库的数据是反映历史变化的
正确答案问询微信:424329

下列不属于Google云计算平台技术架构的是()
A:并行数据处理MapReduce
B:分布式锁Chubby
C:结构化数据表BigTable
D:弹性云计算EC2
正确答案问询微信:424329

下列哪个R语言扩展包可以创建带有点和边的网络图()
A:ggplot2
B:network
C:ggmaps
D:animation
正确答案问询微信:424329

数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329

##和##,它们把原数据变换或投影到较小的空间。
A:小波变换
B:中心化变换
C:主成分分析
D:对数变换
正确答案问询微信:424329

大数据在电信中的应用有
A:基于用户、业务及流量分级的多维管控机制
B:精准的客户分析及营销
C:利用位置和轨迹信息服务社会
正确答案问询微信:424329

交通数据处理包括以下几个步骤()
A:数据清洗
B:数据映射
C:数据组织
D:数据聚类
正确答案问询微信:424329

常见的非结构化数据有()
A:web网页
B:即时消息
C:富文本文档
D:实时多媒体数据
正确答案问询微信:424329

下列属于传统统计学展示方法的是()
A:柱状图
B:饼状图
C:曲线图
D:网络图
正确答案问询微信:424329

大数据采集主要包括()四种。
A:系统日志采集
B:网络数据采集
C:数据库采集
D:其他数据采集
正确答案问询微信:424329

医疗领域如何利用大数据
A:临床决策支持
B:个性化医疗
C:社保资金安全
D:用户行为分析
正确答案问询微信:424329

数据变换的常用方法有##,##,##,##
A:中心化变换
B:极差规格化变换
C:标准化变换
D:对数变换
正确答案问询微信:424329

大数据时代预测人类移动行为的数据特点是
A:多样化
B:数据量大
C:维数高
D:变化快
正确答案问询微信:424329

网络数据采集常用的是通过##或##等方式从网站上获取数据信息。
A:网络爬虫
B:网站公开API
C:手动获取
正确答案问询微信:424329

数据清洗(Data Cleaning)的方法有()
A:填充空缺值
B:清除数据中的噪声
C:识别或删除离群点并解决不一致性
正确答案问询微信:424329

一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A:一个名字节点
B:若干个名字节点
C:一个数据节点
D:若干个数据节点
正确答案问询微信:424329

云计算是##,##,##的发展?,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
A:流计算
B:分布式计算
C:并行计算
D:网络计算
正确答案问询微信:424329

以下可以用于数据可视化的是()。
A:R语言
B:Excel
C:RapidMiner
D:Weka
正确答案问询微信:424329

关于R语言扩展包下列正确的是()
A:network可创建带有点和边的网络图
B:animation可制作一系列的图像并将它们串联起来做成动画
C:ggmaps通过树图来可视化层次型数据
D:protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
正确答案问询微信:424329

分类是根奥鹏南开大学23年秋季新学期作业参考据在数据中发现的描述对象及其关系的信息,将数据对象分组。
组内相似度高,组间差异性大。
A:对
B:错
正确答案问询微信:424329

地图属于数据可视化的一种
A:对
B:错
正确答案问询微信:424329

一个属性如果能由另一个或一组属性导出,则这个属性可能是冗余的。
A:对
B:错
正确答案问询微信:424329

数据规模大,难理解,分析过程离不开可视化技术,可视化将贯穿于大数据分析与结果展示的全过程,可视化己经成为很多领域研究的议题。
A:对
B:错
正确答案问询微信:424329

在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等 领域的半结构化数据和非结构化数据
A:对
B:错
正确答案问询微信:424329

谷歌大数据流感趋势已经可以替代当前政府在流感监测方面的工作。( )
A:对
B:错
正确答案问询微信:424329

大数据需要对多种数据混合访问,催生出了新的、需要考虑安全性的问题。
A:对
B:错
正确答案问询微信:424329

数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式
A:对
B:错
正确答案问询微信:424329

利用虚拟化方法减少物理存储空间的分配,最大限度提升存储空间利用率。
A:对
B:错
正确答案问询微信:424329

时空数据可视化与地理制图学相结合,重点对时间与空间维度,以及与之相关的信息对象属性建立可视化表征,对与时间和空间密切相关的模式及规律进行展示
A:对
B:错
正确答案问询微信:424329

噪声(noise)是被测量变量的随机误差或方差。
A:对
B:错
正确答案问询微信:424329

21世纪时数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。
A:对
B:错
正确答案问询微信:424329

聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster)
A:对
B:错
正确答案问询微信:424329

FP-growth算法需要对数据库进行三次扫描
A:对
B:错
正确答案问询微信:424329

大数据采集主要分为大数据智能感知层和基础支撑层
A:对
B:错
正确答案问询微信:424329

Human mobility 即“人类移动性”,表示人类个体或群体在地理空间中具有特定意义的“移动(Movement)”所隐含的社会系统要素时空分布与演化规律。
A:对
B:错
正确答案问询微信:424329

大数据分为“结构化数据“与”非结构化数据”和“半结构化数据”。
A:对
B:错
正确答案问询微信:424329

大数据的挑战仅仅来自于数据的增长。
A:对
B:错
正确答案问询微信:424329

实时数据分析一般用于金融、移动网络、物联网和互联网B2C等产品。
A:对
B:错
正确答案问询微信:424329

数据可视化。将大型数据集中的数据通过图形图像方式表示,并利用数据分析和开发工具发现其中未知信息。
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网