南开大学23秋学期《大数据导论》在线作业一

奥鹏南开大学23年秋季新学期作业参考

23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《大数据导论》在线作业-00001

下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A:ggplot2
B:network
C:ggmaps
D:animation
正确答案问询微信:424329

下面哪一项不是中国发展大数据产业的基础()。
A:信息化积累了丰富的数据资源
B:大数据技术创新取得明显突破
C:大数据应用推动势头良好
D:大数据产业支撑薄弱
正确答案问询微信:424329

下列不属于Google云计算平台技术架构的是()
A:并行数据处理MapReduce
B:分布式锁Chu奥鹏南开大学23年秋季新学期作业参考bby
C:结构化数据表BigTable
D:弹性云计算EC2
正确答案问询微信:424329

下列不属于商业大数据类型的是
A:传统企业数据
B:机器和传感器数据
C:社交数据
D:电子商务数据
正确答案问询微信:424329

数据清洗的方法不包括
A:缺失值处理
B:噪声数据清除
C:一致性检查
D:重复数据记录处理
正确答案问询微信:424329

下列哪个工具常用来开发移动友好地交互地图()
A:Leaflet
B:Visual.ly
C:BPizza Pie Charts
D:Gephi
正确答案问询微信:424329

数据仓库是随着时间变化的,下列不正确的是()
A:数据仓库随时间变化不断增加新内容
B:捕捉到的新数据会覆盖原来的快照
C:数据仓库随事件变化不断删去旧的数据内容
D:数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案问询微信:424329

数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329

()是Microsoft Office的核心组件
A:SQL
B:WORD
C:PPT
D:EXCEL
正确答案问询微信:424329

数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329

数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329

医疗健康数据的基本情况不包括以下哪项?
A:诊疗数据
B:个人健康管理数据
C:公共安全数据
D:健康档案数据
正确答案问询微信:424329

用于描述相等时间间隔下连续数据随时间变化趋势的是()
A:折线图
B:散点图
C:条形图
D:饼图
正确答案问询微信:424329

基础设施即服务的英文简称是
A:IaaS
B:PaaS
C:SaaS
正确答案问询微信:424329

SAN是一种()
A:存储设备
B:专为数据存储而设计构建的网络
C:光纤交换机
D:HBA
正确答案问询微信:424329

KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了##、##、##、##。
A:数据集成
B:数据处理
C:数据分析
D:数据挖掘
正确答案问询微信:424329

交通数据处理包括以下几个步骤()
A:数据清洗
B:数据映射
C:数据组织
D:数据聚类
正确答案问询微信:424329

医疗领域如何利用大数据
A:临床决策支持
B:个性化医疗
C:社保资金安全
D:用户行为分析
正确答案问询微信:424329

医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()
A:多态性
B:时效性
C:不完整性
D:冗余性
正确答案问询微信:424329

大数据采集主要包括()四种。
A:系统日志采集
B:网络数据采集
C:数据库采集
D:其他数据采集
正确答案问询微信:424329

主流分布式计算平台有()
A:google
B:IBM
C:baidu
D:Amazon
正确答案问询微信:424329

下列属于传统统计学展示方法的是()
A:柱状图
B:饼状图
C:曲线图
D:网络图
正确答案问询微信:424329

常见的非结构化数据有()
A:web网页
B:即时消息
C:富文本文档
D:实时多媒体数据
正确答案问询微信:424329

数据分析的类型根据数据分析深度可以分为()
A:描述性分析
B:预测性分析s
C:规则性分析
正确答案问询微信:424329

大数据在电信中的应用有
A:基于用户、业务及流量分级的多维管控机制
B:精准的客户分析及营销
C:利用位置和轨迹信息服务社会
正确答案问询微信:424329

可使用##,##,##进行光滑。
A:最大值
B:箱中位数
C:箱边界
D:箱均值
正确答案问询微信:424329

可视化工具包括()
A:Excel
B:Google Chart
C:Gephi
D:ppt
正确答案问询微信:424329

关于R语言扩展包下列正确的是()
A:network可创建带有点和边的网络图
B:animation可制作一系列的图像并将它们串联起来做成动画
C:ggmaps通过树图来可视化层次型数据
D:protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
正确答案问询微信:424329

大数据智能感知层:主要包括()及软硬件资源接入系统
A:数据传感体系
B:网络通信体系
C:传感适配体系
D:智能识别体系
正确答案问询微信:424329

一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A:一个名字节点
B:若干个名字节点
C:一个数据节点
D:若干个数据节点
正确答案问询微信:424329

发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。
A:对
B:错
正确答案问询微信:424329

NAS代表的意思是网络附加存储
A:对
B:错
正确答案问询微信:424329

有些冗余可以被相关分析检测到。
A:对
B:错
正确答案问询微信:424329

NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。
A:对
B:错
正确答案问询微信:424329

云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。
A:对
B:错
正确答案问询微信:424329

社交数据分析工具是基于社交网站的海量数据而衍生出来的服务型产品,但是同时它们反过来也为社交网站提供了巨大的参考价值。
A:对
B:错
正确答案问询微信:424329

FP-growth算法需要对数据库进行三次扫描
A:对
B:错
正确答案问询微信:424329

云存储是一个由网络设备、存储设备、服务器、应用软件、公用访问接口、接入网和客户端程序等组成的复杂系统。
A:对
B:错
正确答案问询微信:424329

大数据可视化便于人们对数据的理解
A:对
B:错
正确答案问询微信:424329

内存分析数据量比BI分析数据量大
A:对
B:错
正确答案问询微信:424329

每个簇的质心(centroid)是该簇中所有数据对象的均值。
A:对
B:错
正确答案问询微信:424329

共享变量,就是各个节点都可以都共享的变量。
A:对
B:错
正确答案问询微信:424329

数据获取方式分为主动式获取和被动式获取
A:对
B:错
正确答案问询微信:424329

BI分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。
A:对
B:错
正确答案问询微信:424329

大数据数据量一定是PB,TB级的
A:对
B:错
正确答案问询微信:424329

《科学》(Science)杂志专刊——Dealing with data,通过社会调查的方式,第一次综合分析了大数据对人们生活造成的影响,详细描述了人类面临的“数据困境”。
A:对
B:错
正确答案问询微信:424329

广播变量在广播后可以修改
A:对
B:错
正确答案问询微信:424329

21世纪时数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。
A:对
B:错
正确答案问询微信:424329

饼图以二维或者三维的形式表示某一数据相对于数据总量的大小,用于数据之间比重的比较。
A:对
B:错
正确答案问询微信:424329

数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网