南开大学23年春《大数据导论》在线作业一

奥鹏南开大学新学期作业参考

23春学期(仅限-高起专1903、专升本1903)《大数据导论》在线作业-00001

基础设施即服务的英文简称是
A:IaaS
B:PaaS
C:SaaS
正确答案问询微信:424329

SAN是一种()
A:存储设备
B:专为数据存储而设计构建的网络
C:光纤交换机
D:HBA
正确答案问询微信:424329

数据仓库是随着时间变化的,下列不正确的是()
A:数据仓库随时间变化不断增加新内容
B:捕捉到的新数据会覆盖原来的快照
C:数据仓库随事件变化不断删去旧的数据内容
D:数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案问询微信:424329

下面哪一项不是中国发展大数据产业的基础()。
A:信息化积累了丰富的数据资源
B:大数据技术创新取得明显突破
C:大数据应用推动势头良好
D:大数据产业支撑薄弱
正确答案问询微信:424329

下列哪个R语言扩展包可以创建带有点和边的网络图()
A:ggplot2
B:network
C:ggmaps
D:animation
正确答案问询微信:424329

下列哪个R语言扩展包可以制作一系列的图像奥鹏南开大学新学期作业参考 代做2元一门并将它们串联起来做成动画()
A:ggplot2
B:network
C:ggmaps
D:animation
正确答案问询微信:424329

购物篮问题是##的典型案例
A:数据变换
B:关联规则挖掘
C:数据分类
正确答案问询微信:424329

GFS中的文件切分成()的块进行存储
A:32MB
B:64MB
C:128MB
D:1G
正确答案问询微信:424329

数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329

下列哪个工具常用来开发移动友好地交互地图()
A:Leaflet
B:Visual.ly
C:BPizza Pie Charts
D:Gephi
正确答案问询微信:424329

PaaS是()的简称
A:软件即服务
B:平台即服务
C:基础设施即服务
D:硬件即服务
正确答案问询微信:424329

用于描述相等时间间隔下连续数据随时间变化趋势的是()
A:折线图
B:散点图
C:条形图
D:饼图
正确答案问询微信:424329

用于描述数据分散情况的是()
A:分布图
B:箱式图
C:饼图
D:折线图
正确答案问询微信:424329

数据清洗的方法不包括
A:缺失值处理
B:噪声数据清除
C:一致性检查
D:重复数据记录处理
正确答案问询微信:424329

大数据的特点不包含
A:数据体量大
B:价值密度高
C:处理速度快
D:数据不统一
正确答案问询微信:424329

按照数据量的大小,可将数据分析分为()
A:内存级数据分析
B:Bl级数据分析
C:海量级数据分析
D:巨量级数据分析
正确答案问询微信:424329

统计图表的可视化方法主要包括()
A:散点图
B:折线图
C:条形图
D:饼图
正确答案问询微信:424329

去除噪声使得数据光滑的技术主要有:
A:分箱
B:回归
C:离群点分析
正确答案问询微信:424329

云计算的特点是()
A:大规模
B:高扩展性
C:虚拟化
D:按需分配
正确答案问询微信:424329

基于大数据的临床决策支持系统的架构包括
A:支撑层
B:大数据分析层
C:网络层
D:应用层
正确答案问询微信:424329

数据处理的两种方法是##,##
A:批处理
B:流处理
C:单个处理
D:交叉处理
正确答案问询微信:424329

最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的()等。
A:用户行为数据
B:日志式的活动数据
C:事件信息
正确答案问询微信:424329

数据归约(Data Reduction)主要有()
A:维度规约
B:样本规约
C:数据聚集
D:离散化概念分层
正确答案问询微信:424329

百度大脑包括()
A:深度学习
B:超大规模机器学习
C:大规模GPU并行化平台
正确答案问询微信:424329

一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A:一个名字节点
B:若干个名字节点
C:一个数据节点
D:若干个数据节点
正确答案问询微信:424329

可使用##,##,##进行光滑。
A:最大值
B:箱中位数
C:箱边界
D:箱均值
正确答案问询微信:424329

大数据时代预测人类移动行为的数据来源有
A:志愿者定位数据
B:装有导航设备的出租车轨迹数据
C:手机终端定位于通讯记录
D:社会网络签到数据
正确答案问询微信:424329

数据变换的常用方法有##,##,##,##
A:中心化变换
B:极差规格化变换
C:标准化变换
D:对数变换
正确答案问询微信:424329

下列正确的是()
A:D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用
B:D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行
C:D3采用的是Selectors API的第一级标准
D:基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。
正确答案问询微信:424329

关于R语言扩展包下列正确的是()
A:network可创建带有点和边的网络图
B:animation可制作一系列的图像并将它们串联起来做成动画
C:ggmaps通过树图来可视化层次型数据
D:protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
正确答案问询微信:424329

描述性分析(Descriptive Analysis)基于当前事件来描述发生的事件
A:对
B:错
正确答案问询微信:424329

网络数据采集是利用互联网搜索引擎技术对数据进行针对性、行业性、精准性的抓取,并按照一定规则和筛选标准将数据进行归类,形成数据库文件的一个过程。
A:对
B:错
正确答案问询微信:424329

半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。
A:对
B:错
正确答案问询微信:424329

事件是Flume的基本数据单位
A:对
B:错
正确答案问询微信:424329

云存储不仅是存储设备或技术,更是一种服务的创新。
A:对
B:错
正确答案问询微信:424329

韩国政府利用位置信息和通话记录数据,规划出合理的公交线路,提升了政府科学决策和公共服务水平,提高了公众满意度。
A:对
B:错
正确答案问询微信:424329

海量数据存储系统的扩展能力也要得到相应等级的提升,扩展还必须简便。
A:对
B:错
正确答案问询微信:424329

大数据从概念化走向价值化是大数据的发展趋势
A:对
B:错
正确答案问询微信:424329

图表列表视图显示了传播图的拓扑关系
A:对
B:错
正确答案问询微信:424329

大数据的速度快体现在数据产生速度快和要求分析处理速度快
A:对
B:错
正确答案问询微信:424329

时间序列分析是对随时间变化的数据对象的变化规律和演化趋势进行建模分析
A:对
B:错
正确答案问询微信:424329

每个簇的质心(centroid)是该簇中所有数据对象的均值。
A:对
B:错
正确答案问询微信:424329

城市公共交通规划、教育资源配置、医疗资源配置、商业中心建设、房地产规划、产业规划、城市建设等都可以借助于大数据技术进行良好的规划和动态调整。
A:对
B:错
正确答案问询微信:424329

知识图谱的构建属于大数据在社交网络中的应用
A:对
B:错
正确答案问询微信:424329

概念描述(concept description):对含有大量数据的数据集合进行概述性的总结并获得简明、准确的描述。
A:对
B:错
正确答案问询微信:424329

关联分析是在数据集D中找出大于用户所给定的最大支持度阈值和最大置信度阈值的关联规则。
A:对
B:错
正确答案问询微信:424329

数据的集中存储增加了数据泄露风险。
A:对
B:错
正确答案问询微信:424329

基于腾讯大社交平台独特基因,以海量用户为基础,以大数据洞察为核心,以智能定向推广为导向,广点通提供一站式网络推广营销平台。
A:对
B:错
正确答案问询微信:424329

数据获取方式分为主动式获取和被动式获取
A:对
B:错
正确答案问询微信:424329

麦肯锡给出的大数据定义是大数据指的是大小超出常规的数据库工具获取、存储、管理、和分析能力的数据集。
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网