南开大学23年秋学期《大数据导论》在线作业三

奥鹏南开大学23年秋季新学期作业参考

23秋学期(仅限-高起专1909、专升本1909)《大数据导论》在线作业-00003

下列哪个R语言扩展包可以创建带有点和边的网络图()
A:ggplot2
B:network
C:ggmaps
D:animation
正确答案问询微信:424329

数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329

SAN是一种()
A:存储设备
B:专为数据存储而设计构建的网络
C:光纤交换机
D:HBA
正确答案问询微信:424329

用于描述数据分散情况的是()
A:分布图
B:箱式图
C:饼图
D:折线图
正确答案问询微信:424329

下面哪一项不是中国发展大数据产业的基础()。
A:信息化积累了丰富的数据资源
B:大数据技术创新取得明显突破
C:大数据应用推动势头良好
D:大数据产业支撑薄弱
正确答案问询微信:424329

数据清洗的方法不包括
A:缺失值处理
B:噪声数据清除
C:一致性检查
D:重复数据记录处理
正确答案问询微信:424329

IaaS是()的简称
A:软件即服务
B:平台即服务
C:基础设施即服务
D:硬件即服务
正确答案问询微信:424329

GFS中的文件切分成()的块进行存储
A:32MB
B:64MB
C:128MB
D:1G
正确答案问询微信:424329

下列哪个工具常用来开发移动友好地交互地图()
A:Leaflet
B:Visual.ly
C:BPizza Pie Charts
D:Gephi
正确答案问询微信:424329

数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329

下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A:ggplot2
B:network
C:ggmaps
D:animation
正确答案问询微信:424329

PaaS是()的简称
A:软件即服务
B:平台即服务
C:基础设施即服务
D:硬件即服务
正确答案问询微信:424329

大数据的特点不包含
A:数据体量大
B:价值密度高
C:处理速度快
D:数据不统一
正确答案问询微信:424329

哪个选项不属于大数据4V特点?
A:Volume
B:Valid
C:Variety
D:Value
正确答案问询微信:424329

DAS代表的意思是()
A:两个异步存储
B:数据归档软件
C:连接一个可选的存储
D:直连存储
正确答案问询微信:424329

可使用##,##,##进行光滑。
A:最大值
B:箱中位数
C:箱边界
D:箱均值
正确答案问询微信:4243奥鹏南开大学23年秋季新学期作业参考29

大数据带来的挑战有哪些( )。
A:会导致数据盲点
B:危及个人隐私
C:造成群体歧视
D:产生庞大能耗
正确答案问询微信:424329

离群点检测的应用包括()等。
A:欺诈检测
B:入侵检测
C:故障检测
D:疾病的不寻常模式
正确答案问询微信:424329

大数据采集主要包括()四种。
A:系统日志采集
B:网络数据采集
C:数据库采集
D:其他数据采集
正确答案问询微信:424329

可视化工具包括()
A:Excel
B:Google Chart
C:Gephi
D:ppt
正确答案问询微信:424329

大数据在医疗中的应用有()
A:流行性疾病预防
B:慢性病健康管理
C:临床决策支持
D:医疗器械研发
正确答案问询微信:424329

按照数据量的大小,可将数据分析分为()
A:内存级数据分析
B:Bl级数据分析
C:海量级数据分析
D:巨量级数据分析
正确答案问询微信:424329

统计图表的可视化方法主要包括()
A:散点图
B:折线图
C:条形图
D:饼图
正确答案问询微信:424329

大数据在社交网络中的应用
A:用户偏好、情感、社交网络结构
B:用户画像、精准推荐
C:舆情监控、突发事件预警
D:预测外部趋势
正确答案问询微信:424329

借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。
A:消费能力
B:趋势报告
C:购物结果
正确答案问询微信:424329

数据变换的常用方法有##,##,##,##
A:中心化变换
B:极差规格化变换
C:标准化变换
D:对数变换
正确答案问询微信:424329

常见的分类方法有
A:决策树
B:贝叶斯网络
C:遗传算法
D:FP算法
正确答案问询微信:424329

常见的非结构化数据有()
A:web网页
B:即时消息
C:富文本文档
D:实时多媒体数据
正确答案问询微信:424329

下列属于传统统计学展示方法的是()
A:柱状图
B:饼状图
C:曲线图
D:网络图
正确答案问询微信:424329

医疗领域如何利用大数据
A:临床决策支持
B:个性化医疗
C:社保资金安全
D:用户行为分析
正确答案问询微信:424329

Kafka是一种高吞吐量的的分布式发布订阅消息系统
A:对
B:错
正确答案问询微信:424329

大数据的挑战仅仅来自于数据的增长。
A:对
B:错
正确答案问询微信:424329

HDFS为海量的数据提供了存储;
A:对
B:错
正确答案问询微信:424329

数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据
A:对
B:错
正确答案问询微信:424329

云计算(Cloud Computing)?是一种分布在大规模数据中心、能动态的提供各种服务器资源以满足科研、电子商务等领域需求的计算平台。
A:对
B:错
正确答案问询微信:424329

数据存储是数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。
A:对
B:错
正确答案问询微信:424329

Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流;或者是从小数据开始,但数据每年增长速率至少为60%。
A:对
B:错
正确答案问询微信:424329

宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。
A:对
B:错
正确答案问询微信:424329

基于大数据的智慧医疗系统的建立,能显著的提高医疗机构的信息化水平,为医院、患者带去更多的利益。
A:对
B:错
正确答案问询微信:424329

大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。
A:对
B:错
正确答案问询微信:424329

基于存储网络虚拟化是在存储区域网中增加虚拟化引擎实现存储资源的集中管理,其具体实施一般是通过具有虚拟化支持能力的路由器或交换机实现的。
A:对
B:错
正确答案问询微信:424329

FP是一种最有影响的挖掘布尔关联规则频繁项集的算法
A:对
B:错
正确答案问询微信:424329

广播变量在广播后可以修改
A:对
B:错
正确答案问询微信:424329

交通数据涉及到交通车辆或者道路两旁安装的传感器生成和手机的数据集。
A:对
B:错
正确答案问询微信:424329

NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。
A:对
B:错
正确答案问询微信:424329

结构化数据是用excel结构表现的数据
A:对
B:错
正确答案问询微信:424329

Apriori算法扫描数据库的次数等于最大频繁项集的项数。
A:对
B:错
正确答案问询微信:424329

数据缺失是大数据库中常见的问题,产生的原因也是多种多样的。主要包括机械原因和人为原因。
A:对
B:错
正确答案问询微信:424329

海量数据存储系统的扩展能力也要得到相应等级的提升,扩展还必须简便。
A:对
B:错
正确答案问询微信:424329

离散化可以有效地克服数据中隐藏的缺陷,使模型结果更加稳定。
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网