南开大学22秋学期《数据分析》在线作业三

奥鹏教育南开大学平时作业

22秋学期（高起本1709-1803、全层次1809-2103）《数据分析》在线作业-00003

数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段（）。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案获取微信：424329

闵式距离参数是（）时代表曼哈顿距离
A:0
B:1
C:2
D:无穷
正确答案获取微信：424329

用多台处理机联合求解问题的算法被称为（）
A:随机算法
B:外存算法
C:并行算法
D:Anytime算法
正确答案获取微信：424329

维克托?迈尔-舍恩伯格在《大数据时代：生活、工作与思维的大变革》一书中，持续强调了一个观点：大数据时代的到来，使我们奥鹏教育南开大学平时作业无法人为地去发现数据中的奥妙，与此同时，我们更应该注重数据中的相关关系，而不是因果关系。其中，数据之间的相关关系可以通过以下哪个算法直接挖掘（）
A:K-means
B:Bayes Network
C:C4.5
D:Apriori
正确答案获取微信：424329

类的Q型聚类是指（）
A:对样本个体进行聚类
B:对指标变量进行聚类。
正确答案获取微信：424329

支持向量机的MapReduce实现要进行几轮MapReduce（）
A:1
B:2
C:3
D:自行规定
正确答案获取微信：424329

逻辑斯谛函数是一条（）曲线
A:抛物线
B:三角函数
C:S型曲线
D:直线
正确答案获取微信：424329

LDA导入先验分布是为了应对（）现象
A:欠拟合
B:话题识别不准
C:过拟合
D:分词困难
正确答案获取微信：424329

置信度(confidence)是衡量兴趣度度量（）的指标
A:简洁性
B:确定性
C:实用性
D:新颖性
正确答案获取微信：424329

Apriori算法的加速过程依赖于以下哪个策略（）
A:抽样
B:剪枝
C:缓冲
D:并行
正确答案获取微信：424329

经典的Apriori算法是逐层扫描的，也就是说它是（）优先的
A:宽度
B:深度
正确答案获取微信：424329

大数据分析中，面向有用户参与分析决策的分析任务，不要求实时响应，但是也存在响应时间约束，称为（）
A:实时分析
B:弱实时分析
C:非实时分析
正确答案获取微信：424329

任何故意提高网页在搜索引擎结果中的位置，使其与网页的（）不相符的行为，称为Web作弊
A:访问量
B:实际价值
C:搜索量
D:用户数量
正确答案获取微信：424329

以下哪种类型的数据不是大数据分析模型的分类标准
A:结构化数据
B:异构数据
C:半结构化数据
D:非结构化数据
正确答案获取微信：424329

评价分类器效果时，表示正确分类的样本数与总样本数之比的指标是（）。
A:准确率
B:精确率
C:召回率
D:F1值
正确答案获取微信：424329

大数据的特点不包含
A:数据体量大
B:价值密度高
C:处理速度快
D:数据不统一
正确答案获取微信：424329

针对输入数据、时间与其他资源的要求，给出各种性能的输出结果，得到具有一定预计性的算法模型，被称为（）
A:随机算法
B:外存算法
C:并行算法
D:Anytime算法
正确答案获取微信：424329

数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段（）。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案获取微信：424329

基于MapReduce的Apriori算法，共进行几轮MapReduce（）
A:1
B:2
C:3
D:4
正确答案获取微信：424329

支持向量机的学习策略是（）
A:间隔最大化
B:多数表决
C:距离度量
正确答案获取微信：424329

PageRank是定义在网页集合上的一个（），它对每个网页赋予一个正实数值，表示网页的（）。
A:函数
B:集合
C:搜索排名
D:重要程度
正确答案获取微信：424329

连续性变量的距离可用以下（）方法衡量
A:曼哈顿距离
B:切比雪夫距离
C:.Jaccard相似系数
D:皮尔森相关系数
正确答案获取微信：424329

从训练数据中学习一个（）或（），将其称为（）。
A:概率分类模型
B:分类决策函数
C:回归模型
D:分类器
正确答案获取微信：424329

按社团形成机制分类，社团包括（）
A:明显的社团
B:预定义社团
C:自组织社团
D:隐含的社团
正确答案获取微信：424329

下列属于分类算法的有（）。
A:k近邻法
B:朴素贝叶斯
C:支持向量机
D:随机森林
正确答案获取微信：424329

概率潜在语义分析中，模型生成的是（），但观测到的是（）。
A:单词-话题-文本三元组
B:话题-文本二元组
C:单词-话题二元组
D:单词-文本二元组
正确答案获取微信：424329

回归分析方法中，按照输入变量个数分类，可分为
A:一元回归
B:多元回归
C:线性回归
D:非线性回归
正确答案获取微信：424329

向量空间模型中，是将（）看成（）
A:文档
B:单词
C:词袋
D:编码
正确答案获取微信：424329

关联分析的作用是什么（）
A:用于发现存在于大量数据集中的关联性
B:用于发现存在于大量数据集中的相关性
C:描述了一个事物中某些属性同时出现的规律
D:描述了一个事物中某些属性同时出现的模式
正确答案获取微信：424329

基于分类对象的分类有（）
A:Q型聚类
B:凝聚方式
C:R型聚类
D:分解方式
正确答案获取微信：424329

统计学习的目的是使模型不仅对已知数据而且对未知数据都有很好的预测能力
A:对
B:错
正确答案获取微信：424329

商务智能的基本架构包括逻辑层、业务层和应用层三部分
A:对
B:错
正确答案获取微信：424329

同义词可以表示同一个话题，而多义词可以表示不同的话题。（）
A:对
B:错
正确答案获取微信：424329

潜在语义分析主要用于文本的话题分析.（）
A:对
B:错
正确答案获取微信：424329

熵越大，随机变量的不确定性越小。
A:对
B:错
正确答案获取微信：424329

基于内容的协同过滤算法以用户为核心，即寻找与当前用户有相似喜好的用户群，根据用户群的特征为当前用户给出推荐
A:对
B:错
正确答案获取微信：424329

大数据数据量一定是PB，TB级的
A:对
B:错
正确答案获取微信：424329

Kmeans算法中，相似的样本聚集在相同的类，不相似的样本分散在不同的类。（）
A:对
B:错
正确答案获取微信：424329

一个样本在特征空间的k个最相邻样本中的均属于某一个类别
A:对
B:错
正确答案获取微信：424329

实际操作中，不能用经验风险近似期望风险
A:对
B:错
正确答案获取微信：424329

监督学习中，模型就是索要学习的联合概率分布或决策函数
A:对
B:错
正确答案获取微信：424329

大数据分析可以分为定性数据分析和定量数据分析
A:对
B:错
正确答案获取微信：424329

21世纪时数据信息大发展的时代，移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围，各种数据正在迅速膨胀并变大。
A:对
B:错
正确答案获取微信：424329

大数据分析模型讨论的问题是从大数据中发现什么
A:对
B:错
正确答案获取微信：424329

云计算出现后，数据存储服务衍生出了新的商业模式，数据中心的出现降低了公司的计算和存储成本。
A:对
B:错
正确答案获取微信：424329

层次方法中，要将数据分成若干组并形成一个组的树进行聚类。（）
A:对
B:错
正确答案获取微信：424329

惊喜度不是推荐系统的一个常用的评价角度
A:对
B:错
正确答案获取微信：424329

PageRank可以定义在任何有向图上，后来被应用到社会影响力分析、文本摘要等多个问题。
A:对
B:错
正确答案获取微信：424329

大数据的速度快体现在数据产生速度快和要求分析处理速度快
A:对
B:错
正确答案获取微信：424329

内积相似度可以准确表达两个文本的语义相似度。（）
A:对
B:错
正确答案获取微信：424329

提供优质的教育资源