南开大学23年春《数据科学导论》在线作业一
奥鹏南开大学新学期作业参考
23春学期(仅限-高起专1903、专升本1903)《数据科学导论》在线作业-00001
多层感知机是由()层神经元组成。
A:二
B:三
C:大于等于二层
D:大于等于三层
正确答案问询微信:424329
在一元线性回归模型中,残差项服从()分布。
A:泊松
B:正态
C:线性
D:非线性
正确答案问询微信:424329
置信度(confidence)是衡量兴趣度度量( )的指标。
A:简洁性
B:确定性
C:实用性
D:新颖性
正确答案问询微信:424329
层次聚类对给定的数据进行()的分解。
A:聚合
B:层次
C:分拆
D:复制
正确答案问询微信:424329
我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。
A:自上而下
B:自下而上
C:自左而右
D:自右而左
正确答案问询微信:424329
在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。
A:减小,减小
B:减小,增大
C:增大,减小
D:增大,增大
正确答案问询微信:424329
比如一张表,从业务上讲,一个用户应该只会有一条记录, 那么如果某个用户出现了超过一条的记录,这就产生了()
A:异常值
B:不一致的值
C:重复值
D:缺失值
正确答案问询微信:424329
以下哪个不是处理缺失值的方法()
A:删除记录
B:按照一定原则补充
C:不处理
D:随意填写
正确答案问询微信:424329
以下哪些不是缺失值的影响()
A:数据建模将丢失大量有用信息
B:数据建模的不确定性更加显著
C:对整体总是不产生什么作用
D:包含空值的数据可能会使建模过程陷入混乱,导致异常的输出
正确答案问询微信:424329
数据质量检验的主要任务就是检查原始数据中奥鹏南开大学新学期作业参考 代做2元一门是否存在“脏数据”,概括性来说,脏数据不包括以下()
A:普通值
B:异常值
C:不一致的值
D:重复值
正确答案问询微信:424329
通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()
A:简单函数变换
B:规范化
C:属性构造
D:连续属性离散化
正确答案问询微信:424329
利用最小二乘法对多元线性回归进行参数估计时,其目标为()。
A:最小化方差#最小化标准差
B:最小化残差平方和
C:最大化信息熵
正确答案问询微信:424329
只有非零值才重要的二元属性被称作:( ),其中购物篮数据就属于这种属性。
A:计数属性
B:离散属性
C:非对称的二元属性#对称属性
正确答案问询微信:424329
Apriori算法的加速过程依赖于以下哪个策略( )
A:抽样
B:剪枝
C:缓冲
D:并行
正确答案问询微信:424329
实体识别的常见形式()
A:同名异义
B:异名同义
C:单位不统一
D:属性不同
正确答案问询微信:424329
数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()
A:异常值
B:缺失值
C:不一致的值
D:重复值
正确答案问询微信:424329
聚类是一种()。
A:有监督学习
B:无监督学习
C:强化学习
D:半监督学习
正确答案问询微信:424329
一元线性回归中,真实值与预测值的差称为样本的()。
A:误差
B:方差
C:测差
D:残差
正确答案问询微信:424329
BFR聚类用于在()欧氏空间中对数据进行聚类
A:高维
B:中维
C:低维
D:中高维
正确答案问询微信:424329
以下哪一项不属于数据变换()
A:简单函数变换
B:规范化
C:属性合并
D:连续属性离散化
正确答案问询微信:424329
相关性的分类,按照相关的方向可以分为()。
A:正相关
B:负相关
C:左相关
D:右相关
正确答案问询微信:424329
多层感知机的学习过程包含()。
A:信号的正向传播
B:信号的反向传播
C:误差的正向传播
D:误差的反向传播
正确答案问询微信:424329
下面例子属于分类的是()
A:检测图像中是否有人脸出现
B:对客户按照贷款风险大小进行分类
C:识别手写的数字
D:估计商场客流量
正确答案问询微信:424329
关联规则的评价度量主要有:()。
A:支持度
B:置信度
C:准确率
D:错误率
正确答案问询微信:424329
下列选项是BFR的对象是()
A:废弃集
B:临时集
C:压缩集
D:留存集
正确答案问询微信:424329
一元回归参数估计的参数求解方法有()。
A:最大似然法
B:距估计法
C:最小二乘法
D:欧式距离法
正确答案问询微信:424329
距离度量中的距离可以是()
A:欧式距离
B:曼哈顿距离
C:Lp距离
D:Minkowski距离
正确答案问询微信:424329
什么情况下结点不用划分()
A:当前结点所包含的样本全属于同一类别
B:当前属性集为空,或是所有样本在所有属性上取值相同
C:当前结点包含的样本集为空
D:还有子集不能被基本正确分类
正确答案问询微信:424329
层次聚类的方法是()
A:聚合方法
B:分拆方法
C:组合方法
D:比较方法
正确答案问询微信:424329
聚类的主要方法有()。
A:划分聚类
B:层次聚类
C:密度聚类
D:距离聚类
正确答案问询微信:424329
阶跃函数具有不光滑、不连续的特点。
A:对
B:错
正确答案问询微信:424329
平均减少的不纯度越大,则特征重要度越高。
A:对
B:错
正确答案问询微信:424329
方差过小的特征对数据的区分能力强
A:对
B:错
正确答案问询微信:424329
sigmoid函数属于阶跃函数,是神经网络中常见的激活函数。
A:对
B:错
正确答案问询微信:424329
随着特征维数的增加,特征空间呈指数倍增长,样本密度急剧减小,样本稀疏。
A:对
B:错
正确答案问询微信:424329
每个类的先验概率可以通过属于该类的训练记录所占的比例来估计。
A:对
B:错
正确答案问询微信:424329
给定一组点,使用点之间的距离概念,将点分组为若干簇,不同簇的成员可以相同。
A:对
B:错
正确答案问询微信:424329
决策树的输入为训练集,输出为以node为根结点的一棵决策树
A:对
B:错
正确答案问询微信:424329
关联规则可以用枚举的方法产生。
A:对
B:错
正确答案问询微信:424329
神经网络中误差精度的提高可以通过增加隐含层中的神经元数目来实现。
A:对
B:错
正确答案问询微信:424329
可信度是对关联规则的准确度的衡量。
A:对
B:错
正确答案问询微信:424329
使用SVD方法进行图像压缩不可以保留图像的重要特征。
A:对
B:错
正确答案问询微信:424329
啤酒与尿布的故事是聚类分析的典型实例。
A:对
B:错
正确答案问询微信:424329
给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。
A:对
B:错
正确答案问询微信:424329
在数据预处理时,无论什么情况,都可以直接将异常值删除
A:对
B:错
正确答案问询微信:424329
决策树内部结点表示一个类,叶结点表示一个特征或属性
A:对
B:错
正确答案问询微信:424329
当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。
A:对
B:错
正确答案问询微信:424329
对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。
A:对
B:错
正确答案问询微信:424329
利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。
A:对
B:错
正确答案问询微信:424329
Apriori算法是一种典型的关联规则挖掘算法。
A:对
B:错
正确答案问询微信:424329