奥鹏教育东北财经大学《数据挖掘概论》单元作业三

奥鹏东北财经大学平时在线作业

东财《数据挖掘概论》单元作业三

线性回归通常通过( )方法进行参数估计。
A:最小二乘法
B:牛顿法
C:聚类
D:拉格朗日法
答案问询微信:424329

简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( )。
A:层次聚类
B:划分聚类
C:非互斥聚类
D:模糊聚类
答案问询微信:424329

ID3、C4.5和CART都采用的是( )方法。
A:贪心
B:回溯
C:动态规划
D:递归
答案问询微信:424329

表示簇内距离与簇间距离之比的指标为( )。
A:DBI指数
B:Jaccard系数
C:rand指数
D:轮廓系数
答案问询微信:424329

存在噪声和离群点时,( )是更鲁棒的划分聚类方法。
A:k-中心点方法
B:AGNES
C:k-均值方法
D:BIRCH
答案问询微信:424329

在决策树中,树的最顶层结点是( )。
A:内部结点
B:树叶结点
C:分支
D:根结点
答案问询微信:424329

垃圾邮件检测通常通过( )方法实现。
A:线性回归
B:岭回归
C:Lasso
D:逻辑回归
答案问询微信:424329

对于有n个数据点的数据集,经验上通常设置簇数为( )。
A:√(2n)
B:√n
C:√2
D:√(n/2)
答案问询微信:424329

在基本k-均值算法里,当邻近度函数采用( )的时候,合适的质心是簇中各点的中位数。
A:曼哈顿距离
B:平方欧几里德距离
C:余弦距离
D:Bregman散度
答案问询微信:424329

事件的优势比(odds)的取值范围是( )。
A:(0,+∞)
B:(0,1)
C:(-∞,+∞)
D:(-1,1)
答案问询微信:424329

( )可能成为k-均值的终止条件。
A:对固定数量的迭代
B:在局部最小值不是特别差的情况下,在迭代中对簇观测值的分配不发生变化
C:在连续迭代中质心不发生变化
D:RRS下降到阈值以下
答案问询微信:424329

以下属于分类器评价或比较尺度的有( )。
A:预测准确度
B:召回率
C:模型描述的简洁度
D:计算复杂度
答案问询微信:424329

k-均值聚类分析在( )情况下无法得出好的结果。
A:具有异常值的数据点
B:具有不同密度的数据点
C:具有非凹形的数据点
D:具有非环形的数据点
答案问询微信:424329

具有相同的时间复杂度的聚类算法有( )。
A:BIRCH
B:k-均值
C:DBSCAN
D:OPTICS
答案问询微信:424329

回归方法主要分为( )。
A:线性回归
B:非线性回归
C:岭回归
D:Lasso
答案问询微信:424329

分类是无监督学习,即每个训练样本的类编号是未知的,要学习的类集合或数量也可能是事先未知的。( )
A:对
B:错
答案问询微信:424329

精准率是分类器正确分类的检验元组所占的百分比。( )
A:对
B:错
答案问询微信:424329

给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被奥鹏东北财经大学平时在线作业视为较优。( )
A:对
B:错
答案问询微信:424329

在基于密度的聚类方法中,当“领域”中密度超过某一阈值会继续增长给定的簇。( )
A:对
B:错
答案问询微信:424329

轮廓系数的数值越小说明模型的聚类效果越好。( )
A:对
B:错
答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网