东北财经大学《数据挖掘概论》单元作业三

奥鹏东北财经大学平时在线作业

东财《数据挖掘概论》单元作业三

通过聚集多个分类器的预测来提高分类准确率的技术称为( )。
A:组合(ensemble)
B:聚集(aggregate)
C:合并(combination)
D:投票(voting)
答案问询微信:424329

关于k-均值和DBSCAN的比较,以下说法不正确的是( )。
A:K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象
B:K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
C:K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
D:K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇
答案问询微信:424329

SVM方法中落在边缘侧面超平面上的任意训练元组,称为奥鹏东北财经大学平时在线作业( )。
A:最小边缘超平面
B:最大边缘超平面
C:横截面
D:支持向量
答案问询微信:424329

ID3、C4.5和CART都采用的是( )方法。
A:贪心
B:回溯
C:动态规划
D:递归
答案问询微信:424329

BIRCH是一种( )。
A:分类器
B:聚类算法
C:关联分析算法
D:特征选择算法
答案问询微信:424329

( )是用于处理因变量为分类变量的回归问题。
A:线性回归
B:岭回归
C:Lasso
D:逻辑回归
答案问询微信:424329

基于代表对象的聚类技术是( )。
A:k-均值
B:k-中心点
C:AGNES
D:DIANA
答案问询微信:424329

当不知道数据所带标签时,可以使用( )技术促使带同类标签的数据与带其他标签的数据相分离。
A:分类
B:聚类
C:关联分析
D:隐马尔可夫链
答案问询微信:424329

( )是对离散型变量(类标号)建立函数,预测未知的或缺失的数据。
A:聚类
B:分类
C:回归
D:关联规则
答案问询微信:424329

以下属于可伸缩聚类算法的是( )。
A:CURE
B:DENCLUE
C:CLIQUE
D:OPOSSUM
答案问询微信:424329

计算R2需要用到( )。
A:离差平方和
B:回归平方和
C:残差平方和
D:偏最小二乘法
答案问询微信:424329

以下关于决策树说法正确的有( )。
A:ID3、C4.5和CART都采用贪心(即非回溯的)方法
B:决策树以自顶向下递归的分治方式构造
C:随着树的构建,训练集递归地划分成较小的子集
D:决策树必须严格遵循二叉树进行分叉
答案问询微信:424329

聚类分析的应用包括( )。
A:商务智能
B:图像模式识别
C:Web搜索
D:生物学
答案问询微信:424329

回归方法主要分为( )。
A:线性回归
B:非线性回归
C:岭回归
D:Lasso
答案问询微信:424329

属于分类的方法有( )。
A:决策树
B:K近邻
C:朴素贝叶斯
D:逻辑回归
答案问询微信:424329

监督学习是训练数据集的类标志是已知的。( )
A:对
B:错
答案问询微信:424329

岭回归采用含有正则化参数的L2范数正则化。( )
A:对
B:错
答案问询微信:424329

聚类评估的外部指标适用于有标签数据,将聚类结果与已知类标签进行比。( )
A:对
B:错
答案问询微信:424329

在基于密度的聚类方法中,当“领域”中密度超过某一阈值会继续增长给定的簇。( )
A:对
B:错
答案问询微信:424329

在决策树中,每个内部节点表示一个测试的输出。( )
A:对
B:错
答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网