南开大学22秋学期（高起本1709-1803、全层次1809-2103）《数据科学导论》在线作业二

奥鹏南开在线作业满分答案参考

22秋学期（高起本1709-1803、全层次1809-2103）《数据科学导论》在线作业-00002

1.实体识别的常见形式()
选项A：同名异义
选项B：异名同义
选项C：单位不统一
选项D：属性不同
满分答案问询微信：424329

2.以下哪一项不是特征工程的子问题()
选项A：特征创建
选项B：特征提取
选项C：特征选择
选项D：特征识别
满分答案问询微信：424329

3.比如一张表,从业务上讲,一个用户应该只会有一条记录, 那么如果某个用户出现了超过一条的记录,这就产生了()
选项A：异常值
选项B：不一致的值
选项C：重复值
选项D：缺失值
满分答案问询微信：424329

4.在一元线性回归模型中,残差项服从()分布。
选项A：泊松
选项B：正态
选项C：线性
选项D：非线性
满分答案问询微信：424329

5.对于k近邻法,下列说法错误的是()。
选项A：不具有显式的学习过程
选项B：适用于多分类任务
选项C：k值越大，分类效果越好
选项D：通常采用多数表决的分类决策规则
满分答案问询微信：424329

6.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。
选项A：减小，减小
选项B：减小，增大
选项C：增大，减小
选项D：增大，增大
满分答案问询微信：424329

7.BFR聚类用于在()欧氏空间中对数据进行聚类
选项A：高维
选项B：中维
选项C：低维
选项D：中高维
满分答案问询微信：424329

8.置信度(confidence)是衡量兴趣度度量( )的指标。
选项A：简洁性
选项B：确定性
选项C：实用性
选项D：新颖性
满分答案问询微信：424329

9.在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应奥鹏南开在线作业满分答案参考的自变量对y的作用()。
选项A：越小
选项B：越大
选项C：无关
选项D：不确定
满分答案问询微信：424329

10.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()
选项A：关联规则发现
选项B：聚类
选项C：分类
选项D：自然语言处理
满分答案问询微信：424329

11.多层感知机是由()层神经元组成。
选项A：二
选项B：三
选项C：大于等于二层
选项D：大于等于三层
满分答案问询微信：424329

12.下列两个变量之间的关系中,哪个是函数关系()。
选项A：人的性别和他的身高
选项B：人的工资与年龄
选项C：正方形的面积和边长
选项D：温度与湿度
满分答案问询微信：424329

13.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()
选项A：1,2,3,4
选项B：1,2,3,5
选项C：1,2,4,5
选项D：1,3,4,5
满分答案问询微信：424329

14.通过变量标准化计算得到的回归方程称为()。
选项A：标准化回归方程
选项B：标准化偏回归方程
选项C：标准化自回归方程
选项D：标准化多回归方程
满分答案问询微信：424329

15.具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。
选项A：1,线性
选项B：2,线性
选项C：1,非线性
选项D：2,非线性
满分答案问询微信：424329

16.单层感知机模型属于()模型。
选项A：二分类的线性分类模型
选项B：二分类的非线性分类模型
选项C：多分类的线性分类模型
选项D：多分类的非线性分类模型
满分答案问询微信：424329

17.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。
选项A：产量每增加一台，单位成本增加100元
选项B：产量每增加一台，单位成本减少1.2元
选项C：产量每增加一台，单位成本平均减少1.2元
选项D：产量每增加一台，单位平均增加100元
满分答案问询微信：424329

18.以下属于关联分析的是( )
选项A：CPU性能预测
选项B：购物篮分析
选项C：自动判断鸢尾花类别
选项D：股票趋势建模
满分答案问询微信：424329

19.以下哪一项不属于数据变换()
选项A：简单函数变换
选项B：规范化
选项C：属性合并
选项D：连续属性离散化
满分答案问询微信：424329

20.下面不是分类的常用方法的有()
选项A：K近邻法
选项B：朴素贝叶斯
选项C：决策树
选项D：条件随机场
满分答案问询微信：424329

21.聚类的主要方法有()。
选项A：划分聚类
选项B：层次聚类
选项C：密度聚类
选项D：距离聚类
满分答案问询微信：424329

22.相关性的分类,按照相关的方向可以分为()。
选项A：正相关
选项B：负相关
选项C：左相关
选项D：右相关
满分答案问询微信：424329

23.层次聚类的方法是()
选项A：聚合方法
选项B：分拆方法
选项C：组合方法
选项D：比较方法
满分答案问询微信：424329

24.系统日志收集的基本特征有()
选项A：高可用性
选项B：高可靠性
选项C：可扩展性
选项D：高效率
满分答案问询微信：424329

25.多层感知机的学习过程包含()。
选项A：信号的正向传播
选项B：信号的反向传播
选项C：误差的正向传播
选项D：误差的反向传播
满分答案问询微信：424329

26.Apriori算法的计算复杂度受()影响。
选项A：支持度阈值
选项B：项数
选项C：事务数
选项D：事务平均宽度
满分答案问询微信：424329

27.下列选项是BFR的对象是()
选项A：废弃集
选项B：临时集
选项C：压缩集
选项D：留存集
满分答案问询微信：424329

28.k近邻法的基本要素包括()。
选项A：距离度量
选项B：k值的选择
选项C：样本大小
选项D：分类决策规则
满分答案问询微信：424329

29.下面例子属于分类的是()
选项A：检测图像中是否有人脸出现
选项B：对客户按照贷款风险大小进行分类
选项C：识别手写的数字
选项D：估计商场客流量
满分答案问询微信：424329

30.关联规则的评价度量主要有:()。
选项A：支持度
选项B：置信度
选项C：准确率
选项D：错误率
满分答案问询微信：424329

31.一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。
选项A：对
选项B：错
满分答案问询微信：424329

32.支持度是衡量关联规则重要性的一个指标。
选项A：对
选项B：错
满分答案问询微信：424329

33.增加神经元的个数,无法提高神经网络的训练精度。
选项A：对
选项B：错
满分答案问询微信：424329

34.Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。
选项A：对
选项B：错
满分答案问询微信：424329

35.由不同的距离度量所确定的最近邻点是不同的
选项A：对
选项B：错
满分答案问询微信：424329

36.BFR聚类簇的坐标可以与空间的坐标保持一致。
选项A：对
选项B：错
满分答案问询微信：424329

37.特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。
选项A：对
选项B：错
满分答案问询微信：424329

38.在树的结构中,特征越重要,就越远离根节点。
选项A：对
选项B：错
满分答案问询微信：424329

39.对于项集来说,置信度没有意义。
选项A：对
选项B：错
满分答案问询微信：424329

40.聚合方法是自底向上的方法。
选项A：对
选项B：错
满分答案问询微信：424329

41.当训练集较大的时候,标准BP算法通常会更快的获得更好的解。
选项A：对
选项B：错
满分答案问询微信：424329

42.茎叶图失去原始数据的信息,而直方图保留原始数据的信息。
选项A：对
选项B：错
满分答案问询微信：424329

43.信息熵越大,数据信息的不确定性越小。
选项A：对
选项B：错
满分答案问询微信：424329

44.探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。
选项A：对
选项B：错
满分答案问询微信：424329

45.获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。
选项A：对
选项B：错
满分答案问询微信：424329

46.决策树的输入为训练集,输出为以node为根结点的一棵决策树
选项A：对
选项B：错
满分答案问询微信：424329

47.阶跃函数具有不光滑、不连续的特点。
选项A：对
选项B：错
满分答案问询微信：424329

48.分拆方法是自底向上的方法。
选项A：对
选项B：错
满分答案问询微信：424329

49.为了尽可能正确分类训练样本,结点划分过程将不断重复,有时会造成决策树分支过少,以致于把训练集自身的一些特点当作所有数据都具有的一般性质而导致过拟合
选项A：对
选项B：错
满分答案问询微信：424329

50.贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布有关。
选项A：对
选项B：错
满分答案问询微信：424329

提供优质的教育资源