一. 单选题(共10题,66分)
1. 【单选题】以下关于决策树特点分析的说法错误的有 ( )。
A. 推理过程容易理解,计算简单
B. 算法容易造成过拟合
C. 算法自动忽略了对模型没有贡献的属性变量
D. 算法考虑了数据属性之间的相关性
正确答案: D
2. 【单选题】以下关于决策树原理介绍错误的有 ( )。
A. 决策树算法本质上是贪心算法
B. 决策树算法属于无监督学习
C. 决策树生成过程中需要用到分割法
D. 决策树决策过程从根节点开始
正确答案: B
3. 【单选题】我们想要在大数据集上训练决策树模型,为了使用较少的时间,可以:( )。
A. 增大学习率
B. 减少树的数量
C. 减少树的深度
D. 增加树的深度
正确答案: C
4. 【单选题】以下关于决策树算法说法错误的是 ( )。
A. C4.5算法不能用于处理不完整数据
B. C4.5算法选择信息增益率来选择属性
C. CART算法选择基尼系数来选择属性
D. ID3算法选择信息增益最大的特征作为当前决策节点
正确答案: A
5. 【单选题】C4.5选择属性用的是( )。
A. 信息增益率
B. 交叉熵
C. 信息熵
D. 信息增益
正确答案: A
6. 【单选题】以下那种说法是错误的( )。
A. 一个系统越是有序,信息熵就越低
B. 中国足球队战胜巴西足球队的信息熵要小于中国乒乓球队战胜巴西乒乓球队的信息熵
C. 信息增益 = 信息熵 - 条件熵
D. 一个系统越是混乱,随机变量的不确定性就越大,信息熵就越高
正确答案: B
7. 【单选题】ID3 算法的缺点不包括( )。
A. 没有考虑缺失值
B. 信息增益准则对可取值数目较多的特征有所偏好,类似“编号”的特征其信息增益接近于 1
C. ID3 没有剪枝策略,容易过拟合
D. 既能用于处理离散分布的特征,也能用于连续分布的特征处理
正确答案: D
8. 【单选题】关于CART算法,错误的是( )。
A. CART算法既可以处理分类问题,也可以处理回归问题
B. 可以处理样本不平衡问题
C. CART算法采用信息增益率的大小来度量特征的各个划分点
D. CART 分类树采用基尼系数的大小来度量特征的各个划分点
正确答案: C
9. 【单选题】关于C4.5算法,错误的是( )。
A. C4.5算法采用基尼系数的大小来度量特征的各个划分点
B. C4.5算法引入悲观剪枝策略进行后剪枝
C. C4.5算法可以处理非离散的数据
D. C4.5 算法最大的特点是克服了 ID3 对特征数目的偏重这一缺点
正确答案: A
10. 【单选题】ID3选择属性用的是( )。
A. 信息增益率
B. 信息增益
C. 信息熵
D. 交叉熵
正确答案: B
二. 多选题(共2题,13.2分)
11. 【多选题】决策树的说法正确的是( )。
A. CART使用的是二叉树
B. 其可作为分类算法,也可用于回归模型
C. 不能处理连续型特征
D. 它易于理解、可解释性强
正确答案: ABD
12. 【多选题】决策树有哪些代表算法 ( )。
A. ID3
B. C4.5
C. CART
D. CNN
正确答案: ABC
三. 判断题(共3题,20.8分)
13. (判断题) ID3算法的核心思想就是以信息增益来度量特征选择,选择信息增益最大的特征进行分裂。
A. 对
B. 错文章来源:https://www.toymoban.com/news/detail-790908.html
正确答案: 对
14. (判断题)决策树的生成只考虑局部最优,相对地,决策树的剪枝则考虑全部最优。
A. 对
B. 错
正确答案: 对
15. (判断题) ID3和C4.5和CART都只能用于分类问题,不能用于回归问题。
A. 对
B. 错
正确答案: 错文章来源地址https://www.toymoban.com/news/detail-790908.html
到了这里,关于【机器学习】第四章决策树练习题及答案的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!