1、数据挖掘第3章 监督学习3.1基本概念图3.1基本的学习过程: 训练和测试3.2决策树推理图3.2对应于表3.1中数据的一棵决策树图3.3对应于表3.1中数据的一棵更小的决策树3.2.1学习算法图3.4决策树算法3.2.2混杂度函数图3.5两种可能的根节点的选择3.2.3处理连续属性图3.6数据空间的一个划分以及相应的决策树3.2.4其他一些问题图3.7剪枝后的数据空间划分和决策树3.3评估分类器3.3.1评估方法3.3.2查准率、查全率、F-score和平衡点(Breakeven Point)3.4规则推理3.4.1序列化覆盖图3.8算法1图3.9算法23.4.2规则学习: Learn-On
2、e-Rule函数图3.10learn-one-rule-1函数图3.11基于熵值的评估函数图3.12learn-one-rule-2函数3.4.3讨论3.5基于关联规则的分类3.5.1使用类关联规则进行分类图3.13一个简单的CBA算法3.5.2使用类关联规则作为分类属性3.5.3使用古典的关联规则分类3.6朴素贝叶斯分类图3.14一个训练数据集的例子3.7朴素贝叶斯文本分类3.7.1概率框架图3.15混合模型中两个分布的3.7.2朴素贝叶斯模型3.7.3讨论3.8支持向量机图3.16 (a) 一个线性可分的数据集; (b) 可能的决策边界3.8.1线性支持向量机: 可分的情况图3.17分离超平面以及支持向量机的边距: 支持向量已被圈出3.8.2线性支持向量机: 数据不可分的情况图3.18数据不可分的情况: xa和xb3.8.3非线性支持向量机: 核方法图3.19从输入空间变换到特征空间3.9k-近邻学习图3.20k近邻算法图3.21k近邻分类图示3.10分类器的集成3.10.1Bagging3.10.2Boosting图3.22AdaBoost算法