第一讲 数据预处理及基础挖掘算法1
1. 字段选择
2. 数据清洗
3. 字段扩充
4. 数据编码
5. KNN算法(K Nearest Neighbors)
第二讲 基础挖掘算法2
1. 训练和测试样本数据的选取
2. 进入模型的变量筛选
3. 决策树(ID3、C5.0、CART、CHAID)
4. 回归分析(线性、非线性、Logistic回归、时间序列分析)
第三讲 进阶挖掘算法1
1. 关联规则(支持度、信赖度、提升度及Apriori 算法)
2. 聚类分析(阶层式聚类、分割式聚类)
3. 神经网络
第四讲 进阶挖掘算法
1. 支持向量机
2. 集成算法(Bagging、Boosting、Random Forest)
3. 模型评估(混乱矩阵(正确率、响应率、捕捉率、F-指标)、ROC曲线、 GINI图)