《数据挖掘技术与应用》实验指导书
《数据挖掘技术与应用》
实 验 指 导 书
邓克文 编
重庆大学经济与工商管理学院
2014年7月
《数据挖掘技术与应用》实验指导书
目 录
第一章 数据挖掘及工具简介 ..................................................................................................................... 1 1.1 数据挖掘的基本概念 .......................................................................................................................... 1 1.2 数据挖掘的基本框架及流程 .............................................................................................................. 1 1.3 数据挖掘软件工具 .............................................................................................................................. 1 第二章 基础实验篇 ..................................................................................................................................... 2 2.1 实验一 分 类 ....................................................................................................................................... 2 2.2 实验二 预 测 ..................................................................................................................................... 21 2.3 实验三 聚 类 ..................................................................................................................................... 33 2.4实验四 关联分析 ............................................................................................................................... 45 2.5实验五 RFM模型 .............................................................................................................................. 51 2.6基于遗传算法的变量选择 ................................................................................................................. 66 参考文献 ....................................................................................................................................................... 77 附 录 ....................................................................................................................................................... 78
《数据挖掘技术与应用》实验指导书
第一章 数据挖掘及工具简介
1.1 数据挖掘的基本概念
1.2 数据挖掘的基本框架及流程
1.3 数据挖掘软件工具
1
《数据挖掘技术与应用》实验指导书
第二章 基础实验篇
2.1 实验一 分 类 一、实验目的
通过本次实验,学会使Clememtine软件及R软件进行数据挖掘的分类实验,撑握以下知识点:(1) Logistic分类模型;(2) 决策树C5.0分类模型及其Cost矩阵设置的重要作用;(3) 贝叶斯网络分类模型;(5) 支持向量机模型;(6) 神经网络模型;(7) 运用R软件进行连续函数离散化数据预处理,并对该数据用上述3个模型进行挖掘,最后与连续性原始数据的挖掘结果进行对比,并得出相关结论;(8) 运用Clememtine软件解决数据预处理中的缺失值填充问题。
二、实验安排
1.学时: 本实验安排8个学时,主要用于完成实验及实验报告。 2.时间: 由实验室统一安排 3.地点: 由实验室统一安排 三、实验工具
PC电脑1台,Windows 7系统,Clememtine 12.0 数据挖掘软件,R软件,以及上市公司ST数据集和Clememtine自带的telco.sav数据集。 四、知识准备 五、实验背景 六、实验过程
实验1:基础模型
2
相关推荐: