七、通过实验,要求同学在贝叶斯信息获取实验中解决以下问题,并递交完整的实验报告
1、在数据预处理中,通过转换与否的实验比较,判断是否一定要把“Children”属性转换成分类型的两个值“YES” “NO”。
2、 在算法选择时,点击“Choose”按钮后可以看到哪些分类的算法分门别类的列在一个树型框里? 将些数据截图,在实验报告中进行详解。
3、点击“Choose”右边的文本框,弹出新窗口为该算法设置各种参数。点“More”查看参数说明,点“Capabilities”查看算法适用范围。请在实验报告中详解的参数设置情况。
4、请介绍你建立好的模型以及对该模型的误差分析等结果,如:出现在“Classifier output”中的模型准确度等,将这些数据截图, 在实验报告中进行详解。
5、如果你的模型准确度不高,你是怎样通过修改算法的参数来提高准确度?
实验六 基于回归模型的数据分析
一、实验名称:
基于回归模型的数据分析 二、实验目的:
通过一个已有的训练数据集,观察训练集中的实例,进行回归分析,更好地理解和掌握回归分析算法基本原理,建立相应的预测模型,然后对新的未知实例进行预测,预测的准确程度来衡量所建立模型的好坏。 三、实验要求
1、熟悉Weka平台 2、掌握回归分析算法
3、对数据进行预处理,利用Weka和不同参数设置进行回归分析,对比结果,得出结论,对问题进行总结。 四、实验平台
新西兰怀卡托大学研制的Weka系统 五、实验数据
使用房屋定价数据,具体如表1所示:
表1回归模型的房屋值 房子面积(平方英占地的大卧花岗卫生间有无重销售价格 尺) 小 室 岩 装? 3529 3247 4032 2397 2200 3536 2983 3198 9191 10061 10150 14156 9600 19994 9365 9669 6 5 5 4 4 6 5 5 0 1 0 1 0 1 0 1 0 1 1 0 1` 1 1 1 ¥205,000 ¥224,900 ¥197,900 ¥189,900 ¥195,000 ¥325,000 ¥230,000 ???? 六、实验方法和步骤
1.为 Weka 构建数据集
为了将数据加载到 Weka,必须将数据放入到arff格式的文件中,具体介绍如前面所示,现构造arff文件如下,存成house.arff:
2.将数据载入 Weka
数据创建完成后,就可以开始创建回归模型。启动 Weka,根据之前的实验方法载入之前构造的文件house.arff。
3.用 Weka 创建一个回归模型 为了创建这个模型,单击 Classify 选项卡。第一个步骤是选择想要创建的这个模型,也就是选择希望使用的建模算法:
? 单击 Choose 按钮,然后扩展 functions 分支; ? 选择 Linear Regression
4.创建训练集
准备好创建模型后,单击 Start,输出结果如下:
5.解析这个回归模型
Weka功能强大,在上面的输出信息中就可以看出一个关于selling-price的计算公式(模型),包括一些其他信息,而此处关心的主要内容就是这个公式,如下清单所示:
6.预测 3198 9669 5 1 1 ???? 七、通过实验,要求同学在聚类分析信息获取实验中解决以下问题,并递交完整的实验报告
1. 解释得到的回归模型 2. 给出预测结果。
相关推荐: