第一范文网 - 专业文章范例文档资料分享平台

数据仓库与数据挖掘实验报告

来源:用户分享 时间:2025/5/25 11:22:08 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

? EnglishEducation ? EnglishOccupation ? FirstName ? Gender ? GeographyKey ? HouseOwnerFlag ? LastName ? MaritalStatus ? NumberCarsOwned ? NumberChildrenAtHome ? Region ? TotalChildren ?

YearlyIncome

-11-

14.

单击“下一步”。

-12-

15. 在“指定列的内容和数据类型”页上,单击“检测”以运行对数值数据进行取样并确定数值列是否包

含连续或离散值的算法。例如,某列可包含薪金信息,用以作为连续的实际薪金值,也可包含整数,用以表示离散的编码薪金范围(例如 1 = < $25,000;2 = 从 $25,000 到 $50,000)。 16. 单击“检测”后,请查看“内容类型”和“数据类型”列中的各项;如有必要,请进行更改,以确保设

置与下表所示一致。

通常,向导会检测数值,并分配相应的数值数据类型;但有些情况下,您可能想要将数值作为文本处理。例如,GeographyKey 应作为文本处理,因为对此标识符进行数学运算是不对的。

列 Age BikeBuyer CommuteDistance CustomerKey EnglishEducation EnglishOccupation FirstName Gender GeographyKey HouseOwnerFlag LastName MaritalStatus NumberCarsOwned NumberChildrenAtHome Region TotalChildren YearlyIncome 内容类型 Continuous Discrete Discrete Key Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Continuous 数据类型 Long Long Text Long Text Text Text Text Text Text Text Text Long Long Text Long Double -13-

17. 18.

单击“下一步”。

在“将数据拆分为定型集和测试集”页上,对于“测试数据百分比”,请保留默认值 30。 对于“测试数据集中的最大事例数”,请键入 1000。单击“下一步”。

19.

20. 21. 22.

在“完成向导”页上的“挖掘结构名称”中,键入 Targeted Mailing。 在“挖掘模型名称”中,键入 TM_Decision_Tree。 选中“允许钻取”复选框。

-14-

23.

单击“完成”。

测试挖掘模型的准确性

映射输入列

如果使用外部数据测试挖掘模型,则必须确保挖掘结构中的列与输入数据中的列匹配。为此,可以使用“指定列映射”对话框。如果直接映射列名,则数据挖掘设计器将自动创建关系。

若要删除两列之间的映射,请选择将“挖掘结构”表中的列链接到“选择输入表”表中的列的行,再按 Delete 键。还可以通过单击“选择输入表”中的列并将其拖到“挖掘结构”中相应的列来手动创建映射。 将输入列映射到挖掘结构 1.

在数据挖掘设计器中的“挖掘准确性图表”选项卡的“输入选择”选项卡中,选择选项“指定其他数据集”。

-15-

搜索更多关于: 数据仓库与数据挖掘实验报告 的文档
数据仓库与数据挖掘实验报告.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c7wban1os3a0n19a8i5hx_3.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top