第一范文网 - 专业文章范例文档资料分享平台

SAS数据挖掘实例

来源:用户分享 时间:2025/6/2 2:00:06 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

(3)

双击Insight节点,出现Insight Settings窗口

由于不同的数据源的数据量可能不同,而且有些数据源的数据量可能是非常巨大的,所以Insight节点默认抽取2000条数据记录来探索数据源,当数据源的记录数小于2000时,可以选择Insight Based On设置中的Entire data set来改变探索数据的样本数量。 (4)

单击Entire data set后关闭Insight Settings窗口,在弹出对话框中单击“是”保存设置

5.2.2 察看Insight节点输出结果

当设置完Insight节点之后,通过运行该节点可以查看探索数据的结果,其过程如下:

(1) 右单击Insight节点,在弹出菜单中选择Run运行该节点,运行过

程中节点的四周会变成绿色,运行完毕会有运行结果的提示对话框

(2) 单击“是”可以察看运行结果。Insight运行结果将数据源以二维表

视图的形式显示

(3) 单击SAS主菜单中的“分析”,选择下拉菜单中的“分布”,将弹出

选择察看分布的变量的窗口

(4) 单击第一个变量PURCHASE后将滚动条拖到最后一个变量,按住

Shift键单击最后一个变量SEX,当所有的变量都被选择上后单击“Y”按钮,然后确定,会出现所有变量的分布窗口。其中包括每个变量的分布图和一些重要的统计变量以及一组分位数。

在这个例子中我们重点要看的是DINING的分布。可以看到DINING的值从0到28,0值居多。那么我们要建立预测客户购买Dining产品倾向的模型,应该把目标锁定在目标变量Dining的值大于0的客户身上。

(5) 数据探索完毕,关闭分布窗口和EMDATA.VIEW_QMY窗口返回到EM工

作区。

准备建模数据

此例将准备建模数据阶段分成了四个环节:建立目标变量、设置目标变量、数据分割和替换缺失值。

建立目标变量

前面已经分析了我们的目标人群是Dining变量大于0的客户群,但是对于目前数据集SASUSER.CUSDET1中的Dining变量的值是从0到28的一个分布,而我们只关心Dining值大于或者小于0,所以这里要对Dining变量作个转换,让

大于0的Dining值为1。

EM中用来建立变量的工具是Transform Variables节点,步骤如下: (1)

将Transform Variables节点拖拽到工作区中Input Data Source节点的右侧连接Input Data Source节点到Transform Variables节点

(2)

双击Transform Variables节点,出现Transform variables窗口

(3)

单击工作区上方工具栏中的Create variable图标 Create Variable窗口

,出现

搜索更多关于: SAS数据挖掘实例 的文档
SAS数据挖掘实例.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c5kus66tmib553972zwre_3.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top