第一范文网 - 专业文章范例文档资料分享平台

IBM SPSS Modeler 教程-(1)

来源:用户分享 时间:2020-06-26 本文由傲晴 分享 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

IBM SPSS Modeler 说明

数据挖掘和建模

数据挖掘是一个深入您的业务数据,以发现隐藏的模式和关系的过程。数据挖掘解决了一个常见的问题:您拥有的数据越多,就越难有效地分析并得出数据的意义,并且耗时也越长。金矿无法开采,通常是由于缺乏人力、时间或专业技术。

数据挖掘使用清晰的业务流程和强大的分析技术,快速、彻底地探索大量的数据,抽取并为您提供有用且有价值的信息,这正是您所需要的“商务智能”。

尽管您数据中的这些以前未知的模式和关系本身很有趣,但一切并不止于此。如果您可以使用这些过去行为的模式来预测未来可能发生的事情,那又会怎样?这就是建模的目标 - 模型,它包含一组从源数据中抽取的规则、公式或方程式,并允许您通过它们生成预测结果。这正是预测分析的核心。

关于预测分析

预测分析是一个业务流程,其中包含一组相关技术,通过从您的数据中总结出有关当前状况与未来事件的可靠结论,帮助制定有效的行动措施。它是以下方面的组合: ? 高级分析 ? 决策优化

高级分析使用多种工具和技术,分析过去与现在的事件,并预测未来的结果。决策优化确定您的哪些措施可以产生最好的可能结果,并确保这些建议措施能够最有效地融入到您的业务流程中。 有关预测分析如何工作的深入信息,请访问公司网

站 http://www.spss.com/predictive_analytics/work.htm。

建模技术

建模技术基于对算法的使用,算法是解决特定问题的指令序列。您可以使用特定算法创建相应类型的模型。有三种主要的建模技术类别,IBM? SPSS? Modeler 为每种类别提供了一些示例: ? Classification ? 关联

? 细分(有时称为“聚类”)

分类模型使用一个或多个输入字段的值来预测一个或多个输出(或目标)字段的值。这些技术的部分示例为:决策树(C&R 树、QUEST、CHAID 和 C5.0 算法)、回归(线性、logistic、广义线性和 Cox 回归算法)、神经网络、Support Vector Machine (SVM) 和贝叶斯网络。

关联模型查找您数据中的模式,其中一个或多个实体(如事件、购买或属性)与一个或多个其他实体相关联。这些模型构建定义这些关系的规则集。数据中的字段可以作为输入和目标。您可以手动查找

这些关联,但关联规则算法可以更快速地完成,并能探索更多复杂的模式。Apriori 和 Carma 模型是使用此类算法的示例。另一种类型的关联模型是序列检测模型,后者可以在按时间建立结构的数据中查找顺序模式。

细分模型将数据划分为具有类似输入字段模式的记录段或聚类。细分模型只对输入字段感兴趣,没有输出或目标字段的概念。细分模型的示例为 Kohonen 网络、K-Means 聚类、两步聚类和异常检测等。

我如何知道使用哪种技术?

有这样种类繁多的技术摆在面前,很难知道从哪里开始解决您的特定问题。幸运的是,IBM? SPSS? Modeler 可以通过自动化建模形式替您做出其中的部分决定。这是一种功能强大的技术,它能评估和比较多种不同建模方法,并按有效性顺序对它们进行排序。这样,您可以在单次建模运行中尝试多种方法。 自动建模

使用说明

要启动该应用程序,请从 Windows“开始”菜单的 SPSS Inc 程序组中选择IBM? SPSS? Modeler 14.1。几秒钟后,屏幕上将显示主窗口。

在数据挖掘过程中的每一个阶段,均可通过 IBM? SPSS? Modeler 易于使用的界面来邀请特定业务的专家。建模算法(如预测、分类、细分和关联检测)可确保得到强大而准确的模型。模型结果可以方便地部署和读入到数据库、IBM? SPSS? Statistics 和各种其他应用程序中。 使用 SPSS Modeler 即处理数据的三个步骤。 ? 首先,将数据读入 SPSS Modeler, ? 然后,然后通过一系列操纵运行数据, ? 最后,将数据发送到目标位置。

这一操作序列称为数据流,因为数据以一条条记录的形式,从数据源开始,依次经过各种操纵,最终到达目标(模型或某种数据输出)

流工作区是 IBM? SPSS? Modeler 窗口的最大区域,也是您构建和操纵数据流的位置。

通过在界面的主工作区中绘制与业务相关的数据操作图表来创建流。每个操作都用一个图标或节点表示,这些节点通过流链接在一起,流表示数据在各个操作之间的流动。

在 SPSS Modeler 中,可以在同一流工作区或通过打开新的流工作区来一次处理多个流。会话期间,流存储在 SPSS Modeler 窗口右上角的“流”管理器中。

IBM? SPSS? Modeler 中的大部分数据和建模工具位于节点选项板中,该选项板位于流工作区下方窗口的底部。

例如,可以使用“记录选项”选项板选项卡中包含的节点对数据记录执行操作,如选择、合并和追加等。 要将节点添加到工作区,请在节点选项板中双击图标或将其拖放到工作区。随后可将各个图标连接以创建一个表示数据流动的流。

每个选项板选项卡均包含一组不同的流操作阶段中使用的相关节点,如: ? 源。此类节点可将数据引入 SPSS Modeler。

? 记录选项。此类节点可对数据记录执行操作,如选择、合并和追加等。

? 字段选项。此类节点可对数据字段执行操作,如过滤、导出新字段和确定给定字段的测量级别等。 ? 图形。此类节点可在建模前后以图表形式显示数据。图形包括散点图、直方图、网络节点和评估图表。

? 建模。此类节点可使用 SPSS Modeler 中提供的建模算法,如神经网络、决策树、聚类算法和数据排序等。

? 数据库建模。 节点使用 Microsoft SQL Server、IBM DB2 和 Oracle 数据库中可用的建模算法。 ? 输出。节点生成可在 SPSS Modeler 中查看的数据、图表和模型等多种输出结果。

? 导出。节点生成可在外部应用程序(如 IBM? SPSS? Data Collection 或 Excel)中查看的多种输出。

? SPSS Statistics。 节点将数据导入 IBM? SPSS? Statistics 或从中导出数据,以及运行 SPSS Statistics 过程。

随着对 SPSS Modeler 的熟悉,您也可以自定义供自己使用的选项板内容。 可以使用“流”选项卡打开、重命名、保存和删除在会话中创建的流。

“输出”选项卡中包含由 IBM? SPSS? Modeler 中的流操作生成的各类文件,如图形和表格。您可以显示、保存、重命名和关闭此选项上列出的表格、图形和报告。

“模型”选项卡是管理器选项卡中功能最强大的选项卡。该选项卡中包含所有模型块,这些模型块包含针对当前会话在 SPSS Modeler 中生成的模型。这些模型可以直接从“模型”选项卡上浏览或将其添加到工作区的流中。

窗口右侧底部是工程工具,用于创建和管理数据挖掘工程(与数据挖掘任务相关的文件组)。有两种方式可查看您在 IBM? SPSS? Modeler 中创建的工程 - 类视图或 CRISP-DM 视图。

依据“跨行业数据挖掘过程标准”,这一业内认可且无所属的方法理论,“CRISP-DM”选项卡提供了一种组织工程的方式。不论是有经验的数据挖掘人员还是新手,使用 CRISP-DM 工具都会使您事半功倍。

“类”选项卡提供了一种在 SPSS Modeler 中按类别(即,按照所创建对象的类别)组织您工作的方式。此视图在获取数据、流、模型的详尽目录时十分有用。

搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新资格考试认证IBM SPSS Modeler 教程-(1) 全文阅读和word下载服务。

IBM SPSS Modeler 教程-(1) .doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/wenku/1104287.html(转载请注明文章来源)

相关推荐:

热门推荐
Copyright © 2018-2022 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top