江西理工大学应用科学学院
题 目: 某超市数据集的OLAP分析及数据挖掘 系 别: 经济管理系 班 级: 信息管理与信息系统091班 姓 名: 01号 陆叶萍
二〇一二年六月
1
《数据仓库与数据挖掘》课程设计报告 目 录
一、建立数据仓库数据库结构和设置数据源............................................................... 3
1. 任务描述..................................................................................................................................... 3 2. 建立数据仓库数据库 ................................................................................................................. 3 3. 设置数据源................................................................................................................................. 3
二、销售数据OLAP分析 .............................................................................................. 3
1. 任务描述 .................................................................................................................................... 3 2. 设计星型架构多维数据集(Sales) ............................................................................................. 3 3. 设计存储和数据集处理 ............................................................................................................ 5 4. OLAP分析 ................................................................................................................................. 6
三、人力资源数据OLAP分析 ...................................................................................... 6
1. 任务描述 .................................................................................................................................... 6 2. 设计父子维度的多维数据集(HR) ............................................................................................ 7 3. 修改多维数据集(HR)的结构 .................................................................................................... 7 4. 设计存储和数据集处理 ............................................................................................................ 8 5. OLAP分析 ................................................................................................................................. 8
四、数据仓库及多维数据集其它操作........................................................................... 8
1. 任务描述 .................................................................................................................................... 8 2. 设置数据仓库及多维数据集角色及权限 ................................................................................ 8 3. 查看元数据 ................................................................................................................................ 9 4. 创建对策 .................................................................................................................................... 10 5. 钻取 ............................................................................................................................................ 11 6. 建立远程 Internet 连接 ............................................................................................................ 12
五、数据仓库高级操作................................................................................................... 12
1. 任务描述 .................................................................................................................................... 12 2. 创建分区 .................................................................................................................................... 13 3. 创建虚拟多维数据集 ................................................................................................................ 13 4. DTS调度多维数据集处理 ........................................................................................................ 14 5. 备份/还原数据仓库 ................................................................................................................. 15
六、数据挖掘................................................................................................................... 15
1. 任务描述 .................................................................................................................................... 15 2. 创建揭示客户模式的决策树挖掘模型 .................................................................................... 15 3. 决策树挖掘结果分析 ................................................................................................................ 16 4. 创建聚类挖掘模型 .................................................................................................................... 17 5. 聚类挖掘结果分析 .................................................................................................................... 18 6. 创建基于关系数据表的决策树挖掘模型................................................................................. 18 7. 浏览“相关性网络”视图 ........................................................................................................ 19
2
一、建立数据仓库数据库结构和设置数据源
1.任务描述
数据仓库数据库是将要在其中存放多维数据集、角色、数据源、共享维度和挖掘模型的一种结构。然后跟预先设置好的ODBC数据源建立连接。
2.建立数据仓库数据库
1) 右击计算机→属性→计算机名→复制“dzsw129”,开始→Microsoft SQL Server→Analysis Servers→Analysis Manager;
2) 右击Analysis Servers,“注册服务器”,粘贴服务器名“dzsw129”; 3) 展开树视图的Analysis Servers下的dzsw129;
4) 单击服务器名或右击选择连接,与Analysis Servers建立连接; 5) 右击服务器名,然后单击“新建数据库”命令;
6) 在“数据库”对话框中输入数据库名“Winnie”,单击<确定>;
7) 展开刚创建的“Winnie”数据库,可看到如下项目:数据源、多维数据集、共享维度、挖掘模型、数据库角色.
3. 设置数据源
1) 右击“Winnie”数据库下的“数据源”文件夹,然后单击“新数据源”命令; 2) 在“数据链接属性”对话框中,单击“提供程序”选项卡,选择“Microsoft OLE DB Provider for ODBC Drivers”;
3) 单击“连接”选项卡,选择建好的ODBC数据源“FoodMart 2000”; 4) 单击<确定>按钮关闭“数据链接属性”对话框。OK!
二、销售数据OLAP分析
1.任务描述
以多维方式建立数据模型可简化联机业务分析,提高查询性能。通过创建多维数据集,Analysis Manager 可将存储在关系数据库中的数据转换为具有实际含义并且易于查询的业务信息。星型架构的多维数据集由一个事实数据表和链接到该事实数据表的多个维度表组成。
2.设计星型架构多维数据集(Sales)
3
下面针对FoodMart2000超市1998年的销售业务数据,建立一个多维数据集,以便按产品和顾客2个主题展开分析。具体操作如下:
1) 展开树窗格的“winnie”,右击“多维数据集”,选择“新建多维数据集”→“向导…”菜单命令,打开如下“多维数据集向导”对话框。 2) 向多维数据集添加度量值(事实) :
3) 单击<下一步>,在“从数据源中选择事实数据表”步骤中,展开“FoodMart2000”数据源,然后单击“sales_fact_1998”;
4) 单击<下一步>,设置多维数据集的度量值列: store_sales、store_cost、unit_sales;
5) 单击<下一步>,建立维度表。单击<新建维度>,打开“维度向导”对话框;
① 向多维数据集添加时间维:
1) 选择维度类型为“星型架构:单个维度表”; 2) 单击<下一步>,选择维度表“time_by_day”; 3) 单击<下一步>,选择维度类型为“时间维度”; 4) 单击<下一步>,选择时间级别为“年、季度、月”;
5) 单击<下一步>,单击<下一步>,输入时间维名称: Time,并设为“共享”方式,单击<完成>,OK!
② 向多维数据集添加产品维:
1) 再次单击<新建维度>,打开“维度向导”对话框; 2) 选择创建维度的方式为“雪花架构:多个相关维度表”; 3) 单击<下一步>,选择维度表“Product”和“product_class”;
4) 单击<下一步>,查看连接方式,在这里可删除不要的连接,添加需要的连接;
5) 单击<下一步>,依次选择product_category、product_subcategory和brand_name三个维度级别;
6) 单击<下一步>,指定成员键列步骤中,不需改变主键列; 7) 单击<下一步>,在“高级选项”步骤中,根据需要选择;
8) 单击<下一步>,输入产品维名称: Product,并设为“共享”方式,单击<完成>,OK!
③ 向多维数据集添加客户维度:
1) 再次单击<新建维度>,打开“维度向导”对话框; 2) 选择创建维度的方式为“星型架构:单个维度表”; 3) 单击<下一步>,选择维度表“Customer”;
4
4) 单击<下一步>,选择维度类型为“标准维度”;
5) 单击<下一步>,依次选择Country、State_Province、City和lname四个维度级别;
6) 单击<下一步>,指定成员键列步骤中,不需改变主键列; 7) 单击<下一步>,在“高级选项”步骤中,根据需要选择;
8) 单击<下一步>,输入客户维名称: Customer,并设为“共享”方式,单击<完成>,OK!
④ 向多维数据集添加商店维:
1) 再次单击<新建维度>,打开“维度向导”对话框; 2) 选择创建维度的方式为“星型架构:单个维度表”; 3) 单击<下一步>,选择维度表“Store”;
4) 单击<下一步>,选择维度类型为“标准维度”;
5) 单击<下一步>,依次选择store_country、store_state、store_city和store_name四个维度级别;
6) 单击<下一步>,指定成员键列步骤中,不需改变主键列; 7) 单击<下一步>,在“高级选项”步骤中,根据需要选择;
8) 单击<下一步>,输入商店维名称: Store,并设为“共享”方式,单击<完成>,OK!
⑤ 生成多维数据集:
1) 回到多维数据集向导对话框,这里已 到了新建的4个维度;
2) 单击<下一步>,在“是否计算事实数据表行数提问时,单击<是>,开始计算。 3) 计算完成后,命名多维数据集为:Sales,单击<完成>,OK!
4) 关闭向导,随之启动多维数据集编辑器,其中可看到刚刚创建的多维数据集。单击蓝色或黄色的标题栏,对表进行排列,使其符合下图所示的样子:
5
相关推荐: