Northwind数据仓库的构建和ETL
课程设计与实验报告
课程设计与实验教学目的与基本要求
数据仓库与知识工程课程设计与实验是学习数据仓库与知识工程的重要环节,通过课程设计与实验,可以使学生全面地了解和掌握数据仓库与知识工程课程的基本概念、原理及应用技术,使学生系统科学地受到分析问题和解决问题的训练,提高运用理论知识解决实际问题的能力。
使学生在后继课的学习中,能够利用数据仓库与数据挖掘技术及实践经验,解决相应的实际问题,并能在今后的学习和工作中,结合自己的专业知识,开发相应的数据仓库与数据挖掘应用程序。培养学生将已掌握的理论与实践开发相结合的能力,以及在应用方面的思维能力和实践动手能力。
课程设计与实验一 数据仓库的构建和ETL
(一)目的
1.理解数据库与数据仓库之间的区别与联系;
2.掌握数据仓库建立的基本方法及其相关工具的使用。 3.掌握ETL实现的基本方法及其相关工具的使用。
(二)内容
1. 以SQL Server为系统平台,设计、建立创建数据仓库NorthwindDW(根据课程设计内容)。
2. 将业务数据库Northwind的数据经过ETL导入(或加载)到数据仓库NorthwindDW。 3. 将数据仓库NorthwindDW事实表的前100个记录导出到Excel中。
(三)数据仓库设计要求
Northwind数据库存储了一个贸易公司的订单数据、产品数据、顾客数据、员工数据、供货商数据等,假设贸易公司的经营者迫切的需要准确地把握贸易公司经营情况,跟踪市场趋势,更加合理地制定商品采购、营销和奖励政策。具体的分析需求是:
? 分析某商品在某地区的销售情况 ? 分析某商品在某季度的销售情况 ? 分析某年销售多少金额的产品给顾客 ? 分析某员工的销售业绩
任务:确定主题域、确定系统(或主题)的边界。设计数据模型(星型模型)的事实表和维表。
实验步骤一、主题需求分析:
主题域:订单主题,商品主题,员工主题;
订单相关边界:Orders,Order Details,Employees; 商品相关边界:Products, Order Details; 员工相关边界:Employees,Orders;
实验步骤二、构建数据模型以及相应的事实表和维度表:
1.原始关系图:
2.去除不需要的表和与需求分析无关的字段:
5.根据信息分析包以及表间关系图设计具体维度表和事实表:
Orders事实表结构以及主键字段: 字段名称 EmployeeID ProductID CustomerID OrderDate UnitPrice Total Quantity Discount 数据类型 Int Int nchar datetime money money smallint real 功能描述 员工号码 产品号码 顾客号码 订购日期 产品单价 单项总价 订购数量 折扣 原表名 Employees Products Customers Orders Order Details 无 Order Details Order Details 原字段 EmployeeID ProductID CustomerID OrderDate UnitPrice Quantity * UnitPrice*Discount Quantity Discount 主键字段:EmployeeID, ProductID, CustomerID, OrderDate
Employee 员工维度表结构以及主键字段: 字段名称 EmployeeID FirstName LastName 数据类型 Int nvarchar nvarchar 功能描述 员工号码 员工名 员工姓 原表名 Employees Employees Employees 原字段 EmployeeID FirstName LastName 主键字段:EmployeeID
相关推荐: