Informatica PowerCenter平台 ETL开发规范 7.4 别名
SQL语句别名的命名,分层命名,从第一层次至第四层次,分别用P 、S、 U 、D(都是大写字母)表示,取意为Part, Segment, Unit, Detail。
对于同一层次的多个子句,在字母后加1、2、3、4……区分。 如下图所示:
7.5 运算符前后间隔要求
算术运算符、逻辑运算符的前后至少要保留一个空格,如下图所示:
BusinessMatrix Information System Corporation 2006 March 31, 2014
Page: 29 of 36
Informatica PowerCenter平台 ETL开发规范 7.6 变量引用
? 在SQL语句中引用主机变量(如PERL、SHELL等)时,要在变量名两端加花括号 ? 对日期变量的引用要在单引号内,如'${MYDATE}'
7.7 注释
针对复杂的SQL语句,请尽量增加相应的注释说明,以便自己和其它同事事后可以比较容易的读懂和修改。
注释中应包含以下内容: ? 编写人/编写日期 ? 修改人/修改日期
? 该脚本的编写目的与主要内容
? 如果有特殊处理、特别的技巧等内容,一定要在注释中详细说明 ? 每一大的模块之前要有注释,说明该模块的主要作用 以下是注释必需项:
1. 程序头注释,应说明以下几项:
? 功能 ? 创建日期 ? 创建人
? 修改记录(修改人、修改日期、修改描述) ? 源表 ? 目标表 ? 参数 ? 调用
以下是一个典型的程序头注释区:
BusinessMatrix Information System Corporation 2006 March 31, 2014
Page: 30 of 36
Informatica PowerCenter平台 ETL开发规范
2. 程序体注释,应说明以下几项:
? 变量声明区 ? 变量初始化区 ? 主程序开始 ? 垃圾回收区
7.8 其它
对于内连接和外连接的使用,要求该使用外连接的地方都已经使用了外连接,不需要外连接的地方一定不使用外连接。
表中的字段若是从其它表引用的,要确保该字段在被引用的表中存在。 此外,SQL代码中禁止使用 *,必须明确具体字段列表。
8. 脚本编写规范
8.1 UltraEdit
编写SQL 。
BusinessMatrix Information System Corporation 2006 March 31, 2014
Page: 31 of 36
Informatica PowerCenter平台 ETL开发规范 8.2 SHELL
9. ETL开发流程
9.1 ETL开发流程
ETL的开发通常会以PDM的一个表或几个相关表为单位,我们称之为JOB。每一个JOB的开发通常会包含以下步骤:
1) 编写加载说明文档(包括MAPPING文档) 2) 开发初始与日常加载脚本 3) 测试初始与日常加载脚本 4) 编写测试报告
加载说明文档的模板和测试报告的模板因项目而异,格式可以参考每个项目具体的文档模板。 开发时最好以JOB为单位,由易到难,一个JOB结束以后再着手开发下一个JOB。当第一个JOB开发完成之后,由ETL相关负责人员确认文档、脚本等都没有问题以后,再进行下一个JOB的开发。
对于JOB的开发,实行“终身版权制”,在项目结束之前,只要开发人员还在项目中,其开发的JOB出现问题,开发人员拥有最终的解释权,并负责解决出现的问题。
9.2 文档编写要求
必须在文档中注明初始开发人员与日期、每次变更的人员、变更内容及日期。
BusinessMatrix Information System Corporation 2006 March 31, 2014
Page: 32 of 36
相关推荐: