第一范文网 - 专业文章范例文档资料分享平台

Informatica PowerCenter平台ETL开发规范

来源:用户分享 时间:2025/8/22 0:30:21 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

Informatica PowerCenter平台 ETL开发规范 5.9 Expression

Expression组件用于计算、创建、修改数据以及在数据流中设置和创建变量(不同记录间变量值不会丢失),此组件还可以在Transformation设计区封装成可重用组件。

Expression组件可以在Mapping中编辑和修改,可以创建输入、输出、变量三种不同的端口,Informatica处理Expression组件总是按输入端口、变量不按口、输出端口的顺序计算,但需要注意的是变量端口在组件中的顺序会影响变量端口的计算先后顺序。

Expression组件端口命名需要遵循:

1) 变量端口需以”v_”为前缀,并紧接着数据类型简称:

? 字符型数据:v_char//v_vchar/v_vchar2/v_text ? 数值型数据: v_num/v_float/v_dec/v_real ? 整型数据-:v_int/v_sint ? 日期型数据:v_date 2) 新建输出端口以“o_”为前缀:

如端口涉及对字符数据的操作处理,其端口命名需体现数据操作,例如:o_conc_custname 如端口涉及数值型数据处理,其端口命名需体现数据操作,例如:sum_alltaxes Expression组件命名应遵循: EXP_

例如:EXP_TRIM_COLS、EXP_DECODE_GEOG_ID

5.10 Filter

Filter组件用于在mapping中按过滤表达式的True/False结果过滤数据,为提高性能,如需过滤数据,在mapping中应尽可能将此组件放在数据流的靠前位置。

Filter组件命名遵循: FLT_

例如:FLT_STOP_OLD_RECS、FLT_GEO_ID、FLT_GeoidGreaterThan0等

5.11 Joiner

Joiner组件用于连接两张位于不同物理位置的数据源表或文件,一个最常见的情形是连接关系型数据表和平面文件。

Joiner组件命名需遵循: JNR_ 例如:JNR_TRANX

5.12 Lookup

Lookup组件用于根据输入组件传入的条件查找数据库返回需要的数据,并可以传递到后续组件。

BusinessMatrix Information System Corporation 2006 March 31, 2014

Page: 21 of 36

Informatica PowerCenter平台 ETL开发规范 Lookup组件有两种用法:connected/ unconnected,connected场景下,Lookup组件需要连接到数据流中的其他组件,而在unconnected场景下,Lookup组件没有连接到任何组件。

Lookup组件unconnected用法,往往都是出于性能考虑,但是需要注意的是unconnected Lookup组件只能返回一个值。

Lookup组件输入端口应以“i_”为前缀,输出端口以“o_”为前缀,需要注意的是此组件中端口的数据类型如需修改则应在其前一组件中修改,而不应在本组件中修改。

? 端口数据类型不匹配是Lookup组件出错的的常见错误,为避免此类型错误,要确保参与比较的端口数据类型一致。

? 如果需要手工改写Lookup组件自动生成的SQL语句,需要注意自动生成的字段顺序不能改

变,并且如果要使用数据库排序,要在语句末尾加“--”字符 Lookup组件命名需要遵循: LKP_ 例如:LKP_TRANSACTION

5.13 Normalizer

Normalizer组件用于实现列转行,比较常见的情形是将结构化数据(例如:平面文件)转成关系型数据。

Normalizer组件命名需要遵循: NRM_

例如:Norm_OS_TRANS_DAILY

5.14 Rank

Rank组件用于对指定数据集排序以只返回前/后 n条记录,例如:按销售业绩对销售经理进行排名,只返回前10名的记录。

Rank组件命名需要遵循: RNK_

例如:RNK_TopTenCustbySales

5.15 Router

RTR_

例如:RTR_GeoidGreaterThan0

5.16 Sequence Generator

Sequence Generator组件用于生成整形序列值 ,一个典型的应用时生成维度代理键。从性能上看Sequence Generator组件比数据库序列的性能较差。

Sequence Generator组件命名遵循:

BusinessMatrix Information System Corporation 2006 March 31, 2014

Page: 22 of 36

Informatica PowerCenter平台 ETL开发规范 SEQ_

例如:SEQ_RATION

5.17 Sorter

Sorter组件只包含输入和输出端口,输入数据按指定的排序字段排序,排序字段可以是一个或多个输入端口。

Sorter组件命名需遵循: SRT_ 例如:SRT_CUSTOMER_DATA

5.18 Source Qualifier

Source Qualifier组件用于定义数据流输入SQL语句(可以是PL/SQL 、T-SQL,不同数据库平台SQL语法规范或有不同),在自定义SQL输入框中可以指定SQL Join、排序、Group By以及其他条件过滤语句。

需要注意的是,尽可能少在组件提供的“Source Filter”限定过滤条件,应尽可能在“sql query”输入框里指定。

Source Qualifier组件命名需遵循: SQ_ 例如:SQ_TRANSACTION

说明:这里的SQL语句必须符合SQL编写规范。

5.19 Stored Procedure

Stored Procedure组件用于在Informatica数据流中调用外部数据库存储过程/函数执行数据转换,例如全角转半角、半角转全角等。尽可能限制使用存储过程实现转换处理,因为存储过程的引入使得mapping难以调试且会降低代码的可读性。

一般来讲,建议将在Informatica中无法实现和难以实现的处理逻辑才依靠外部存储过程/函数实现,摒弃在存储过程/函数实现所有的处理逻辑的做法。

Stored Procedure组件命名应遵循:

STP__ 例如:STP_DWDEV_Calc_Commissio

5.20 Update Strategy

Update Strategy组件用于标识数据流是以插入、删除、更新、拒绝中的哪一种方式输出到数据表中,需要注意的是应尽可能避免使用reject选项,因为此选项会导致大的日志文件生成。

Update Strategy组件命名应遵循:

BusinessMatrix Information System Corporation 2006 March 31, 2014

Page: 23 of 36

Informatica PowerCenter平台 ETL开发规范 UPD__xxx

说明:xxx = _ins for INSERT

_dlt for DELETE _upd for UPDATE

_dyn – dynamic (根据表达式取值动态决定更新方式)

使用此组件,update Strategy Expression输入框中禁止直接使用数字,而应使用Informatica内置变量代替:

0 – dd_insert 1- dd_delete 2 –dd_update 3-dd_reject

例如:UPD_TRANSACTION_upd

5.21 Mapplet

Mapplets通常用于封装复杂的转换逻辑尤其是需要使用到多个转换组件时,主要出于重用的目的。Mapplet一旦定义好,可以在多个mapping中复用,这样一旦需要修改规则,仅需要修改mapplet即可,而关联的mapping则不需要修改。

为了实现Mapplet的可重用性,在设计Mapplet时需要指定输入和输出端口,但这些端口仅是mapping中调用的逻辑接口表示。在Mapplet中使用的各种转换组件需要遵循之前约定的规则,但唯一的例外是如果mapplet在多个集市项目中需要共享,不要限定项目名称。

这里需要强调一下,在设计mapplet时一定要详细说明输入和输出端口的描述、mapplet的功能说明。

Mapplet组件命名应遵循: MPLT_

例如:MPLT_SPLIT_ESTIMATES

5.22 Input Tranformation ( Mapplet Only)

Input组件用于在Mapplet组件中定义输入端口,允许mapping中的数据流可以流入mapplet组件,与此组件对应的是下一节要提及的Output组件。

Input组件命名应遵循:

INP_ 例如:INP_APJournalEntries

BusinessMatrix Information System Corporation 2006 March 31, 2014

Page: 24 of 36

搜索更多关于: Informatica PowerCenter平台ETL开发 的文档
Informatica PowerCenter平台ETL开发规范.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c1ggq82weei3bj0w6hx1l_6.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top