第一部分:概述
爱立信的基站设备由于较高的稳定性和友好的人机接口,被广泛应用于我国的移动通信系统中,本文将联系实际,介绍一些笔者在RBS2000的维护和故障处理方面总结的一些经验和方法,并希望能起到抛砖引玉的作用。
维护工作是一项要求严谨细致的工作,由于设备本身和各个单元之间联系的复杂性,要求维护人员一定要对设备的工作原理有较深刻的认识,对各单元之间的联系了如指掌,同时也要懂得必要的BSC知识和传输知识。尽管不可能百分百地掌握一切故障的处理方法,但充分理解各单元的功能原理及硬件结构却是解决问题的关键所在。
下图是设备连接图例:
第二部分:故障原因
爱立信用户手册中列举的故障是按其起因和重要性进行分类的,共分为5个类别:
1、内部故障映射级别 I1A,出错硬件在信令MO 中,影响MO功能。 2、内部故障映射级别 I1B,故障原因与信令MO无关,影响MO功能。 3、内部故障映射级别 I2A,出错硬件在信令MO中,不会影响MO功能。 4、外部条件映射级别 EC1,这些条件是外部TG,会影响MO功能。 5、外部条件映射级别 EC2,这些条件是外部TG,不会影响MO功能。
这5个类别中共有故障达230个之多,综合分析引起这些故障的原因主要在以下几个方面:
1、设备硬件引起的故障:
因为设备本身电路的高集成度和对工作环境的苛刻要求,设备硬件引起的故障是最常见的,在整个基站故障中占了相当大的比例。例如载波永久性故障。
2、人为引起的故障:
1) 对软件操作错误,包括IDB中的TEI定义不对,BSC中的传输定义的不够多,MO与CELL没有连接起来,频率设置或功率设置错误等等。
2) 对硬件操作错误,主要是连线连接错误或接口没有拧紧造成。常见的包括馈线口没有打紧出现的驻波比告警,接反引起的掉话等等。
3、软件问题引起的故障:
随着设备软件版本的不断更新,这类故障一般出现较少。现在比较常见的大多是设备在升版过程中引起的故障, DXU多次升版不成功引起的设备坏,TRU升/降版过程中引起的 CF 2A 41 等等。
4、传输问题引起的故障:
原本是正常工作的小区,突然出现闪断或全阻,就要怀疑是传输方面有问题了,包括2M头虚焊,PCM线接口松等都是重点怀疑对象。
5、各种干扰引起的故障:
包括同个基站中任何两个频点之间间隔有不超过400KHZ(CDUD要间隔600KHZ)的,传输受干扰等等。
第三部分:处理方法
通常可以把最有可能影响故障产生的对象分成三个部分,即基站主设备部分、传输部分、和BSC数据部分。限于篇幅,本文只讨论基站主设备部分(其它部分另文详述),主要有以下几点:
1、替换法:
替换法是常用的方法之一。当不能确定故障出在具体什么单元时,一般用此法。即配带尽量多的相关的备件,到现场把与该Fault code 相关联的设备逐一进行替换,然后再观察故障是否消除。这种方法的不足之处是,可能会对RBS 小区的正常工作或话务有一定的影响。
2、排除法:
当不能确定是哪个单元有问题,而只能确定是这一类单元有问题时,可以用排除法:例如,某个小区有一个载波有问题不能建立通话,但不能确定是哪个载波。这时采用排除法,关闭基站Hopping(跳频) ,只开一个TRU,其余的TRU 关闭,通过OMC 定义MS (移动台) 使用指定的TRU 连接,逐个TRU 测试观察,直到找出故障的TRU 。
3、转移位置法:
转移位置是指转移有故障嫌疑的设备的位置,观察故障点是否也随之转移。如果是则可以肯定该设备的问题,否则是和该设备联系的其他单元的问题。例如:怀疑A载波有分集接收告警,但不确定,就可能把A载波和其他位置的B载波(最好不同CDU)对调位置,如果该告警还是出来,并定位到还是A载波,则就可以肯定A载波有问题。
4、经验法:
借鉴前人的经验也是解决问题的一个重要手段,较常出现的故障通常在以前也已经出现过,肯定有一些成功的经验,套用以前的经验可能使问题得到更快的解决。但在一些不是很紧急的情况下,还是建议自己先认真思考解决办法。
5、Log文件分析法:
log 文件分析法是比较少用的方法,因为该方法耗时较长,要求维护人员能读懂log 文件,有较强分析log文件的能力。优点是可以比较准确地诊断故障位置。 实例:
log文件截图:
RBS 于00 :30 出现告警,故障代码为348,查故障代码为发信机控制失败。MO 上检测到是TS 事件,干扰升高,传送码发生器功率控制通信丢失,但无法
确定哪个发信机故障。再逐个查看TRU 的log 文件记录,在TRU 0 的log 文件有如上图记录事件:
TRAC 有故障发生,系统软件重装失败。由于RBS小区的BCH ( 广播信道) 在第一个TRU ,所以小区BCH(广播信道) 所在的TRU 发信机发生故障,整个小区就无法进行呼叫建立通信。再加上该小区开了Hoping ,造成小区无法通话,更换TRU 0 后,小区恢复正常通信。
6、软修复法:
有些故障通过对DXU和TRU复位即得到修复,OMC端的重新解闭可以达到异曲同工的效果(软修复)。出现以下故障时可优先尝试软修复法,如果反复出现,再到站处理:
1) CF 2A9、TX 1B2 :故障描述为输出功率超出门限值,首先尝试闭解CF。 2) TRX 2A13、TX 1B14:故障描述为TX处于饱和状态,首先尝试闭解TRX。 3) TRX 2A11、TX 1B12:故障描述为TX温度过高,首先尝试闭解TRX。 4) CF 2A12:故障描述为RX最大增益/最小增益的干扰,首先尝试闭解CF。 5) TRX 1A18:故障描述为DSP故障,首先尝试闭解TRX。 6) TX PERMANENT FAULT:首先尝试闭解TX。
第四部分:结束语
爱立信设备由于其高度的集成化和良好的人机接口,其维护起来相对简单,但也增加了障碍的隐蔽性,对维护人员的能力要求更高,维护人员对基站的各类故障应该认真分析,找出其真正原因,以最快的速度排除故障。并在事后能认真总结,找到理论依据,使理论和实践融会贯通。
相关推荐: