top(惠普机型) topas(IBM机型)
(3)系统负荷检查:sar t n (查n次,每次时间间隔为t。
如sar 1 10 表示每秒一次共查10次)
参考标准:
[1] CPU平均负荷应小于60%,即%idle应大于40
[2] 如果CPU平均负荷大于60%,则连续观察10分钟,即运行:sar 10 60
[3] 如果CPU负荷一直大于60%,则说明系统过负荷。如果这时话务量并不大,则需要查明原因。
(4)系统是否限呼检查 cd /tellin/log
tail -f manager_0.log
“Auto gap factor has been changed form 100% to 75%.”表示系统已经限呼;
“Auto gap factor has been changed form 75% to 100%.”表示从限呼状态恢复正常。
(5)查看tellin业务进程
p
(6)进程状态检查
ps –ef|grep scf (检查SCF进程状态) ps –ef|grep sdf (检查SDF进程状态) ps –ef|grep manager (检查manager进程状态) ps –ef|grep scfserver (检查scfserver进程状态) ps –ef|grep oam (检查oam进程状态) SDF、manager、scfserver进程各有一个 SCF进程有多个;
oam进程数量与所开的OAM数量相同。 (7)查看系统日志
more 日志文件名
常用日志:
/tellin/log/manager_0.log //manager进程日志
/tellin/temp/manager_0.run //manager当前进程日志 /tellin/temp/scf_0_x.run //scf进程当前日志 /var/adm/syslog.log //操作系统日志
(8)参看双机状态
HP机型:cmviewcl –v IBM机型:lssrc –g cluster (9)数据库运行状态检查
onstat –
onstat -g dri onstat –d
参考状态:
[1]主机数据库为On-Line(Prim)状态,备机数据库为Read-only(Sec)状态。 [2]主备机的软件版本一致。
[3]主机数据应能自动备份到备机(主备机的使用情况应该相同)。 [4]数据库空间利用率不超过80%。
(10) 与SMP 、SAU(MEM)、主备机等的连接状态检查
netstat –an|grep 30200 与SMP
netstat –an|grep 5600 与SAU(MEM) netstat –an|grep 7300 与主备机
netstat –an|grep 9003/9005 与主备机数据库
4. 常见告警及处理方法
(1)CPU负荷超过设定的阈值
处理方法:登陆SCP,用top或topas指令参看CPU负荷,查看managelog日志,观察是否有限呼告警: Auto gap factor has been changed from 100% to 75%
上述告警提示说明SCP动态限呼机制已启动,业务按优先级设定进行限呼。 (2)磁盘空间满告警
处理方法:登陆SCP,用df –k指令查看磁盘空间占用率: 比较容易满的文件系统有3个:
/tellinshare ---话单增长造成,特别是每月1日后的几天 /tellin ---tellin程序升级和临时log文件增值造成
/var ---系统文件syslog、登陆日志wtmp,sulog等造成
(3)静态过负荷
过负荷控制分静态、动态两种,在文件/tellin/config/scusys.cfg中配置,用more指令可以查看。 ServiceKey[1] = 2 ServiceCAPS[1] = 100 StartRate[1] = 0 EndRate[1] = 100
Servicekey=? (根据Servicekey判断告警属于什么业务)
1--神州行话音 2--13800138000 11--短信 12--梦网 13--互联互通 91--动感地带 92--大众卡
(4)动态过负荷
此时,manager.log中会出现:Auto gap factor has been changed from 100% to 50% 提示,说明已经启动动态过负荷。
遇到发生动态限呼的情况必须尽快通知增值室。 (5) FEP断连告警
请注意与之断连的SCP,从SCP地址可以看出。用ping指令检查SCP与FEP的连通性是否良好,拨测所有短信相关业务是否正常,检查短信话单是否正常生成。如果是告警之后马上恢复则属于网络瞬断造成, (6)数据库断连告警
数据库断连出现在主备用数据库状态不正常的情况,此时可登陆SCP,用onstat –指令检查数据库状态,并检查主机的/tellin/sms/record/recbuf 目录下是否有最新的话单文件生成,若有则说明业务暂时没有影响,但仍需要马上联系系统管理员检查系统。 (7) 与SMP断连 或 socket连接异常告警
这两种告警均属于SMP相关的告警, SMP执行升级、进程重启或网络瞬断,都可能会出现。一旦出现需要尽快处理。
(8) autobackup告警
一般不是磁盘空间不足或数据库连接失败引起。Autobackup是自动导出数据库表、结构的脚本。该告警不会影响业务,但还是需要通知增值室,以确定备份的数据是否有正常导出。当数据库数据出现异常时,可采用这种备份出来的数据文件来恢复数据,以及恢复数据库的表结构,对于局部的数据错误使用这种方式相对较为快捷。而对于整个数据库的异常,则智能网使用磁带备份的数据库来恢复。 (9)远程控制--radmin的使用
主要用于远程控制RBI、SAU BAM主机,对于话单采集问题、监控终端不能连上BAM等故障,使用radmin可以极大缩短故障处理时间。该软件无须安装,点击即可运行。 (10)话单采集中断故障的处理步骤
使用radmin登陆相应的RBI,检查RBI程序是否已启动,以及是否有红字的告警,或者检查电脑D盘的剩余空间,如果剩余空间<200M,则是磁盘空间满造成的话单采集中断,在每月1日左右经常出现此问题。
解决办法:进入D:/RBI/RECORDBACKUP目录,手工删除已传走的话单文件,使用指令 del *20050701* 删除前两天的话单即可。
若RBI 正常则登陆SCP,进入/tellin/sms/record目录,检查目录下是否有话单堆积(话单以unl结尾),若有堆积则说明是RBI没有采集,此时可检查RBI是否正常,RBI与SCP网络是否通畅,必要时可重启RBI(用radmin登陆重启),RBI重启不会影响业务。进入SCP的/tellin/sms/record/recbuf目录,用 ll 指令检查是否有最新的话单产生(观察文件的时间),若话单不刷新,则说明SCP没有产生话单,此时必须尽快联系相关人员。
三、附录
附录1、关于IOG计费拥塞处理
附录2. 例行小启注意事项
系统小启的检查及注意事项
一、系统检查:
1、 ALLIP: 检查是否有不正常的告警,包括所有级别的告警,最好能记下A1、A2、A3、O1、O2级告警
的数量, 这样可以在重启动后进行一个比较快速的对比。(各告警级别的数量可通过OSS的告警面板直接获取)。
2、 PLLDP: 检查CP负荷 < 10。 3、 DPWSP: 检查一下CP状态。 4、 CACLP: 检查一下系统时钟。 二、计费检查:
1、 CHODP: 检查一下计费指针的跳动。 2、 CHOFP: 检查一下计费文件的输出。 三、IOG的检查:
1、 IMCSP: 检查一下IOG 的状态。 2、 EXSLP: 检查一下SP Link 的状态。 四、APG的检查:
1、 prcstate: 检查一下 APG 的状态。
2、 OCINP:IPN=ALL; 检查一下IPN的状态(如果有输出)
SYRIP:SURVEY;
SYREI:RANK=SMALL,EXPL=PLAN;
注意事项:
1.启前停自动DUMP;启后检查交换机时钟(防止小启造成较大的时钟滑动);
2.例行小启动要求在 01:00以后进行,05:00 以前完成,期间避开1:50-2:30(2:00系统进行选组测试,同时留意系统自动DUMP尚未进行)。HLR在2:30后进行。
3.不要在同一时间对同一交换局下MSC/BSC进行重启,待一个完全恢复后再做同一交换局下的另一网元。 4.例行小启动网元与每周例行备份安排的网元基本一致(HLR除外) 5.例行小启动时做一个logfile,并收集记录小启动后网元出现的异常情况。
6.例行小启动,注意检查BSC的GB口状态,如果出现故障请先对其进行闭塞、解塞测试(RRGBP;闭塞指令:RRVBI,解闭指令RRVBE)。
附录3. HLR用户数据解释
HGSDP:MSISDN=8613......,ALL;
MSISDN IMSI STATE AUTHD
86139... 460... CONNECTED/IDLE/NOT CONNECTED AVAILABLE/UNAVALIABLE NASM
0(GSM和GPRS)/1(只有GSM)/2(只有GPRS) /表示用户具有的功能 SUD(SUBSCRIBER DATA 用户数据 数据值为0不显示)
CAT-10 :普通用户 CLIP-1:来电显示(主叫显示)
SOCB: 呼叫限制控制选项 0-运营商(全球通) 1-运营商和用户(智能网) SOCB-0:用户的国际长途功能只能由运营商开通,停机可用OBA-1或者SS
SOCB-1: 用户可自己激活开通国际长途功能,如动感地带,停机须用OBA-1 SOCB-3: 用户输入3次密码错误后锁机,同时BAOC会被激活,限制呼出
OFA:呼转号码分析源,佛山(国内)为1,韩国为2,日本为3
TS11-1 语音服务
TS21-1/0 收短信/限收短信
TS22-1/0 发短信/限发短信 (停用户短信值为0)
OBO-1 呼出停机 OBI-1 呼入停机 (开机须用OBO-0,OBI-0) 使用OBA-1停机可导致 OBO-1,OBI-1; OBR-0 国际漫游 OBR-1 国内漫游(少用)
OBR-2 限制国际漫游,可国内漫游(全球通,动感地带,神州行默认开)
OBR-4 神州大众卡 OBR-7 大众卡省内漫游
OBR-11 城市卡(以前的卡才有)
CFU-1 无条件前转 CFB-1 遇忙转 CFNRY-1 无应答转 CFNRC-1 不可及转(神州行不具备该功能)
SOCFU: 无条件呼叫转移控制选项(开了CFU功能才有) -0 呼转时无任何通知 -1 呼叫时仅通知主叫 -2 呼转时仅通知被叫
BICRO-1: 漫游时限制呼入功能
BOIEXH-1: 出国漫游只能打归属国 国际长途呼出限制(除本国) PWD-0000 用户密码 BS26-1 WAP上网 TS62-1 传真
RED-1 表示该HLR上用户数据是备份状态 OCSI-1 智能网主叫触发鉴权(智能网特有) TCSI-1 智能网被叫触发鉴权(智能网特有) ICI-1 立即计费 DBSG 话音服务 HOLD 呼叫保持
CAW 呼叫等待, 要激活CAW-1 HOLD-1,同时开通呼叫等待功能CAW MPTY-1 会议电话 要激活CAW-1 HOLD-1, MPTY-1
MRBT-1 彩铃(R10版本为PRBT-1)
SOCLIR-0 无主叫隐藏(大部份用户) 必须首先设置CLIR-1
-1 主叫隐藏(可选显示)“*31#+被叫号码 ”选择显示
-2 可选隐藏, 默认是显示主叫号码 “#31#+被叫号码 ”隐藏主叫号码 SOCLIP-0 无强显(大部份用户)
-1 强制呼叫显示 (不对普通用户开放)
-2 可选
BSG(Basic Service Groups) 包括BS20(异步数据业务),
BS30(同步数据业务), TS10(语音业务), TS20(短信业务), TS60(传真服务), TSD0(附加语音业务)
附录4. B表分析源
20-29: 本交换局业务区域内的LS,TACS话务入口分析源,限制不加0,拨本地号码 30:异地GSM用户发话分析源
31:本地GSM用户发话分析源,同时作主分析源。 52:TS局的话务入口分析源
54:H1H2H3的分析源,占用询问路由,咨询HLR拨电话时入54源,若是被叫号码,通过GRI软件路由查询被叫
HLR地址
72:呼叫转移号码分析源 81:MSC,TR话务入口分析源 85:TCON和测试电话分析源 90:MTB 91:GSMS 92:IWSMS 93:MSMO 94:MSMT 99:通知音 60:异地SSP 61:本地SSP
B表分析,首先如果是本地手机拨打的,进入31号分析源,异地手机进入30号分析源。 分析号码是移动手机号码则31->54手机ANBSP:B=31-1392311 ->ANBSP:B=54-1392311;) 31->54->32->CGI3-> (GT分析) ->GTRC分析->HLR取数据 如果号码是本地市话则 RC=10 -> RC=40;
搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新工程科技爱立信2G常用指令汇总 (4)全文阅读和word下载服务。
相关推荐: