华为5G承载网SPN故障处理
2025-01-03 22:05:50 0 举报
AI智能生成
华为5G承载网SPN故障处理指南是一份全面的技术文档,旨在帮助网络管理员和工程师快速诊断和解决SPN网络中的各种问题。这份指南涵盖了SPN网络的核心组件,如切片、路由协议、QoS flow配置等,以及常见的故障场景和处理方法。通过参考这份指南,技术人员可以更有效地维护和管理他们的5G网络,确保其稳定运行,为用户提供优质的服务。
作者其他创作
大纲/内容
管理面故障
DCN
端口未使能DCN
NE-IP或NE-ID冲突
网关网元设置不正确
端口的工作模式与对端不一致
两端的DCN VLAN设置不一致
设备异常,如单板反复复位等
软件问题,如协议处理DCN报文异常
控制面故障
IS-IS
邻居关系故障
接口认证不匹配
接口IP、MTU
System ID冲突
Level不匹配
Area不匹配(仅level-1)
网络类型不一致
学不到LSDB/路由
cost开销类型错误
Domain认证(LSP报文认证)不匹配
分域原则
核心IS-IS域
接入汇聚IS-IS域
一个节点部署一个Loopback0地址,若该节点属于多个进程,L0地址绑定核心进程再引入其他进程
省干SPN网络规划一个独立的IGP域
IGP进程号基于全省规划,不同IGP进程使用不同的IGP进程号
Cost值规划原则
同一类型的链路cost值相同
流量优先在下层网络绕行
流量不绕行不相干的接入环、汇聚环
存在多对核心时,骨干汇聚间的SR-MPLS BE隧道通过cost优选某对核心
部署注意事项
同一链路属于多个IS-IS进程时,部署单端口多进程
不支持接入环跨骨干汇聚组网;
不支持接入环挂接在分属不同的IS-IS进程的两个汇聚环下
不承载5G业务的设备(不上下5G业务且无穿通5G业务)可不使能IS-IS
BGP-LS
邻居关系
正常
Established
异常
Connect / Active
TCP会话建立失败
本地源IP/接口
对端对等体IP
非直连接口IP建立邻居,本地和对端还需有路由
Idle
BGP协商失败
AS号
地址族
link-state-family unicast
认证
EBGP最大跳数
直连链路IP地址建立邻居,TTL默认为1
用loopback地址建立邻居,需修改TTL值
PCEP
PCC(设备)到PCE(控制器)之间的逻辑链路
PCC发起算路请求
PCE下发SR-TP隧道算路结果
会话状态
正常
UP
异常
Idle
数据面故障
SR/MPLS隧道故障
SR-TP隧道
常见故障原因
SR-TP配置不完整,或参数配置错误
PCEP或BGP-LS协议故障
单板故障
物理链路故障
SR-BE隧道
基于IS-IS协议实现,受IGP故障影响
业务故障
5G L3VPN
常见原因
配置错误、单板故障、链路故障、隧道故障
4G L2VPN / PWE3 / E-Line
PW控制字
业务接入口封装模式(Eth / Tagged)
故障定位常用方法
通用方法
告警分析
资源类告警
CPU_BUSY、MEM_OVER
单板故障
HARD_BAD、TEMP_OVER、COMMUN_FAIL、BUS_ERR
物理链路告警
ETH_LOS、ETH_AUTO_LINK_DOWN
MAC_FCS_EXC、R_LOS、LASER_SHUT、LSR_WILL_DIE
性能统计分析
全网分析,可预见设备隐患,不影响正常业务。
OAM分析
OAM机制可有效地检测和监控各个层面的内部运行状态
MPLS Tunnel OAM
CV/FFD连通性检测
Ping连通性检测
Tracert故障点定位
丢包、时延、抖动性能监控
PW OAM
CV/FFD连通性检测
VCCV连通性检测
Traceroute故障点定位
丢包、时延、抖动性能监控
以太业务OAM
BFD
连通性检测
TWAMP
丢包率、时延、抖动性能监测
非通用方法
配置数据分析法
仪表测试分析法
环回测试分析法
排除法
特定场景下能快速定位到故障点
常用操作
控制平面Ping/Tracert
带源(LSR-ID) ping测试
SR-TP Ping/Tracert
VRF Ping
快速诊断5G L3VPN业务中VRF之间的IP通信是否正常
基站业务丢包故障
可能原因
带宽不足或存在未知报文等原因导致流量拥塞,用户业务丢包
以太网端口协商参数配置不一致,导致错包、丢包
设备端口MTU配置值不一致,导致大报文被丢弃
单板故障、光模块无染或故障
对接端口光模块型号不匹配,发送信号波长不一致,导致丢包
CPU占用率,内存占用率过高,导致业务丢包或不通
时钟不正常
Tunnel限速
接口QoS配置
设备脱管
可能原因
网元掉电
光缆故障导致DCN通道中断
主、备网关网元故障
DCN通道质量差,如带宽不够、误码
网元IP/ID冲突
DCN域超规格
时钟故障
常见原因
光纤不对称补偿值变化,会引起时间不同步
定位流程
1. 上游时钟源是否存在时钟告警
2. 是否存在端口、单板硬件告警
3. 是否存在时钟配置成环、互锁
4. 是否存在第三方设备
0 条评论
下一页