您现在的位置:首页 > 信息与通信 >

彩信(MMS)端到端优化方案_图文


彩信端到端优化方案 彩信端到端优化方案
目 1 2
2.1 2.1.1 2.1.2 2.1.3 2.1.4

录 2 2
2 2 4 5 6 6 8 9 10 11 12 Unrecognised

概述 端到端分析的主要分析方向
业务性能分析 业务概述 彩信失败原因分类 分析方法 实际分析案例 举例

彩信中心回复状态异常――130 Service Denined 某些终端无法识别特定的 MMS_TID ― 132 2.2 2.2.1 2.2.2 2.3 用户业务感受 彩信端到端时长分析方法 用户投诉问题的处理 彩信业务流量分析

1

1

概述
随着彩信业务的迅猛增长,由此产生的一些问题也日益值得我们关注。对于致力打

造精品网的今天,彩信的分析和优化是一个必需的课题。 同时,彩信的分析也是一个难点。因为它不仅涉及的网元多,而且涵盖的信令协议 多,包括IP、UDP、TCP、HTTP、WTP、WSP、MMSE等。从核心网到无线网,以往 对彩信的分析往往集中于对特定问题的分析。 这种分析方法在越来越重视端到端业务运行 以及客户感受的今天已不能完全满足客户的需要; 我们需要利用以往的技术积累, 结合多 种技术手段,从一个完整的业务流程的角度对彩信进行分析,这样虽然较为困难,但却是 彩信分析和优化的根本方法。

2

端到端分析的主要分析方向
作为一个完整的业务流程,我们需要对以往的分析方法进行整合。关注彩信业务的

各个方面,主要包括业务性能、用户使用业务感受、业务流量分析等。

2.1

业务性能分析 业务性能分析
业务性能主要指业务运营的效率,如MMS-MT/MO成功率,分析网络和用户原因造

成的各种业务失败等等。

2.1.1 业务概述
现网中彩信业务有基于 WAP1.0 和 WAP2.0 两种形式, 两者实现大致相同。 WAP1.0 以 协议栈为例,彩信业务流程如下: 1, MO 过程

2

Step 1

Step 2

Step 3

Step 4

2, MT 过程

3

Step 1

Step 2

Step 3

Step 4

说明: 步骤1,步骤4 分别是 RADIUS start 和stop过程,包含在PDP激活和去激活的过程 中。 步骤2,WSP层的建立连接过程,对于建立在WAP2.0协议栈上的彩信业务,对应的 是TCP三次握手的过程。 步骤3,MMS层数据包的发送、接收;对于接收流程来说,还包括彩信接收后的回 执。

2.1.2 彩信失败原因分类 彩信失败原因分类 失败原因分
从图示的彩信规范流程来看,彩信可能发生的呼损环节很多,主要集中在终端与彩 信中心的数据包交互过程阶段。
4

由于“网络原因”导致的彩信业务失败 “网络原因”导致的彩 业务失败 ? ? ? ? ? ? 无线原因导致传输中断; GPRS 承载网 SGSN,GGSN 在数据包传递中漏包; 查询 E-DNS 超时无响应; WAP 网关超时无响应; 彩信中心超时无响应; 短信中心下发 PUSH 消息失败。

由于“终端原因”导致的彩信业务失败 “终端原因”导致的彩 业务失败 原因 ? ? ? ? ? SDU 存储容量太小,无法接收数据; 终端协议栈出错; 软件 bug,比如某些类型的终端对特定的 MMS ID 不兼容; 终端异常导致底层链接(WSP 、TCP)中断; 非彩信终端接收彩信。

由于“用户原因”导致的彩信业务失败 “用户原因”导致的彩 业务失败 原因 发生呼损的主要表现为用户原因,例如“用设置错误,向联通手机发彩信”等内存 满”;终端原因,如“SDU存储容量太小,软件bug”等;和网络原因,可能由无线网络产生, 也有可能由核心网侧产生。 “用户原因导致彩信业务失败 用户原因导致彩信业务失败”则包括: 用户原因导致彩信业务失败 ? ? ? ? ? 用户设置错误的彩信中心地址; 向联通手机、固定电话发送彩信; 发送过大的彩信; 过期接收彩信; 用户主动断开链接。

2.1.3 分析方法
作为端到端的业务性能分析,我们不仅把注意力集中于彩信中心,还需要集中于业 务链上所有的节点,包含无线、核心网、WAP网关、短信中心等等。因此需要无线、核心 网、短信中心、客服等方面的力量支持。 面对 MMSC 侧,我们主要对 MM1,MM4 口以及和 SMSC 的接口进行跟踪 MM1 接口,跟踪终端和彩信中心间的交互过程;
5

MM4 接口, 跟踪本地和异地 MMSC 间的彩信转发过程, MMSC 与 SMSC 接口,PUSH 消息的下发成功率。

对在业务链上其它节点: 对在业务链上其它节点: 通过 Gn,Gi 口的信令联合分析来跟踪 WAP 网关、核心网在业务承载方面的 表现,以及在这一部分所造成呼损; 无线侧, 通过专用的测试工具和拨打测试等方法对具体的端到端 KPI 做测试, 考察无线环境对业务的影响。 在客服等方面的配合下,进行具体问题定位和优化。 探索一些新的技术尝试,如业务流程方式的变化给指标带来的影响。

2.1.4 实际分析案例 举例 实际分析案例 分析 彩信中心回复状态异常―― 彩信中心回复状态异常――130 Service Denined ――
在配合 GPRS 第三方测试中发现彩信发送失败的现象,手机收到的 m-send-conf 消 息中的回复状态显示为 Service Denined。R 接口的消息流程如下:

6

R 接口 MMS 消息流程 为确定网络下发 Service denied 消息的源头,我们进一步分析 Gi 口的信令流程发 现彩信中心 MMSC 发送给 WAP 网关的(HTTP)m-send-conf 消息,其回复状态就是 Service Denied,这说明,彩信发送失败是由于彩信中心拒绝了该彩信业务。根据我们以往的项目 经验, 彩信中心发送 Serviced Denied 原因是由于发送彩信的被叫号码错误——被叫为联 通号段、固话或者其它非法号码。但在这个具体个案中被叫号码是正确的,并且由于问题 是出现在 CDS 测试过程中, 排除了终端异常的原因, 我们判断造成业务失败的原因是彩信 中心异常。 为了进一步探索问题的原因,我们记录了某一小时内出现回复状态是 Service Denied 的彩信发送失败流程,发现:1) 时段中有 64.15 % 比例被拒绝的 Service Denied, 其被叫号码是正常的。 这些出现异常的 Service Denied 都来自于华为某彩信中心侧 2) (ip 218.205.233.97) 。因此我们分析后将问题定位为该彩信中心的运行异常。

7

Message MMS m-send-req Serviced Denied Message Serviced Denied Service Denied (被叫号码正确) Service Denied (被叫号码错误)

11/1/2006(10:32~11:32) ) Counter Rate 9621 100% 475 4.94% Counter Rate 475 100% 115 24.21% 360 75.79%

11/2/2006(22:08~23:08) Counter Rate 9521 100% 1523 16.00% Counter Rate 1523 100% 977 64.15% 546 35.85%

Denied 彩信发送发送拒绝 拒绝和数据统计 观测时段内状态值 Service Denied 的彩信发送发送拒绝和数据统计

某些终端无法识别特定的 MMS_TID ― 132 Unrecognised
在彩信的 MT 过程中,彩信中心应该先通过短信中心向终端用户 Push 接收彩信的消 息 , 其 中 含 有 提 供 彩 信 的 MMS-ID 和 MMS-Transaction-ID 字 段 。 但 对 于 MMS-Transaction-ID 字段的编码规范并没有特别的规定。于是我们实际中通过信令分析 发现有某些类型的终端不支持 MMS-Transaction-ID 为 “0” 或”dN6SS6VcNPSbA”的编码,
8

造成对彩信无法提取的现象,影响了业务的发展。比如下面的一个实例:

终端之后回复为 132

Unrecognised 。

移动终端无法识别值为 0 的 MMS-TID!

进一步地,我们将这些有异常的终端型号进行了排查、甄别,发现这些问题终端占市场上 占的份额 5%左右。确认后我们将名单提交给客户,建议督促终端厂家更新软件版本或着 在彩信中心屏蔽“0” ,”dN6SS6VcNPSbA”等容易引起问题的 ID 号。

问题终端型号集中在 MAUI, Agent,LENOVO- xxx/WAP2.0 /WAP2.0, 问题终端型号集中在 WAPPER MAUI,MMS User Agent,LENOVO-Vxxx/WAP2.0,CECT T868 等

2.2

用户业务感受
在端到端分析中,我们除了关注网络业务成功率之外,还需要关注用户在使用该业务
9

过程中的实际感受;对彩信业务,我们主要关注的方向如下: 彩信端到端时长分析; 彩信业务失败以及在业务不成功情况下的重发机制分析; 客户无法发送、收到彩信、重复收到同一彩信等具体的个案问题;

2.2.1 彩信端到端时长分析方法 信端到端时长分析方法
端到端时长分析,仍以在多接口的信令分析为依据;详尽分析 MMS-MO/MT 过程中 每一环节信令交互过程间的时延。比如对 MO 主要过程如下:
MS GGSN WAP GW MMSC E-DNS

1. 2.

3. 4.

5. 6. 7.

1) PDP 上下文激活 2) MS 和 WAP GW 间建立连接 3) MS 数据上传 4) WAP GW 根据 MSISDN 查找终端归属地的 MMSC 5) WAP GW 和 MMSC 建立连接
10

6) WAP GW 向 MMSC 发送数据 7) WAP GW 向终端发送确认,彩信发送完毕。 根据我们的经验,彩信时延主要包含在以下几个阶段: (按造成时延的大小排列) 终端向网关发送数据 网关向 E-DNS 查询用户信息 网元间(终端和网关,网关和彩信中心)建立连接,以及建立 PDP 激活等为实际 彩信数据包发送做准备的阶段 网关向彩信中心发送数据 我们需要分阶段得出每段延时, 并对比消息流程考察数据包在网络中每个网元节点上 (无线、核心网,WAP 网关)的时间损耗。同时我们还要关注到:彩信业务的时延在很 大程度上是依赖于彩信本身的长度大小的, 因此我们在考察时延的同时还要考察彩信的长 度。
彩信发送时延分布 4000 3500 3000 2500 2000 1500 1000 500 0 120.00% 100.00% 百分比 80.00% 60.00% 40.00% 20.00% 0.00% Counter CDF

次数

单位 (s)

60 12 0 18 0

5 10 30

0

1

2

Average Send-Conf-Delay

22.865 (s)

2.2.2 用户投诉问题的处理
针对用户投诉的无法收到彩信、重复收到同一彩信问题。我们可以采用拨测结合信 令分析的方式加以解决, 无法收到彩信可以参考前面的彩信性能分析了解失败原因; 重复 彩信通常可能由以下原因造成: 无线问题导致 WAP 网关未正确收到应答; WAP 网关未正确转发应答到 MMSC;
11

某些终端异常——在接收彩信数据完毕后,不能正确发送回执。

2.3

彩信业务流量分析
随着彩信业务的迅猛发展,已经在众多数据增值业务中起到越来越重要的地位。根

据长期监测的经验,尤其在热点时段和地区(节假日,重大活动日) ;彩信的业务量的突 增往往对系统运行的稳定性带来相当大的影响。因此对彩信流量,时间/位置分布进行分 析,对重大节日、活动、突发事件所带来的业务量波动进行提前预测并采取措施是十分必 要的。 对彩信业务流量分析主要工作方向和思路有以下方面: 彩信业务量时间/位置分布; 通过统计数据对彩信业务流量在全天时段内的波动以及从本地网关分发各 地彩信中心的分布进行统计,归纳现网话务模型; 节假日 彩信/寻呼量预测; 通过国庆,圣诞,元旦网络监测,我们发现在晚忙时高峰时段往往会突增 大量的群发和重复发送的彩信。业务无响应比例过高,重复尝试的比例过高,会 导致很快达到系统设备的容量瓶颈, 系统负荷的增加同时导致业务成功率不断下 降。对于该问题,我们已经先后在 WAP 网关上进行了话务统计和信令方面的分 析。针对设备负荷我们亦进行了讨论。 以往我们都会对即将到来的话务高峰进行预测,并对需要扩容的硬件制定 方案;考虑到运营成本与可行性,我们不可能单纯依靠扩容来解决问题。我们希 望在现有条件下利用一定的技术手段来预防问题的发生, 或尽可能减少对网络的 影响。 省内/省外业务比例分布;依据信令,我们可以归纳出省内外各地区出、入本 地网的业务量,为以后的网络规划提供依据。 长、短彩信比例分布;通过信令分析的手段,我们能精确地统计出用户所发 送彩信的长度分布,掌握用户行为,帮助我们根据话务模型提前做好相适应 的设备参数设置。

12



热文推荐
友情链接: 简历 面试求职范文 职业规划 自我管理 社交礼仪 76242百科