IP技术 -- 6 Telemetry

随着云计算的发展,大数据的重要性日益凸显,对于网络来说,如果要基于大数据分析建设一个智能的业务自适应网络,那么实时、高速、精确的获取网络运行数据,就成为了至为重要的一环

Telemetry是一项从物理设备或虚拟设备上远程高速采集数据的网络监控技术,相比较传统的网络监控技术,例如SNMP,CLI等,Telemetry通过推(Push)模式主动向采集器上推送数据信息,提供更实时,更高速,更精确的网络监控功能

Telemetry模型:

作为一个网络监控技术,Telemetry是由网络设备和网管系统两大部分组成的,对于网络设备,Telemetry就相当于原始数据、数据模型、编码类型和传输协议的组合;对于网管系统,telemetry就相当于收集系统、存储系统和应用分析系统的组合。

在网络设备侧,Telemetry按照Yang模型组织数据,利用GPB(Google Protocol Buffer)格式编码,并通过GRPC(Google Procedure Call Protocol)协议传输数据,使得数据的获取更高效,智能对接更便捷;而在网管系统测,Telemetry可以完成数据的收集、存储和分析功能,利用分析结果可以为网络配置调整提供依据

与传统网络监控技术对比:

1. 传统网络监控方式例如SNMP/CLI等,使用"网管查询-设备响应"的拉模式(Pull Mode)采集数据,一次查询对应一次响应,设备需要处理大量重复的查询报文。

Telemetry使用“网管定制-设备实时推送”的推模式采集数据,一次定制就可以得到多次响应,降低了设备处理查询报文的压力

2. 传统网络监控通过拉模式获取数据,如果网络发送卡顿,或者网络获取不及时,就容易造成数据失真

Telemetry周期性的向网管系统推送数据,避免了网络延时造成的数据不准确

3. 传统的网络监控方式如果要采集n台设备的数据,就需要执行n次查询操作,如果同时采集m种数据,则需要n*m次操作

采用Telemetry技术,所有的设备只需提前配置订阅,各种数据实时上报、中间过程不需要人工操作

小结:

Telemetry的工作模式是推模式,可以主动推送数据,精度是亚秒级,而且比较关键的一点是,Telemetry数据采用标准结构和标准编码,方便对接第三方设备,有助于网络监控效率的提升和监控质量提升

SNMP Trap和SYSLOG虽然也是推模式的,但是其推送的数据范围有限,对于类似接口流量等的监控数据不能实时的采集上送。

移动承载网案例:Telemetry在流量调优场景应用

智能运维系统包括采集器、分析器和控制器等,当流量路径需要调优时,利用Telemetry技术收集设备数据,发给分析器进行综合分析决策,分析器再将决策结果发送给控制器,然后由控制器调整设备的控制,进而调整流量转发路径,详细部署过程如下:

1. 配置Telemetry功能

2. 各设备主动与智能运维系统建立GRPC通道,在设备上配置订阅

3. 各设备通过GRPC通道将订阅数据上报给采集器

4. 各采集器接收、存储、加工处理各设备上报的数据

5. 分析器基于大数据分析系统进行分析

6. 控制器下发调优指令对网络进行调优

整个过程迅速便捷,用户对于流量路径的变化真正的无感知,大幅提升了用户体验

发布了165 篇原创文章 · 获赞 46 · 访问量 8万+

猜你喜欢

转载自blog.csdn.net/f2157120/article/details/104205861