基于时序数据库服务监控系统的设计与实现

基于时序数据库服务监控系统的设计与实现
冯占利,安进朝
(河北远东通信系统工程有限公司,
河北石家庄050200)
收稿日期:2020-12-23
0引言
在大型系统软件设计中服务监控系统有海量数据的快速写入和读取需求,要能够适应多个完全不同的项目同时对面向研发与运维的监控的需求,
且可以不需修改业务无关部分的代码,也不需修改数据库的结构。经调研,时间序列数据库可以建立高效且灵活的索引,
翻转机构实现更好的查询能力,并且可以随时延伸数据表的结构,
适合使用“按列存储”以时间为主要线索的非关系数据库来管理。其中比较知名的时序数据库InfluxDB 是由InfluxData 使用GO 语言开发,经过不断改进现已在开源时序数据库中排名第一[1-2],应用较为广泛,着力于高性能查询与存储时序型数据,被广泛应用于存储系统的监控数据、IoT 行业的实时数据等场景。
1时间序列数据库
在众多的NoSQL 数据库存储模型中,
时间序列数据库通过使用特殊的存储方式,使得时序数据可以高效存储和快速查询,是管理海量只读数据的一项重要技术。InfluxDB 是当今最流行的时序数据库之一,采用了特殊数据存储方式,有较高的以时间作为主要线索的非结构化数据的处理能力。与传统关系数据库相比,时序数据库的特点主要表现为以下几个方面:
①数据模型:同样支持数据库、数据表和记录的3级存储结构,但同一个表中的不同记录可异构,甚至索引也可异构。很多应用都会从这种非结构化数据模型中获益,这些数据库也非常适合于创建原型或是快速融入应用开发,因为这种灵活性使得新特性的开发变得非常容易。开发者希望使用非常灵活的数据库,能够轻松容纳新的数据列,
而不用去重构数据表的结构。
②查询效率:使用面向列的存储,同一列的数据毗邻能够实现数据的高效插入与追加、多重索引,能够实现数据高效的多条件查询,查询性能不因条件的增多而显著下降。
③功能专一:现有产品所提供的功能都围绕核心功能与优化性能,因而大多数NoSQL数据库都不支持视图、事务、存储过程与触发器。InfluxDB主要针对时间作为主要查询线索优化,并且多个列作为条件查询时性能优异。
④容灾:自身大量使用内存做索引的缓存,提供离线备份功能,方便备份与恢复,也节约空间,提供集部署能力。
⑤元数据:使用多个相对独立的列保存,每一列都可以有独立的索引。在查询时不用连续出现,支持同时对多个索引列的查询,支持丰富的筛选关键词。
⑥执行代码:InfluxDB使用编译的本地机器代码,性能有保证。单机部署即可实现很高的检索性能,若选择集部署更能够提供业界较为领先的能算比,节约运维成本。
2服务监控节点数据分析
对于需要大量采集数据的服务监控系统来说,时间序列数据库还有一些特性,是关系数据库无法简单实现的。这些特性中,最重要的就是无结构(Schema Less)。无结构无需提前创建表,数据表中的列是随着数据的插入和删除而发生变化的,即表的结构会自动去适应新插入数据。这一点在大量有关联的异构数据的收集方面有着先天的优势,对于服务监控的开发来说,项目初期开发人员并不知道采集的数据都要哪些列、哪些类型的数据,数据表的格式是随着项目的进行而不断丰富的。图1是通信系统核心网服务监控系统的追踪前端界面,可以看到追踪的过程中,为了便于分析需要展示一些异构的数据。
图1通信系统核心网服务监控系统追踪前端界面
乙烯基涂料
服务监控系统要能够适应多个完全不同的项目对于面向研发与运维的监控需求,而不用修改业务无关部分的代码,也不用修改数据库的结构。只要增加业务有关的数据解析组件、在前端增加过滤规则就能够迅速适应新项目。只有无结构的存储才能满足这样的需求,这是大数据与数据挖掘优先选用非关系数据库管理的一个主要原因。3分布式通信系统核心网服务监控系统设计
3.1系统需求分析
在众多大型系统软件中,例如分布式通信系统核心网架构都需要众多的异步工作的节点参与提供服务,各节点要生成大量在空间上离散的、时间上又是相关的数据,如状态变化、数据变化及调用流程日志等运行信息,传统离散日志难以追踪故障。这就需要预先研发专门的可用于监控软件系统的框架来支持研发与后续运维,这一服务监控系统要满足下面的需求[4],包括:
①增加透明度:对于分布式通信系统来说,各节点运行状态、节点间消息、网元对数据库的查询、终端的请求响应等信息都需要采集,这就会产生大量异构却又相关的数据,而这些数据都需要纳入监控的采集范围。
②定位关键点:分析监控记录是非常痛苦的,系统每小时可能会产生大量监控日志,发生事件的时候不能寄希望依靠人眼查看数据就能迅速出问题原因,需要高效率的检索来保证维护人员能够快速定位问题。
③自动化:数千项的数据不可能每一项都靠人工去看,必须要跟自动报警相关联,需要后台有算法不断自动检索。发现数值异常时,可以通过短信、邮件还有系统本身来发出报警信息。报告产生可以无人值守,还可以作为持续集成和持续测试快速判定结果的依据。
④可视化:通过信息采集与分析,记录关键行为的详细信息,形成便于观察的数据表,生成可视化的图表,让人直观上就能迅速判定系统是否有异常。
⑤支持研发过程中把监控嵌入基础框架:用于在调试、测试与运维阶段探测软件内部运行情况的技术集合。服务于研发与优化的过程,减少人为因素造成缺陷的可能性。一般来说项目进行编码时,并不是每个编码人员都会意识到需要在关键的地方嵌入一个监控点,所以要在基础框架本身的关键点预埋监控“探针”。
⑥异地分析:数据采集与分析存储分离,只需要在目标上采集原始数据,支持通过传输到异地再进行解析、储存与分析。
3.2服务监控系统技术栈设计
分布式通信系统核心网的服务监控系统中,相关的技术栈设计以微服务架构监控系统中的技术栈为基础,做出适应性的改进,以减少对网元的改动。
采集:探针负责采集原始数据,将原始数据通过一
次内存拷贝转交给传输代理,即完成自身任务;传输:透过传输代理,
使用可靠传输协议来传输,当数据到达服务监控系统中,再转交给负责数据解析的解析服务,运行期间保证传输质量,断线时还要能够使用文件做缓存,
led柔性霓虹灯
传输和缓存与业务无关,与被探测对象无耦合;解析:使用动态加载的插件解析数据,根据不同项目的需要动态组合出不同的数据解析进程,支持负载均衡,插件负责将解析出的记录插入数据对应的数据表;存储:使用时间序列数据库保存采集到的大量异构信息,提供高效且灵活的查询能力。
另外还应使用关系数据库保存重要的或者检索条件局限于索引字段的信息,分析手动或自动的分析采集到的监控信息。其中手工分析需要为研发运维人员提供丰富的信息,例如:状态数据、网元日志、注册上下文、呼叫上下文、信令消息、系统资源占用、数据库操作、代码覆盖统计及性能统计等。
图2是InfluxDB 在分布式通信系统核心网的服务监控系统中所处的位置。
图2服务监控系统整体设计框图
3.3服务监控系统效果分析
以分布式通信系统的呼叫为例,分析不仅仅要有呼叫的简单信息还要有可以支持研发人员观察的详尽细节,通过可视化的图表、详尽的数据和解释,从而提高故障追踪的效率[5]。图3和图4是一个实际的呼叫分析过程。铍青铜热处理
图3服务监控系统呼叫列表
图4服务监控系统呼叫时序图如图3所示,分析呼叫对于研发与运维人员来说,只要简单的查询即可开始分析,分析过程可以是直观的、图形化的,
分析之前无需再花费很多时间去过滤日志和抓包,通过时序数据库的检索能力即可迅速到所有的相关数据,快速呈现。这样的分析过程改变了原本需要多个工具参与的、多个步骤相互分离的、依赖研
发运维人员经验的分析过程。把分析过程统一到了同一个分析系统之中,直观且高效率,降低了对人员的熟练程度要求。
通过与InfluxDB 的结合,本服务监控系统提供了一种高效检索支持,研发与运维人员在面对数十亿条的服务监控数据时,就能够通过运用面向列存储的数据库减少IO 总量,减少负载,提高检索效率,大大节约了调试时间。再利用InfluxDB 提供的“类SQL ”语法查询能力,让统计分析变得非常简单,结合前端页面设计,能够迅速实现统计分析的功能。图5是一个简单的拓扑统计页面演示,有多个统计信息,得到结果所用的时间少于1s 。
图5服务监控系统拓扑统计页面
4结束语
面向研发的监控是软硬件研发过程质量控制的关键一环,能够提供对数据的丰富分析与追踪能力。
核心思想是通过提高关键事件的溯源效率,来为系统开发过程提供高效“脚手架”,使得研发、测试、运维人员均能从中获益。当前5G 系统核心网的架构发展出了更多层次,划分出了更多微服务[6],可以容纳
更多的节点分担负载,由于不同节点间完全的异步工作,并通过异步的消息传递来通信,对故障定位提出更高的要求,传统日志框架难于驾驭,对面向研发与运维的“服务监控系统”提出更高的要求。
智能化就是未来,服务监控系统除了提供面向编码、测试人员的功能外,还要能够提供自动化的数据分析算法。这样才能够让系统自动寻故障来源,自动化生成
客观报告
甚至
根据预先制定的策略,自动调节自身运行状态,实现智
能化运维。
本书紧密结合十九届四中全会精神,对坚持和完善中国特社会主义制度、推进国家治理体系和治理能力现代化进行系统阐释。本书内容丰富、阐述全面、指导性强,共12章,包括:新时代推进国家治理现代化的政治宣言和行动纲领,新时代推进国家治理现代化的意义、内涵和要求,中国悠久传统下的国家治理思想体系,社会主义国家治理的探索,西方国家治理的发展历程、现状与借鉴,正确把握全面深化改革的总目标和基本要求,以坚定的制度自信推动中国特社会主义制度更加成熟定型,国
家治理现代化的核心内容,国家治理体系的基础、演化和结构,提高国家治理能力的任务、重点和机制,创新社会治理体制,
全面推进国家治理体系和治理能力现代化。书后附有党的十
九届四中全会《决定》等文件。
《国家治理体系和治理能力现代化党员干部读本》
出版社:人民融媒出品红旗出版社定价:45.00元开本:16K
订书电话:************
广告
习近平同志曾经指出:“中国传统文化博大精深,学习和掌握其中的各种思想精华,对树立正确的世界观、人生观、价值观很有益处。学史可以看成败、鉴得失、知兴替;学诗可以情飞扬、志高昂、人灵秀;学伦理可以知廉耻、懂荣辱、辨是非。”作为文化传播者,我们有责任、有义务弘扬和传承中国优秀的传统文化,为此我们精心辑成了这套“中华国学典藏读本”系列,包括《老子》《论语》《孟子》《易经》《孙子兵法与三十六计》等著作。本系列图书在原文、注释、译文的基础上,设有经典解读,精选了诸多名家深入浅出的集注,有的篇章设置了案例分析,旨在全方位展示中华优秀典籍的思想魅力,有利于广大读者尤其是党员干部开阔胸襟、改进方法、增强智慧,提升思维层次和领导水平,提高为人民服务的本领和能力,从而更好地担负起执政使命,在是非曲直、尊卑荣辱面前,把握正确方向,增强开拓前进的勇气和力量。
《论语》《老子》《孟子》《易经》
《孙子兵法与三十六计》中国言实出版社定价:68.00元开本:16K
订书电话:************
广告
参考文献
[1]徐化岩,初彦龙.基于InfluxDB 的工业时序数据库引擎设计音乐枕头
[J].计算机应用与软件,2019,36(9):33-36.
[2]柴亚刚.基于时序数据库的分布式网络波动监控系统[J].中
国传媒科技,2018(3):36-37.
[3]程天天.基于Redis 的时间序列数据库的研究与实现[D].成
都:电子科技大学,2020.
[4]吕毅.服务监控方法及系统:北京,CN103209100A[P].2013.[5]刘金.大规模集状态时序数据采集、存储与分析[D].北京:北京邮电大学,2018.
[6]许碧洲,路遥,孙道禹.5G 核心网的组网架构和演进发展[J].
按摩文胸电子技术与软件工程,2018(20):12.

本文发布于:2024-09-24 18:25:14,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/243497.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:系统   数据   监控
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议