从四种时序数据库选型中脱颖而出，TDengine在工控领域边缘侧的应用

从四种时序数据库选型中脱颖⽽出，TDengine在⼯控领域边缘侧的应⽤动动网

作者：冰茹

⼩T导读：和利时始创于1993年，业务集中在⼯业⾃动化、交通⾃动化和医疗⼤健康三⼤领域，结合⾃动化与信息化两⽅⾯的技术优势，提出了“智能控制、智慧管理、⾃主可控、安全可信”的战略指导⽅针。围绕集团三⼤业务，公司对⼯业互联⽹、⼤数据、5G、信息安全等新兴技术开展更深⼊的研究和应⽤⽰范，打造⾯向各领域应⽤的⼯业互联⽹平台，进⼀步促进智能制造解决⽅案的落地应⽤。

在物联⽹场景下，⾯对庞⼤的时序数据处理需求，Oracle、PostgreSQL等传统关系型数据库越来越吃⼒。基于此，⽬前国内外主流⼯业互联⽹平台⼏乎都已经采⽤时序数据库，来承接海量涌⼊的⼯业数据。

究其原因，可以从数据的三个核⼼需求来解释。我们都知道，企业在选择数据库、⽂件系统等产品时，最终⽬的都是为了以最佳性价⽐来满⾜数据的三个核⼼需求：数据写⼊、数据读取、数据存储。时序数据库完全是按照时序数据的三个需求特征进⾏设计和开发的，在数据处理上更加具有针对性：

在数据写⼊上，如果将时间看作⼀个主坐标轴，时序数据通常是按照时间顺序抵达，抵达的数据⼏乎总是作为新条⽬被记录，在数据处理操作上95%-99%都是写⼊操作；

在数据读取上，随机位置的单个测量读取、删除操作⼏乎没有，读取和删除都是批量的，从某时间点开始的⼀段时间内读取的数据可能⾮常巨⼤；

在数据存储上，时序数据结构简单，价值随时间推移迅速降低，通常都是通过压缩、移动、删除等⼿段来降低存储成本。

⽽关系型数据库主要应对的数据特点却⼤相径庭：

数据写⼊：⼤多数操作都是DML操作，插⼊、更新、删除等

数据读取：读取逻辑⼀般都⽐较复杂

数据存储：很少压缩，⼀般也不设置数据⽣命周期管理

因此，从数据本质的⾓度⽽⾔，时序数据库（不变性、唯⼀性以及可排序性）和关系型数据库的服务需求完全不同。这也是我们⼀开始就锁定时序数据库来满⾜⼯业互联⽹场景的核⼼原因。

我们对包括InfluxDB、OpenTSDB、HolliTSDB（和利时⾃研时序数据库）、TDengine在内的四款时

序数据库进⾏了选型调研及相关测试。测试数据的频率为1秒钟，数据集包含10000台设备，每台设备有10000条记录，每条数据采集记录包含3个标签字段、2个数据字段、1个时间戳字段。测试对⽐项包括占⽤磁盘空间、百万条数据遍历查询、聚合查询（COUNT、AVG、SUM、MAX、MIN）。测试结果如下所⽰：

占⽤磁盘空间

百万条数据遍历查询垃圾分类机

聚合查询COUNT

聚合查询AVG

聚合查询SUM

聚合查询MAX

聚合查询MIN

同等条件下，TDengine的压缩率最⾼，数据占⽤的存储空间最⼩；在原始数据查询上，OpenTSDB最

慢，TDengine与HolliTSDB在伯仲之间；在聚合查询操作上，TDengine最快，HolliTSDB的速度和InfluxDB相当，OpenTSDB最慢。同时，InfluxDB只能单机部署，集版本并未开源，且查询性能存在瓶颈，其QPS约为30-50。

从性能测试结果来看，我们选择TDengine的原因主要源于以下⼏点：

TDengine在查询性能维度上的表现⾮常优异，满⾜了我们的业务查询需求

集功能开源，⽅便横向扩展，更弹性

在开源热潮之下，⽀持如TDengine⼀般的国产开源数据库、操作系统、中间件等也是企业的必修课

最终我们决定接⼊TDengine，以享受更多元的本地化⽀持和响应。

⽬前TDengine作为边缘版时序数据库在搭建使⽤，具体的技术架构如下图所⽰：

基于TDengine进⾏建库建表思路如下：

CREATE STABLE IF NOT EXISTS ts_super

(time TIMESTAMP, s BIGINT, vl BIGINT,vf DOUBLE,vb BOOL,vs BINARY(16349))