石家庄岳村基于测试数据脱敏技术框架的分析作者:黄萍来源:《中国科技纵横》2019年第04期 摘 要:在对测试数据脱敏技术框架分类展开分析基础上,本文结合电力测试数据脱敏需求提出了相应的脱敏技术框架建构思路和方法,并对框架部署和数据脱敏流程进行了探讨,希望能够为电力行业数据脱敏提供参考。
关键词:测试数据;脱敏技术;元数据管理
唐山穆斯林 中图分类号:TP309;F832.33 文献标识码:A 文章编号:1671-2064(2019)04-0056-02
cimatrone8.5
0 引言
在信息时代,企业数据资源成为了推动业务发展创新的重要动力。而电力企业拥有大量涉及核心商业机密和客户隐私的敏感数据信息,还要加强数据保护管理,以免因数据泄露承担过大损失。因此在电力测试系统中,需要完成测试数据脱敏技术框架的构建,实现数据脱
敏处理,保证电力数据得到安全管理。2013苏迪曼杯
1 测试数据脱敏技术框架分类
刚果红 所谓的数据脱敏,又被称之为数据漂白、数据变形或去隐私化,需要采用既定脱敏方法实现数据处理,在符合规则前提下完成数据改造,保证数据能够在开发、测试等环节中得到安全使用,同时保证数据集的真实性[1]。针对测试技术进行脱敏处理,需要将敏感性原始数据转换为不敏感的脱敏数据。而脱敏技术框架对具体脱敏处理底层技术进行了承载,将决定数据脱敏效果。在脱敏技术框架下,底层技术将被实例化应用,使框架抽象设计得到最大限度利用。现阶段,针对测试数据,主要应用的脱敏技术框架有两种,一种是基于数据文件的脱敏框架ETL,另一种则是基于数据库表的脱敏框架。其中,ETL由抽取(Extract)、变形(Transform)、装载(Load)三个环节构成,具有较高通用性,在IBM OPTIM等主流商用工具中得到了应用,能够从源数据表中完成数据抽取,得到特定格式原始数据文件。无论是否进行部分量数据抽取,都能使数据间关联关系的完整性得到保证。对数据文件进行遍历,利用外挂脱敏出口函数实现数据变形处理,可以得到特定格式的脱敏数据文件,在目标数据库中实现装载[2]。采用基于数据库表的脱敏框架,可以省略
从数据库表抽取数据的环节,能够直接进行源数据变形。因此在该框架下,数据库表为处理对象,通过逐条读取数据记录,按照不同变形规则进行处理,然后在源数据库标中对记录进行更新,可以得到脱敏数据。在数据测试时,可以根据需求从源数据库表中到处脱敏数据文件,在对应目标测试环境中装载。