基于数学建模的数据流异常检测方法

同类相食基于数学建模的数据流异常检测方法
作者:李焕云 王胜杰
来源:《电脑知识与技术》2021年第33期
永城市第一小学
        摘要:针对常规异常检测方法聚合数据流数据时误判率较大的问题,设计一种基于数据建模的数据流异常检测方法。计算各个数据个体之间的欧几里度量参数,规范化处理异
常数据流数据,设定数据流中的判断节点,利用数据建模技术判断数据状态,规范化处理异常數据流数据,采用临近采样方法在设定的数据集节点处构建一个检测窗口,设定检测周期后,最终实现对异常数据流的检测。准备实验数据集,设定各个数据集间的间隔周期,模拟数据流结构,准备两种常规检测方法以及设计检测方法进行实验,结果表明:设计的异常检测方法误判率数值最小。
        关键词:数学建模;数据流;异常检测;误判率
        中图分类号:TP393 文献标识码:A
sr2m
        文章编号:1009-3044(2021)33-0144-02
        开放科学(资源服务)标识码(OSID):
        数据建模是将各类数据处理为一个抽象组织,在确定管辖范围后,采用固定的组织形式将数据转化为数据处理工具的过程。使用数学建模内置的二维或是三维数字关系,搭建多个逻辑关系,采用该逻辑关系表述数据结构间的关系。数据流是一组有序的数据序列,内置数据起点以及数据终点字节,在输入流和输出流的控制下,形成一个特定的数据处理
过程[1-3]。为此,在数据建模技术的支持下,构建一种数据流异常检测方法是很有必要的。国外在研究数据流异常检测起步较早,在数据库技术的支持下,率先建立了一种访问系统,并设计得到了入侵检测方法。国内在研究异常检测方法起步较晚,结合人工智能技术,研究得到了多种检测方法。
        1 基于数学建模的数据流异常检测方法
c大调的城        1.1 规范化处理异常数据流数据
        数据流内的数据由多个属性的数据构成,对应的数据有着不同的数据格式以及设计单位,所以在检测异常数据流时,应规范化处理数据流中的数据[4]。在规范化处理前,计算各个数据个体之间的欧几里度量参数,并根据该度量参数的数值,计算各个数据个体间的相似度,采用Z-score规范化处理方式处理数据流中的各项数据后,线性变换数据流中的原始数据,保持数据流中原始数据间的大小数值关系,假设属性数值的标准差后,标定属性一个有意义的最大值,标定为不同的维度参数后,形成多个维度数据空间。为了保证数据流的正常处理流程,消除数据信息流中的干扰,利用统计概率处理方法计算数据流中的标准信息熵,可表示为:
        [h(x)=-i=1np(xi)n] (1)
郝迪
        其中,[p(xi)]表示标准最大值对应的函数,[n]表示数据空间的维度数值。当计算得到信息熵的数值大于零时,则表示数据流处于一个稳定状态。在该种稳定状态下,将数据流空间内的节点划分为不同处理顺序的数据节点,整合为不同集合的数据组后,应用数据建模技术,判断各个数据组中数据流的状态。
        1.2 利用数学建模判断数据状态
        使用上述得到的数据集,在划分数据集的数据分界处,设定不同的数据节点,以该节点作为状态判断点。使用该节点周围的两个数据组作为处理对象,采用距离计算方式,使用各个数据集中通用的属性数据,计算通用数据间的距离,采用数据建模方法描述数据为一个状态数据集,随机选定一个数据点,计算该点与设定节点间的距离,当该距离数值在预先设定的参数数值之间,则表示该数值为正常状态,当该数值在设定的参数数值之外,则表示对应处理的数据集为异常状态[5]。
        为了增强判断数据状态时的精准性,在预先设定参数时,应在划分的数据集中定义一
个局部异常因子,使用数据密度参数作为该局部异常因子的约束值,采用数学描述方法将给定的数据点处理为一个衡量数值,假设该衡量数值明显不同于局部平均数值,则认定该数据集对应的数据流存在异常,异常数据状态判断后,针对该部分异常数据,构建检测过程。
        1.3 实现对异常数据流的检测
        基于上述处理过程,采用临近采样方法在设定的数据集节点处不断采集数据,并构建一个滑动窗口,在采集的数据流处,建立一个数据密度估算数值关系,可表示为:
        [f(x)=1Sct=1kxt] (2)
        其中,[Sc]表示采样参数,[xt]表示数据密度函数,[k]表示滑动周期。在上述数值关系内,确定一个簇首数值,在密度数值返回各数据集中处理时,设定一个返回周期,按照不同的时间尺度,不断替换密度数值中的正常数据流中的数据。

本文发布于:2024-09-21 12:34:48,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/33106.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   数据流   数值   方法   检测   处理
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议