一种警情分析系统[发明专利]

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910304499.8
(22)申请日 2019.04.16
(71)申请人 中国电子科技集团公司电子科学研
究院
地址 100041 北京市石景山区双园路11号
(72)发明人 张博 杨云祥 唐先超 郭静 
(74)专利代理机构 工业和信息化部电子专利中
心 11010
代理人 张然
(51)Int.Cl.
G06F  17/27(2006.01)
G06F  16/35(2019.01)
G06F  16/332(2019.01)
G06F  16/215(2019.01)
G06F  16/27(2019.01)
G06F  16/25(2019.01)
(54)发明名称一种警情分析系统(57)摘要本发明公开了一种警情分析系统,包括:数据资源系统,用于对文本信息进行数据处理,将非结构化的文本信息转化为结构化的文本信息;对外服务系统,用于提供对外的服务组件接口,以供用户进行调用;数据应用系统,用于根据用户需求对结构化的文本信息进行横向关联和分析。本发明通过数据资源系统对海量的非结构化文本信息进行整合处理成结构化的文本信息,并通过对外服务系统和数据应用系统对结构化的文本信息进行关联分析和实际应用,在大数据的背景环境下,对大规模的警情相关文本数据进行了整合和分析,以满足警务用户对警情相关文本数据的应用需求,提高情报分析水平,进而提升
了公安机关情报信息服务能力。权利要求书1页  说明书6页  附图2页CN 110188341 A 2019.08.30
C N  110188341
A
1.一种警情分析系统,其特征在于,包括:
数据资源系统,用于对文本信息进行数据处理,将非结构化的文本信息转化为结构化的文本信息;
对外服务系统,用于提供对外的服务组件接口,以供用户进行调用;
数据应用系统,用于根据用户需求对所述结构化的文本信息进行横向关联和分析。
2.如权利要求1所述的警情分析系统,其特征在于,所述数据资源系统,还用于存储未经过数据处理的文本信息以及经过数据处理后的文本信息。
3.如权利要求1所述的警情分析系统,其特征在于,所述文本信息至少包括以下之一:电子笔录数据、接处警警情数据、警综案件数据、案事件数据、物证记录数据。
4.如权利要求1所述的警情分析系统,其特征在于,所述数据处理至少包括以下之一:中文分词、文本要素提取、文本分类、文本聚类。
5.如权利要求1所述的警情分析系统,其特征在于,所述服务组件接口包括:基础能力组件接口以及定向服务组件接口;其中,所述基础能力组件接口用于实现至少以下一种功能:相似性检索、自动分类、规则分类、政治常识校对、自动摘要;所述定向服务组件接口用于实现至少以下一种功能:处警推荐、信息订阅、信息推送。
6.如权利要求5所述的警情分析系统,其特征在于,所述定向服务组件接口根据在实现信息推送功能时,向不同警种推送具有不同文本要素的信息。
7.如权利要求1所述的警情分析系统,其特征在于,所述数据应用系统,还用于:对用户上传的文本数据进行文本分析挖掘;其中,所述文本分析挖掘至少包括以下之一:文本分词、关键词提取、文本摘要、文本信息抽取、实体抽取、关系抽取、关联关系展示、文本分类、文本聚类、文本相似性检索、政治常识校对、数据比对。
8.如权利要求1至6中任一项所述的警情分析系统,其特征在于,所述数据应用系统,还用于:利用图形分析方法表示所述结构化的文本信息之间的关系;其中,所述图形分析方法至少包括以下之一:网络分析、路径分析、时序分析、空间分析、集分析。
权 利 要 求 书1/1页CN 110188341 A
一种警情分析系统
技术领域
[0001]本发明涉及大数据分析挖掘领域,特别是涉及一种警情分析系统。
背景技术
[0002]目前,公安机关已汇集包括案件电子笔录数据、接处警警情数据、警综案件数据、案事件数据等十多种非结构化、半结构化的文本数据,同时,这类文本数据还在每年源源不断产生。文本数据的快速积累使得公安信息化部门在处理和使用这些信息时面临了前所未有的挑战:一方面,社会信息网络和公安信息系统每天都在不断产生大量文本数据,这些文本数据资源中蕴含着许多非常有价值的情报信息,比如案件笔录数据中隐含的涉案人员姓名、车牌号码、物品、QQ号码、手机号码以及作案手段、地址等要素是分析研判和侦查办案的重要情报信息要素,是情报导侦的重要信息来源;另一方面,虽然文本数据资源中蕴含着非常有价值的信息,但是获取文本信息的技术手段落后,从大量数据资源中获取所需的情报信息十分困难,对文本数据资源进行大规模的整理、分析和应用更是当前急需解决的问题。
发明内容
[0003]本发明提供一种警情分析系统,用以解决现有技术无法获取大规模文本数据资源中的信息,以及无法对文本数据资源进行整理、分析和应用的问题。
[0004]为解决上述技术问题,一方面,本发明提供一种警情分析系统,其特征在于,包括:数据资源系统,用于对文本信息进行数据处理,将非结构化的文本信息转化为结构化的文本信息;对外服务系统,用于提供对外的服务组件接口,以供用户进行调用;数据应用系统,用于根据用户需求对所述结构化的文本信息进行横向关联和分析。
[0005]进一步,所述数据资源系统,还用于存储未经过数据处理的文本信息以及经过数据处理后的文本信息。
[0006]进一步,所述文本信息至少包括以下之一:电子笔录数据、接处警警情数据、警综案件数据、案事件数据、物证记录数据。
[0007]进一步,所述数据处理至少包括以下之一:中文分词、文本要素提取、文本分类、文本聚类。
[0008]进一步,所述服务组件接口包括:基础能力组件接口以及定向服务组件接口;其中,所述基础能力组件接口用于实现至少以下一种功能:相似性检索、自动分类、规则分类、政治常识校对、自动摘要;所述定向服务组件接口用于实现至少以下一种功能:处警推荐、信息订阅、信息推送。
[0009]进一步,所述定向服务组件接口根据在实现信息推送功能时,向不同警种推送具有不同文本要素的信息。
[0010]进一步,所述数据应用系统,还用于:对用户上传的文本数据进行文本分析挖掘;其中,所述文本分析挖掘至少包括以下之一:文本分词、关键词提取、文本摘要、文本信息抽取、实体抽取、关系抽取、关联关系展示、文本分类、文本聚类、文本相似性检索、政治常识校
对、数据比对。
[0011]进一步,所述数据应用系统,还用于:利用图形分析方法表示所述结构化的文本信息之间的关系;其中,所述图形分析方法至少包括以下之一:网络分析、路径分析、时序分析、空间分析、集分析。
[0012]本发明的警情分析系统通过数据资源系统对海量的非结构化文本信息进行整合处理成结构化的文本信息,并通过对外服务系统和数据应用系统对结构化的文本信息进行关联分析和实际应用,在大数据的背景环境下,对大规模的警情相关文本数据进行了整合和分析,以满足警务用户对警情相关文本数据的应用需求,提高情报分析水平,进而提升了公安机关情报信息服务能力。
附图说明
[0013]图1是本发明第一实施例中警情分析系统的结构示意图;
[0014]图2是本发明第一实施例中对外服务系统的结构示意图;
[0015]图3是本发明第二实施例中警情分析系统的功能架构图。
具体实施方式
[0016]为了解决现有技术无法获取大规模文本数据资源中的信息,以及无法对文本数据资源进行整理、分析和应用的问题,本发明提供了一种警情分析系统,以下结合附图以及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不限定本发明。
[0017]本发明的第一实施例提供了一种警情分析系统,其结构示意图如图1所示,主要包括:数据资源系统10、对外服务系统20以及数据应用系统30,三者之间互相耦合,每一个系统均为其他两个系统提供数据或服务的支撑。具体地,数据资源系统10,用于对文本信息进行数据处理,将非结构化的文本信息转化为结构化的文本信息;对外服务系统20,用于提供对外的服务组件接口,以供用户进行调用;数据应用系统30,用于根据用户需求对结构化的文本信息进行横向关联和分析。
[0018]在本实施例中,文本信息至少包括以下一种或几种:电子笔录数据、接处警警情数据、警综案件数据、案事件数据、物证记录数据等等,均为警种不同的警员在处理案件的过程中产生并记录的与案件相关的内容。数据资源系统10中对上述未经过数据处理的文本信息进行统一的存储,并在进行数据处理后,将处理后的文本信息也一并进行存储,还可以存储未经过数据处理的文本信息与其对应的处理过的文本信息之间的关联关系等等。进一步地,数据资源系统10进行的数据处理,主要包括以下
一种或几种:中文分词、文本要素提取、文本分类、文本聚类等,皆为借助自然语言处理和信息抽取技术即可实现的数据处理服务,其目的都是将非结构化的文本信息转化为结构化的文本信息,在易于存储的基础上,明确文本要素与文本要素之间、文本要素与文本信息之间、文本信息与文本信息之间的关联关系,为后续的大数据智能应用于分析等操作提供数据支撑。
[0019]对外服务系统20以数据资源系统10作为数据支持,面向用户提供不同的服务组件接口供不同警种的用户调用以提供通用的基础服务以及个性化的定向服务,主要基于WEBSERVICE、容器技术等进行实现。具体地,对外服务系统20所提供的服务组件接口主要包
括基础能力组件接口201以及定向服务组件接口202,如图2所示,基础能力组件接口201主要用于实现以下一种或几种功能:相似性检索、自动分类、规则分类、政治常识校对、自动摘要等功能,即所有警种的用户均可以调用并实现对应功能;定向服务组件接口202主要用于实现以下一种或几种功能:处警推荐、信息订阅、信息推送等功能,此时针对不同警种的用户可能接收到或查看到具有不同文本要素的信息,如文本要素中包括“丢失”等词语时,小区派出所的民警可以接收到对应的推送消息,但文本要素中包括“抢劫”等词语时,收到对应推送消息的可能就是刑警,其具体的推送方式可以根据不同警种用户的主动订阅情况,或警种的区分情况进行调整,具体以实际使用和设置情况为准。
[0020]数据应用系统30主要为用户根据自身的需求,对已经存在于数据资源系统10中的结构化的文本
信息进行进一步的分析和横向关联的过程,如基于提取的文本要素进行横向关联,实现通过姓名/身份证号关联笔录、笔录关联案件、案件关联人员、人员关联车牌(QQ/银行账户)等互相关联查询和分析等等,应当了解的是,上述关联的过程只是在实际使用时可能会存在的几种优选关联和分析方式,本实施例实际保护的范围应当不仅限于上述几种关联和分析方式。
[0021]进一步地,数据应用系统30还可以对用户上传的文本数据进行文本分析挖掘,主要包括文本分词、关键词提取、文本摘要、文本信息抽取、实体抽取、关系抽取、关联关系展示、文本分类、文本聚类、文本相似性检索、政治常识校对、数据比对等文本分析挖掘方式中的一种或几种,具体根据用户的实际需求进行确定。另外,数据应用系统30还可以对结构化的文本信息之间的关系通过图形分析的方法进行表示,其中,图形分析方法至少包括以下之一:网络分析、路径分析、时序分析、空间分析、集分析等,并最终使用可视化的图形对结构化的文本信息之间的关系进行表示。
[0022]本实施例所提供的警情分析系统通过数据资源系统对海量的非结构化文本信息进行整合处理成结构化的文本信息,并通过对外服务系统和数据应用系统对结构化的文本信息进行关联分析和实际应用,在大数据的背景环境下,对大规模的警情相关文本数据进行了整合和分析,以满足警务用户对警情相关文本数据的应用需求,提高情报分析水平,进而提升了公安机关情报信息服务能力。
[0023]本发明的第二实施例将在第一实施例的基础上结合图3对警情处理系统进行更详细的功能区分和描述。
[0024]文本大数据资源中心,即本发明第一实施例中的数据资源系统,主要用于对文本类资源(即本发明第一实施例中的文本信息)进行要素提取、关系提取以及分类、聚类以及人工词库维护等处理操作,同时将文本要素资源进行深入挖掘、关联融合和深度分析,为公安文本大数据智能分析与应用提供数据支撑。可以按照功能将其细化为文本资源库、文本解析、文本整合、文本目录、资源监测、词库维护。
[0025]文本大数据资源中心的文本资源库,主要借助自然语言处理和信息抽取技术实施文本数据处理服务,通过中文分词、文本要素提取、文本分类、文本聚类等服务内容,对可利用的、有价值的案件电子笔录数据、接处警警情数据、警综案件数据、案事件数据以及物证记录数据等文本类资源进行要素提取、关系提取以及分类、聚类,构建统一文本要素库并纳入到区域信息资源服务体系中进行统一管理。文本资源库中又包括以下子资源库:文本数据资源池、文本数据全文索引库、文本数据基础要素库、文本数据特征要素库、文本数据应

本文发布于:2024-09-21 22:07:18,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/411277.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:文本   数据   分析   信息
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议