一种基于数据采集与关键字挖掘的自动日志生成系统及方法[发明专利]

(10)申请公布号 (43)申请公布日 2013.09.18C N  103309794 A (21)申请号 201310132246.X
(22)申请日 2013.04.16
G06F 11/34(2006.01)
(71)申请人北京航空航天大学
地址100191 北京市海淀区学院路37号
(72)发明人陈希  任远  张雨阳  侯祥泰
(74)专利代理机构北京科迪生专利代理有限责
任公司 11251
代理人成金玉
贾玉忠
(54)发明名称
一种基于数据采集与关键字挖掘的自动日志
生成系统及方法
(57)摘要
一种基于数据采集与关键字挖掘的自动日志
生成系统及方法,包括:数据采集部分、数据分析
部分、数据展示部分;所述数据采集部分包括键
监听模块、剪贴板监听模块、鼠标监听模块、进
程监听模块和数据存储模块;所述数据分析部分
包括进程数据分析模块、鼠标键盘分析模块;数
据展示部分包括数据即时展示模块和定时工作日
志推送模块。本发明具有良好的用户体验,直观地
展现系统数据,并且定时向用户推送工作日志和
优化建议,能够为用户提供良好的工作管理协助,
提高用户工作效率,适宜处于工作环境下的科研
以及学习的人。
(51)Int.Cl.
权利要求书3页  说明书9页  附图7页
(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书3页  说明书9页  附图7页(10)申请公布号CN 103309794 A
*CN103309794A*
1.一种基于数据采集与关键字挖掘的自动日志生成系统,其特征在于包括:数据采集部分、数据分析部分、数据展示部分;所述数据采集部分包括键盘监听模块、剪贴板监听模块、鼠标监听模块、进程监听模块和数据存储模块;所述数据分析部分包括进程数据分析模块、鼠标键盘分析模块;数据展示部分包括数据即时展示模块和定时工作日志推送模块;
键盘监听模块,实现监听用户使用键盘的信息;用户按下的每个键位都会监听并记录下来,监听得到的信息将会以字符串的形式记录下来,此信息将会送往数据存储模块;
剪贴板监听模块,实现监听用户使用Windows操作系统剪贴板的情况;当剪贴板中的数据发生变化时,将会对变化后的数据记录下来,数据将会送往数据存储模块;
鼠标监听模块,实现对鼠标的使用信息监听并记录;记录鼠标的点击频率,每间隔一段时间将会对鼠标的点击次数进行一次统计,以文字的形式记录下来,记录的数据将会送往数据存储模块;
进程监听模块,实现对Windows操作系统进程的使用情况进行记录,包括进程号、进程名、占内存大小,
起始时间、占CPU百分比;过一段时间进行刷新,将记录数据送至数据存储模块;
数据存储模块,实现数据存储功能,以数据库的形式展示;存储收集到的系统数据,对这些数据进行一些基础的管理以及保存的工作,数据存储模块中的数据将会在需要的时候被送到数据分析部分以及数据展示部分中的各模块;
进程数据分析模块,对采集并存储到数据存储模块的进程信息进行数据挖掘分析;将采集到的进程名与本自动日志生成系统预存在进程分析模块中的进程白名单相比对,得到第一级状态分类判断结果,然后状态分类则进入更细化高级的分类判断之中:包括所占内存与标准活动内存相比较,线程数与标准线程数相比较,优先级判断活动类型,启动次数则在数据挖掘环节作为阶段活动统计信息呈现出来;
鼠标键盘数据分析模块,对采集并存储到数据库的鼠标、键盘、剪贴板信息进行数据挖掘分析,针对位置进程主窗口句柄的情况,直接从键盘活动信息和鼠标使用频率上,比对不同类型进程的标准数据,将数据送至数据即时展示模块;
数据即时展示模块,通过读取数据库中分析出的结果,实现将进程数据分析模块和鼠标键盘分析模块得出的分析结果利用图表方式直接呈现给用户;将进程信息做成表格,将键盘、鼠标的相关记录做成图表,剪贴板得出的高频词汇,即出现频率>10次,若均未超过10次则选取次数最高的5个词汇进行输出,定时推送的日志信息以.txt格式保存至本地。
2.根据权利要求1所述的基于数据采集与关键字挖掘的自动日志生成系统,其特征在于:所述键盘监听模块实现过程:
(1)建立一个键盘监听适配器KeyAdapter,并且定义一个布尔型的变量flag来记录shift键是否被按下,如果被按下,flag的值为true,否则为false;初始时flag的值为false;
(2)对键盘进行监听,如果键盘上的键被按下,KeyAdapter获得一个相应的键盘事件KeyEvent e,通过e的属性keycode可以获得当前按下的键盘键位所对应的一个整型的值,记录在整型变量key中;
(3)对key的值进行解析,如果key的值和shift键对应的keycode值相等,那么将flag的值置为true表明shift键被按下;对于key的其他值:只有一种可能性,即是否按
下shift键不会改变计算机收到的信号,将相应的键的名称记录下来;有两种可能性的键位,查看当前shift键是否被按下,再做出相应的判断,获得当前被按下的键;
(4)如果键盘上的键被松开,则获得相应的键盘事件e1,如果松开的键对应的一个keycode整型值等于shift键对应的值,那么将flag的值置为false表明shift键被松开;
(5)将获得的对应信息存储到数据存储模块中;
(6)重复循环(2)到(5)的步骤。
3.根据权利要求1所述的基于数据采集与关键字挖掘的自动日志生成系统,其特征在于:所述剪贴板监听模块实现过程:
(1)获得系统剪贴板;
(2)定义一个ClipboardOwner对象,用来监听剪贴板的所有者是否发生变化,间接的监听剪贴板的内容是否发生变化;
(3)如果发生变化,将当前剪贴板中的字符串内容存储到数据库中;
(4)重复(2)、(3)两个步骤,监听剪贴板。
4.根据权利要求1所述的基于数据采集与关键字挖掘的自动日志生成系统,其特征在于:所述鼠标监听模块的实现过程:
(1)添加一个鼠标MouseAdapter,监听鼠标事件MouseEvent;
(2)新建一个线程,以十秒为单位,在十秒之内记录鼠标被点击的次数,以此作为鼠标的点击频率;
(3)将鼠标的点击频率存入数据库中;
(4)重复(2)、(3)两个步骤,监听鼠标的点击频率。
5.根据权利要求1所述的基于数据采集与关键字挖掘的自动日志生成系统,其特征在于:所述进程监听模块实现过程:
(1)建立一个存放进程编号的数组Pids[];
(2)利用ProcList(),获得当前所有进程号,存入数组;
(3)利用进程号数组Pids和Sigar中的getInfo获得进程相关信息;
(4)将相关信息按照进程名为主码存入数据库中;
(5)每隔5s重复步骤(2)~(4)。
6.根据权利要求1所述的基于数据采集与关键字挖掘的自动日志生成系统,其特征在于:所述数据分析模块实现过程:
(1)数据采集模块得到的数据进入数据分析模块之后,根据数据类型的不同,分别进入进程数据分析模块和键盘鼠标数据分析模块;
(2)进程数据分析模块的优先级高于键盘鼠标数据分析模块,只要在进程数据分析模块判断失败的条件下才会启动键盘鼠标数据分析模块;
(3)判断成功之后,即计算得到的匹配误差度小于预定值之后会为目标进程打上标签以表明其种类;
(4)标签按照范围包括了第一级大类标签和第二级更具体的标签tag,其中第一级标签包含了工作,娱乐两类;第二级的标签则将会细致地分为文档、编程工作类任务,或者社交网络、影视欣赏、电玩娱乐类任务;
(5)如果判断失败,系统将会将数据特征匹配误差度最低的前三组结果输出到用户自
定义模块中,以达到提出合理建议的友好人机交互体验,用户自定义属于数据展示模块的功能。
7.一种基于数据采集与关键字挖掘的自动日志生成方法,其特征在于实现步骤如下:
(1)用户启动系统,鼠标监听模块、键盘监听模块、剪贴板监听模块、进程监听模块同时启动;
(2)启动系统后(1)中提到的五个模块分别进行系统数据的收集,A.鼠标监听模块负责监听用户对于鼠标的操作,记录鼠标的点击频率,每间隔一段时间将会对鼠标的点击次数进行一次统计,以文字的形式记录下来,记录的数据将会送往数据存储模块;B.键盘监听模块负责监听用户对键盘的操作,按下的
每个键位都会监听并记录下来,监听得到的信息将会以字符串的形式记录下来,此信息将会送往数据存储模块;C.剪贴板监听模块负责对用户剪贴板的使用进行监听,当剪贴板中的数据发生变化时,将会对变化后的数据记录下来,数据将会送往数据存储模块;D.进程监听模块监听系统进程的信息,监听进程占CPU 百分比以及起始时间和结束时间,按照进程名称记录下来,送往数据存储模块;
(3)判断用户使用进程所占CPU百分比以及鼠标、键盘点击频率,如果符合数据即时展示模块所要求的条件,则弹出即时展示窗口;
(4)判断当前系统时间,如果符合用户设定的弹出工作日志时间,则按照定时工作日志推送模块所要求生成工作日志,并且弹出工作日志窗口。
1/9页
一种基于数据采集与关键字挖掘的自动日志生成系统及方
技术领域
[0001]
本发明涉及一种基于数据采集与关键字挖掘的自动日志生成系统及方法,属于计
算机技术领域。背景技术
[0002]
个人计算机一词源自于1981年IBM 的第一部桌上型计算机型号PC ,在此之前有
Apple II 的能独立运行、完成特定功能的个人计算机。个人计算机不需要共享其他计算机的处理、磁盘和打印机等资源也可以独立工作。今天,个人计算机一词则泛指所有的个人计算机、如桌上型计算机、笔记型计算机、或是兼容于IBM 系统的个人计算机等。基于个人计算机的功能面向使用计算机进行工作、学习、娱乐、沟通的用户的应用软件种类十分繁多,功能也十分强大。
[0003] 长时间使用个人计算机工作学习的人都会面临时间分配的问题,集娱乐与学习工作功能于一体的计算机能帮助提高效率,同时也有可能导致对时间分配不合理,花费过多的时间在娱乐上导致工作学习的时间被压缩,特别是对于大学生,这个问题更加严重。因此需要一个对时间进行管理的个人计算机应用软件。
[0004] 当前计算机所提供的工作日志一般有Linux 系统下的工作日志,该日志记录了计算机所有的操作详情。但是使用起来过于复杂,并且数据也太过庞大,所以这并不适合普通用户。Windows 系统在运行
的过程中也会留下许多痕迹,记录计算机工作情况,并且以最直观和的图表等形式展现给用户是希望做到的。如何对数据的分析和提炼、如何展示才能有更好的用户体验,这是值得去研究的部分。
[0005] 数据挖掘,又译为资料探勘、数据采矿。它是数据库知识发现中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。通过对个人计算机中的信息进行采集,并运用数据挖掘领域中的算法将有用的信息提取出来并加以分析,产生的分析结果对用户的使用会有很大帮助。
[0006] 现有技术之中,结合键盘鼠标活动状态的数据加以推断分析进程类型的技术少有开发,由于判断精度是技术的难点之一,对计算机工作领域的了解的局限性也是实验设计局限的原因。发明内容
[0007] 本发明的技术解决问题是:克服现有技术的不足,提供一种基于数据采集与关键字挖掘的自动日志生成系统,具有良好的用户体验,直观地展现系统数据,并且定时向用户推送工作日志和优化建议,能够为用户提供良好的工作管理协助,提高用户工作效率,适宜处于工作环境下的科研以及学习的人。说  明  书CN 103309794 A

本文发布于:2024-09-22 10:33:35,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/419270.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模块   数据   监听   进程   鼠标   工作
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议