基于聊天机器人的知识库管理系统的研究

基于聊天机器人的知识库管理系统的研究
Research on KBMS Based on ChatBot
伴随着某移动通信设备公司的扩大,该公司的知识也在不断地积累,知识的搜索和知识库的管理成为了公司发展中的一个难题,本文设计与实现了一个聊天机器人帮助管理文件以及能够帮助公司运维人员快速准确定位目标文档的知识库管理系统。本文设计实现的基于聊天机器人的知识库管理系统分为两个端口,机器人设立于该系统的用户Web 端,其关键在于通过意图识别区分运维人员的文档搜索、产品搜索和智能问答的意图,可根据关键词、图片、用户偏好等信息定位相关文档,也可以通过多轮对话的方式查询某个产品,而且可收集和统计公司运维人员的搜索历史等行为,提供个性化文档推荐服务[1-3]。1系统设计思路
本文实现的知识库管理系统包括用户Web 端、后台管理系统两大服务平台,用户Web 端面向公司运维人员,后台管理系统面向后台管理人员。用户Web 端提供文档搜索、文档收藏订阅、文档下载、文档预览、智能问答等服务。后台管理系统可进行文档管理、用户信息管理、机器人管理问答管理、反馈处理等操作,本系统的服务模型如图1所示。
用户Web 端以公司运维人员为主体对象提供服务,公司运维人员可以查看实时搜索热点,使用关键字对文档、问题发起检索,进行文档查看、下载、收藏、订阅,查看相关文档推荐,与服务机器人进行对话,
通过多轮对话对文档进行更加精确的查。
后台管理系统主要为系统管理员服务,包括用户信息管理、文档管理、机器人管理、社区管理四大功能模块。系统管理员可以对公司运维人员信息和文档信息进行管理,可以编辑运维人员信息,文档在线编辑、文档版本更迭。也可对系统中的机器人和问答社区进行管理,可以配置机器人知识库、查看机器人统计数据和未解决问题,设置最佳回答、删除无关问答。2技术路线
系统采用B /S 架构,基于SpringMVC 框架进行开发,分为界面视图层、业务逻辑层和数据访问层三层。机器人采用Python 语言开发,以Chatterbot 为基础框架,结合Rasa_nlu 技术识别运维人员的意图,采用Flask 框架和Json 数据格式与前
端网页进行交互,方便快捷。机器人可以通过语音识别或文字输入获取用户提出的问题,再通过预处理将输入的文本转换为系统语言,再利用百度的文本纠错接口对获取到的文本进行拼写和语法等方面的纠错,对纠错后的文本再进行敏感词过滤,若文本中敏感词过多,将返回警告。接着,将处理后的文本使用Rasa_nlu 的技术进行意图识别,在系统中用户的意图定义主要分为三部分:产品搜索、文档搜索和普通的问答,意图的识别能够准确进行下一步步骤。意图识别成功后将使用对应的方法进行处理,返回最终结果。机器人通过内部严谨的逻辑结构,可以准确地回答用户的问题,满足用户需求。机器人内部流程如图2所示。2.1产品搜索模块
知识库系统中存在着多种不同的产品,包括路由器、交换机、服务器和WLAN 等。对于无线(有线)产品,系统设置了4个通用型参数:交换容量、转发容量、主控槽位、交换网板槽位数。在识别出用户的产品搜索意图后,系统自动设置各参数的词槽,
周煜华
陈德胜
麒(浙江理工大学信息学院计算机科学与技术系,浙江杭州310018)
摘要:随着互联网技术的不断革新,一些移动通信设备公司的产品线越加丰富,版本更多,信息量更大,为了解决运维人员在众多产品文档中查文档效率低的问题,设计与实现了基于聊天机器人的知识库管理系统,关键模块包括智能问答、文档搜索、产品搜索、知识推荐和知识图谱等以辅助运维人员方便地查文档和产品,能够在与运维人员对话过程中理解其意图、精确提取查询条件以及实现在知识图谱优化下的文档推荐。
关键词:文档;产品;推荐;搜索;聊天机器人
抗干扰滤波器
Abstract 押This paper designs and implements a knowledge base management system based on chat robots熏the key modules.It includes intelligent question-and-answer熏document search熏product search熏knowledge recommendation and knowl⁃edge map to assist operators to find documents and products conveniently.It can understand their intentions熏extract query conditions accurately and realize document recommendation under the optimization of knowledge map in the process of di⁃alogue with operators.
Keywords
押document熏product熏recommend熏search熏ChatBot
图1服务模型图
基于聊天机器人的知识库管理系统的研究
124
《工业控制计算机》2019年第32卷第9期
在词槽信息未被填充时,机器人将会询问用户未被填充词槽的信息,用户可以根据机器人的提示不断填充信息,也可以自行选择顺序填充信息,系统将利用Rasa_nlu的实体提取的功能自动识别出参数信息并填充。对于不需要填充的信息,用户也可以不做范围选择,系统将自动忽略该参数的信息。
系统产品搜索还采用图片识别的形式,使用百度的Easydl 平台的分类计数对各产品的图片进行训练,训练后自动生成模型,将生成后的模型应用在系统中。用户可以通过拍照等形式上传设备照片,系统将自动识别出产品设备的型号,并返回相应的产品参数和产品描述文档。
2.2文档搜索模块
文档检索的精度及效率,决定了机器人信息检索的准确性。本论文设计实现的系统使用MySQL数据库进行文档信息存储。为解决在MySQL数据库中文档信息检索全文检索效率低下、精度不高等问题,系统采用Solr企业级全文检索引擎作为系统的信息检索引擎。将MySQL数据库中的检索信息与Solr 引擎进行同步,依托Solr高效率的全文检索能力,提高系统的综合文档信息检索能力。在双引擎综合信息检索基础上,系统引入了Redis高速内存数据库作为系统的文档信息检索缓存。系统将信息检索关键字及检索结果同步到Redis中,借助缓存结构提高系统对热点信息的检索速率。Redis优化的多引擎检索示意图如图3所示。
图3多引擎检索示意图
2.3智能问答模块
机器人的智能问答模块为问答交流的核心,系统中的问答库存有问答对,在识别出用户的问答搜索意图后,系统将与问答库中的问题进行比对获取答案。系统采用了Python中的Chat⁃terbot开源聊天机器人框架,并自行设计实现了逻辑适配器和
问题比对方式。
首先采用TF-IDF算法筛选出问答库中与问题关键词相同
二恶英检测的问题生成问题列表,再对筛选后的问题列表进行问题相似度
比对[4]。问题相似度比对使用了利用知乎问答回复所训练成的Word+Ngram的词向量模型,通过Gensim第三方工具包加载
上述模型。通过引入中文分词包结巴分词对文本进行分词,使用
词向量模型获取分词结果列表中各个词语对应的向量值,如果
在词向量模型中未到某个分词的对应向量,则置0。例如原
句:“NE路由器的二三层模式转换方式”分词后结果:眼'NE'熏'路
由器'熏'的'熏'二三层'熏'模式'熏'转换'熏'方式'演转化为对应词向
量结果如图4示。与用户问的问题:“NE路由器如何进行接口的
二三层模式转换”的词向量对比,有着86.51%的相似度,大于等
于给定的阈值(这里给定的阈值为75%),因此将其加入到匹配
到的问题列表。最后通过对匹配到问题列表中各问题与原问题
lrx相似度的比对进行降序排序,获得相似度最高的问题,并返回其
相关联的答案。
图4词向量图
在逻辑适配器中,对匹配到相似度最高的答案还进行简化
处理,提取出其中与用户提问最接近的部分。对匹配到的问题列
表除了返回相似度最高的答案,还将其他答案整合生成一个相
似问题列表作为相似问题推荐给用户,并对数据进行了处理,将
返回数据封装成严格的Json格式字符串,包括返回答案和相似
问题列表,具体结构如图5的返回结果所示。
图5返回结果
2.4文档推荐模块
系统推荐流程图如图6所示。系统利用日志对用户行为进
行挖掘,收集用户从进入系统开始的文档搜索、文档下载、浏览
时间、文档订阅等行为。按照预先设置好的权重,见表1,使用评分公式Min(5,Max(p(i))+
n
i=1
∑p(i)
5n)(p(i)为用户第i项行为的评分)对用户文档偏好行为进行评分,获得用户偏好评分表,如表2。使用基于矩阵分解的皮尔逊相关系数[5]F(X,Y)
=图2机器人内部流程图
125
(上接第123页)-请求执行前
-URL 押http押//127.0.0.1押8080/page /menuView -HTTP_METHOD 押GET -IP 押127.0.0.1-CLASS_METHOD 押com.ller.PageController.
auditorsView -arg is押邀妖
-操作员是:南京分行管理员
-RESPONSE 押/MenuView /menuView -请求总耗时:46ms -请求执行完毕
3结束语
本文主要介绍了中国人民银行南京分行项目库信息系统的设计与实现等内容,完成了中国人民银行南京分行提出的需求,目前该系统已上线使用。项目库信息系统健全了线上审核流程、规范了项目在各阶段需要上传的各种材料和信息;有效提高了项目的审核效率,降低项目申报和审核时间;能够实时
查看项目在各个阶段的状态,弥补了传统项目库管理模式的不足。通过建立项目库信息系统,推动了南京分行信息建设,提高了南京分行项目规范化、标准化、科学化管理水平。
参考文献
[1]杨燕平.PPP 项目库管理对人民银行预算项目库管理的启示及建议[J ].金融科技时代,2018(8):85-90
[2]周磊,李海泉,刘越,等.基于B /S 架构的陕西省博物馆管理信息平台的实现[J ].测绘与空间地理信息,2019,42(5):73-75[3]章仁棠.基于Web 三层架构的高校科研管理系统的设计与实现[J ].信息通信,2019(3):182-183
[4]许岩峰.基于Redis 的选课系统设计与实现[D ].北京:中国科学院大学(中国科学院工程管理与信息技术学院),2017[5]苏翔宇,朱爱.CentOS7下基于Nginx 的反向代理及负载均衡研究与实现[J ].现代计算机(专业版),2018(10):61-64[6]贺琛,陈肇雄,黄河燕.Web 缓存技术综述[J ].小型微型计算机系统,2004(5):836-842
[7]王嫣如.Redis 消息推送机制应用技术研究[J ].科技广场,2016(8):41-44
防辐射面料
[8]魏文清,石亮红,武宝珠.用AOP 技术实现Web 系统中的日志管理[J ].江西科学,2010,28(4):528-530,574[9]唐念刚,张勇.AOP 技术在Web 系统日志和事物管理中的应用[J ].
电子设计工程,2017,25(16):42-45
[收稿日期:2019.6.24]
N ∑XY-∑X ∑Y N ∑X
2
-(∑X )
2
桑叶采摘器
√N ∑Y
2
-(∑Y )
2
√(其中X 表示用户,Y 表示对
应文档偏好值,N 表示变量取值的个数)计算文档相似度,得到文档相似度表,并获得文档相似度较高的几项,见表3文档相似度表。最后系统通过知识图谱中的文档、产品关系对推荐结果进行优化,去除文档相似度较低且无关联关系的推荐项[6-7]。
表1
用户行为评分表
高频电子水处理器表2用户文档偏好表
表3文档相似度表
3结束语
该系统通过聊天机器人为运维人员提供服务,实现了用户意图理解、基于对话的文档查、知识图谱优化下的智能推荐,有效解决了当前行业同类系统中的当前使用中遇到的问题。
参考文献
[1]龚志霖,孙麒.基于Hadoop 的在线考试系统的设计研究[J ].工业控制计算机,2016,29(7):133-134
[2]林佳琦,孙麒.基于货车租赁移动应用的关键技术研究[J ].工业控制计算机,2017,30(7):140-141[3]汪方野,孙麒.基于Android 平台的就业软件智能推送系统的研究[J ].工业控制计算机,2017,30(5):134-135[4]黄际洲.聊天机器人知识库自动抽取算法的研究与实现[D ].重庆:重庆大学,2006
[5]硕良勋,柴变芳,张新东.基于改进最近邻的协同过滤推荐算法[J ].计算机工程与应用,2015(5):137-141[6]桂绍武.一个文档推荐系统的设计与实现[D ].武汉:华中科技大学,2014
[7]刘永高.在线文档推荐算法的研究与改进[D ].成都:电子科技大学,
2016
[收稿日期:2019.7.19
]
图6推荐
流程图
基于聊天机器人的知识库管理系统的研究
126

本文发布于:2024-09-24 06:20:05,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/175043.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:文档   系统   进行   机器人   用户   管理
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议