基于混合特征分析的涉黄、涉赌网站检测方法[发明专利]

专利名称:基于混合特征分析的涉黄、涉赌网站检测方法专利类型:发明专利
发明人:刘亮,陈扬,郑荣锋
申请号:CN201910727964.9
申请日:20190808
公开号:CN112347244A
公开日:
20210209
专利内容由知识产权出版社提供
摘要:本发明涉及一种基于混合特征的涉黄、涉赌网站检测方法。该方法包括以下步骤:对网络数据流量进行采集,对数据包进行解析后获取网站域名地址;根据域名地址获取对应网站的完整源码和首页长截图;使用基于关键词匹配的方法对网站域名进行过滤,然后人工标注网站类别(主要包括涉赌、涉和正常网站);分别使用word2vec和BoVW提取网站的文本特征和图像特征,然后训练联合分类器模型;并使用训练好的联合分类器对待检测的网站进行分类,检测该网站是否为涉赌网站或涉。本发明通过结合图像和文本特征并且使用联合分类器进行网站分类,能够实现更加精准的网站检测,最大限度地提高涉黄、涉赌网站的自动化识别能力。
申请人:四川大学
地址:610065 四川省成都市武侯区一环路南一段24号
国籍:CN

本文发布于:2024-09-21 03:34:49,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/418961.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:网站   进行   检测   特征   方法   涉赌   使用
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议