专利类型:发明专利
发明人:曾锐鸿,马金龙,熊佳,王伟喆,吴文亮,罗箫,盘子圣,焦南凯,黎子骏,徐志坚,谢睿,陈光尧
申请号:CN202111473148.3
申请日:20211202
公开号:CN114579693A
公开日:
20220603
专利内容由知识产权出版社提供
摘要:本发明公开了一种NLP文本安全审核多级检索系统,利用压缩前缀树的数据结构进行数据的存储和查,查询速度快,且内存占用比使用字典树数据结构降低了两千多倍,关键词匹配子模块、句子相似度匹配子模块和文本分类深度学习子模块构成三级搜索的层级搜索结构,查询准确率高,既能覆盖到显性敏感词的搜索,同时能从语义上进行文本内容安全审核,在准确率、容错率以及覆盖率上都有保障,又能提高系统的模型泛化能力,解决了现有的NLP文本安全审核系统使用Trie树的数据结构进行存储,占用存储空间大,增加了服务器的内存成本,不便于在同一台服务器上大规模部署,在性能上难以达到最优,以及模型泛化能力受限制,预测准确性不稳定的技术问题的技术问题。 申请人:广州趣丸网络科技有限公司
地址:510000 广东省广州市天河区平云路163号之二1601室(部位:自编之01室)(仅限办公)国籍:CN
代理机构:北京集佳知识产权代理有限公司
代理人:李秋梅