基于自适应变分编码器的短文本聚类方法[发明专利]

专利名称:基于自适应变分编码器短文聚类方法专利类型:发明专利
发明人:范青武,王子栋
申请号:CN202210299111.1
申请日:20220313冯志明自杀
公开号:CN114625879A
公开日:
20220614
读书莫放拦路虎
甾醇
专利内容由知识产权出版社提供
摘要:基于自适应变分编码器的短文本聚类方法涉及文本聚类技术领域。首先,对短文本使用sentence‑Bert的方法进行文本表示;其次,使用自编码器将向量转化为低维特征向量,使用富迪探索者
要练惊人艺K‑means方法提取聚类中心;然后,使用聚类中心作为变分自编码器的期望均值对于输入向量进行预训练,转化为满足以聚类中心为期望均值的分布的特征向量;将特征向量根据K‑means算法构建分类器,通过分类后的分布对分类器与编码器的权重进行微调。最后根据微调后的编码器与分类器得到聚类结果。本发明能够很好的处理短文本聚类中的文本向量高维稀疏的问题,为短文本聚类提供了新的特征深度嵌入算法。
申请人:北京工业大学
地址:100124 北京市朝阳区平乐园100号
国籍:CN
tpy
代理机构:北京思海天达知识产权代理有限公司
代理人:刘萍

本文发布于:2024-09-21 16:45:27,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/147143.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:聚类   编码器   短文   方法   向量   北京市   中心   分类器
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议