一种基于注释语义信息的代码搜索方法[发明专利]

专利名称:一种基于注释语义信息代码搜索方法专利类型:发明专利
发明人:银正强,周尔强,曹黛,罗纪杰
申请号:CN202011296561.2
申请日:20201118
公开号:CN112507065A
公开日:
20210316
专利内容由知识产权出版社提供
摘要:本发明涉及一种基于注释语义信息的代码搜索方法,所述搜索方法包括从收集的代码仓库中得到存储为“自然语言描述,函数代码”形式的代码样本,对代码样本进行数据处理后通过神经网络模型编码器进行编码,并对神经网络模型进行训练;通过神经网络模型编码器将代码仓库中的所有代码函数和用户的输入转化为向量形式并构建代码向量仓库,计算代码向量仓库中与用户输入转化后的向量最接近的多个代码向量,并返回对应的代码作为检索结果。本发明的优点在于:使用代码内部本身带有的注释信息作为自然语言标注,减少的需要人工标注这一工作量,可以实现大规模的数据生成。其次采用了Transformer神经网络等进行语义特征提取,解决了传统的关键词匹配需要一一对应的缺点。
申请人:电子科技大学
地址:610000 四川省成都市建设北路二段四号
国籍:CN
代理机构:成都东恒知盛知识产权代理事务所(特殊普通合伙)

本文发布于:2024-09-21 16:14:49,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/442543.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:代码   向量   信息   神经网络   仓库
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议