文本数据的离线众包标注方法[发明专利]

专利名称:文本数据的离线众包标注方法专利类型:发明专利
发明人:张静,栾瑞鹏,李守斌,刘星宇
申请号:CN202110970565.2
申请日:20210823
公开号:CN113673957B
公开日:
20220419
专利内容由知识产权出版社提供
摘要:本发明公开了一种文本数据的离线众包标注方法,其具体步骤包括:对待标注的文本数据进行采集;对待标注的文本数据进行数据清洗;根据不同的标注需求与标注规则,确定相应的标注任务和参与文本数据标注的数据标注员的数量;数据标注员在无网络的离线环境中,对文本数据进行标注;对标注后的文本数据进行评估,检测标注后的文本数据的质量,将得到的最优分类器模型的指标,发送给用户使用,并对该最优分类器模型进行上线前的最后评估,生成完整的标注好的文本数据集。本发明方法有效解决了离线环境下的文本数据的高效分发和回收问题,实现了分发信息的同步。
申请人:中国人民解放军32801部队
地址:100082 北京市海淀区西直门北大街28号院
国籍:CN
代理机构:北京丰浩知识产权代理事务所(普通合伙)
代理人:李学康

本文发布于:2024-09-20 15:31:44,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/761424.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:标注   数据   文本   进行   知识产权   离线   代理
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议