NER任务的精确评估指标P、R、F1

NER任务的精确评估指标P、R、F1
直接⽤⼀个实例来看⼏个参数具体的含义:
sentence : The Hospital said it would probably know by Tuesday whether its patients had Congo Fever .
gold_tag: b-AGENT e-AGENT o o b-DSE m-DSE e-DSE o o b-TARGET m-TARGET m- TARGET m-TARGET m-TARGET e-TARGET o
predict_tag: o e-AGENT b-DSE o b-DSE m-DSE e-DSE o o b-AGENT b-DSE b-TARGET m-TARGET e-TARGET o o上述例⼦中,每⼀个句⼦中的,每⼀个word都有⼀个gold 和 predict 标签。b、m、e分别表⽰实体的起始边界、中间边界、结束边界;s 是表⽰当个实体,就是本⾝⼀个word就是⼀个实体。⽽诸如DSE、TARGET、AGENT表⽰是实体的类别。
实体只有这三种形式:[b,m….,e]、[b,e]、 [s],实体是有边界的,在精确匹配过程中,需要预测实体类别以及边界范围,只有这两部分都匹配成功,才算预测正确,否则是预测错误。
⾦标的实体有3个,是上述gold_tag加粗部分, 预测准确部分是predict_tag 加粗部分。
在⾃然语⾔处理的任务中,⽽且数据⾮常均匀,不存在很极端的数据的情况下,评价指标我们⼀般会⽤F值来评测结果。怎么计算F值呢?给出五个参数:
gold_num:⾦标数量
predict_num :预测数量
correct_num:预测准确的数量
precision:准确率(精确率)
recall :召回率
f1:F值
具体计算公式如下所⽰:

本文发布于:2024-09-22 20:17:59,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/368889.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:边界   实体   预测   参数   指标   评测
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议