NER任务的精确评估指标P、R、F1

直接⽤⼀个实例来看⼏个参数具体的含义：

sentence : The Hospital said it would probably know by Tuesday whether its patients had Congo Fever .

gold_tag: b-AGENT e-AGENT o o b-DSE m-DSE e-DSE o o b-TARGET m-TARGET m- TARGET m-TARGET m-TARGET e-TARGET o

predict_tag: o e-AGENT b-DSE o b-DSE m-DSE e-DSE o o b-AGENT b-DSE b-TARGET m-TARGET e-TARGET o o上述例⼦中，每⼀个句⼦中的，每⼀个word都有⼀个gold 和 predict 标签。b、m、e分别表⽰实体的起始边界、中间边界、结束边界；s 是表⽰当个实体，就是本⾝⼀个word就是⼀个实体。⽽诸如DSE、TARGET、AGENT表⽰是实体的类别。

实体只有这三种形式：[b,m….,e]、[b,e]、 [s]，实体是有边界的，在精确匹配过程中，需要预测实体类别以及边界范围，只有这两部分都匹配成功，才算预测正确，否则是预测错误。

⾦标的实体有3个，是上述gold_tag加粗部分，预测准确部分是predict_tag 加粗部分。

在⾃然语⾔处理的任务中，⽽且数据⾮常均匀，不存在很极端的数据的情况下，评价指标我们⼀般会⽤F值来评测结果。怎么计算F值呢？给出五个参数：

gold_num：⾦标数量

predict_num ：预测数量

correct_num：预测准确的数量

precision：准确率(精确率)

recall ：召回率

f1：F值

具体计算公式如下所⽰：

本文发布于:2024-09-22 20:17:59，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/1/368889.html

上一篇：英语单词读音

下一篇：中南大学离散数学复习资...

标签：边界实体预测参数指标评测

留言与评论（共有 0 条评论）