认知篇#4:YOLO评价指标及其数学原理的学习

[复制链接]
发表于 2025-10-12 08:01:36 | 显示全部楼层 |阅读模式
一、前言

在呆板学习中,要评估一个模子在使掷中的精良性,必要利用评价指标来对其举行评 估,而评价指标通常有多个,从差异层面来评价模子的优劣,从而使模子的构建者更加的 全面的相识模子的性能,同时依据使命的方向和要求来对模子举行弃取。常用的分类模子的评价指标有正确率 (Precision) 、召回率 (Recall)、F1-Score (F1)等等
二、评价指标的界说及其作用

1、Precision


这是一个比力常见的评价指标,也比力紧张。式中,TP 表现 True Positives,FP 表现 False Positive;相应的,另有FN 表现 False Negatives,TN表现True Negatives。

[/td]相干(Relevent)无关(NonRelevent)[/tr]
未被检索到(Not Retrieved)False Negatives(FN)True Negatives(TN)
被检索到(Retrieved)True Positives(TP)False Positives(FP)
 那么Precision(P)表现的就是被检测到的且正确的比例。换句话说,它衡量了模子正确检测到的对象中,有多少是真正的对象。它是模子的猜测结果中真正对象的比例。这个很紧张,但也有缺陷
比方有一个模子岂论怎么训练都只能检测到两个,还都是对的对象,那么它的P理论上就是100%。它是度量被检测到的目标里的真真假假
2、Recall 


召回率(Recall)衡量了真实对象中,模子乐成检测到了多少。它是模子检测到的真正对象占全部真实对象的比例。它也有缺陷
假设有一个数据集真实框只有10个,但是我模子检测出了1000个框,内里包罗了那十个,这就算R=1了。R只能衡量真实框被检测的结果怎样,多检测错的就没办法思量了
3、IoU与置信度

IoU就是交并比(Intersection Over Union),IOU 盘算的是“猜测的边框”和“真实的边框”的交集和并集的比值。

置信度得分可以有效的资助我们筛选检测较差 的结果。如图中检测到bounding box中的右上角的数值即为置信度得分。置信的得分是一个0-1之间的数值。

看起来非常复杂,着实明白起来也不容易。此中,Pr(Object) 是猜测框内存在对象的概率,Pr(Classi|Object) 是猜测框内是某类对象的概率,IoU是猜测框与全部真实框之间的最大IoU值(如果存在真实框与猜测框匹配)。
在YOLO中,置信度是通过将对象存在的概率与猜测框和真实框的最高IoU(如果有一个真实框与该猜测框匹配)相乘来盘算的。然而,在训练过程中,由于没有真实的IoU值(由于我们在训练时必要猜测它),以是通常将置信度简化为对象存在的概率。在推理(测试)时,我们会利用猜测的对象存在概率和猜测的框与全部真实框的IoU中的最大值(如果存在匹配的真实框)来盘算置信度。
4、AP与mAP

AP即Average Precision,称为均匀正确率,是对差异召回率点上的正确率举行均匀。AP的值越大,则分析模子的均匀正确率越高。
为了说清晰这个就必须先容P-R曲线

横坐标是R,纵坐标是P。假设现在一张图片内里有十个人,我们检测这张图片有十多个框,每个框上面都会有一个置信度。我们必要把每个框的P,R都给列出来。

P-R曲线就是前面的那张。AP(Average Precision)就是直接求 P-R 曲线下的面积。AP的值越大,则分析模子的均匀正确率越高。但要留意的是,它的本质上就是P的均匀值
mAP是英文mean average precision的缩写,意思是均匀精度均值。在目标检测中,一个模子通常会检测很多种物体。那么如果有多个类呢,就必要用到mAP了。界说就是每种种别的AP的均值,还是P的均匀值
 5、mAP50和mAP50-95

很多文章里也写作mAP@50和mAP@50:95;也有写作mAP@0.5,mAP@0.5:0.95
AP50,AP60,AP70……等等指的是取detector的IoU阈值大于0.5,大于0.6,大于0.7……等等。数值越高,即阈值越大,这个AP某某的值越低。mAP50就好明白了,就是IoU的阈值大于0.5的时间的每种分类的AP的均匀值。
mAP@0.5:0.95则体现在差异IoU阈值(从0.5到0.95,步长0.05)(0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95)上的均匀mAP。这个一样平常肯定比mAP@0.5低不少。
三、总结

在呆板学习和深度学习的使掷中,模子的性能评估至关紧张,而评价指标则为我们提供了多角度的衡量尺度。常见的分类模子评价指标包罗正确率(Precision)、召回率(Recall)、F1-Score、IoU、置信度、AP(均匀精度)和mAP(均匀精度均值)等。每个指标偏重于差异方面的性能表现,如正确率衡量模子正确猜测的比例,召回率则关注模子对真实对象的检测本领,IoU用于衡量猜测框与真实框的重叠度,置信度则资助筛选高质量的检测结果。
AP和mAP进一步将评价指标拓展到多个种别和差异IoU阈值下的精度盘算,使得评估更加全面和正确。在目标检测使掷中,mAP特殊紧张,由于它综合了多个种别的表现,并在差异的IoU阈值下提供了更过细的模子性能分析。mAP50和mAP50-95的差异阈值设定,表现了差异精度要求下的模子结果,因此在模子优化过程中,公道选择这些指标并综合思量它们的优缺点,可以大概资助构建者更好地明白和提升模子性能。
总体而言,正确明白并运用这些评价指标,对于优化模子、提升模子在实际使掷中的表现具有紧张意义。
四、参考文章

   YOLO--置信度(超详细解读)_yolo置信度-CSDN博客
  YOLO等目标检测模子的非极大值克制NMS和评价指标(Acc, Precision, Recall, AP, mAP, RoI)、YOLOv5中mAP@0.5与mAP@0.5:0.95的寄义_nms yolo-CSDN博客
  YOLO系列条记(一)——YOLO先容与衡量指标_yolo one stage-CSDN博客

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

登录后关闭弹窗

登录参与点评抽奖  加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表