认知篇#4：YOLO评价指标及其数学原理的学习

登录 · 发表于 2025-10-12 08:01:36

一、前言

在呆板学习中，要评估一个模子在使掷中的精良性，必要利用评价指标来对其举行评估，而评价指标通常有多个，从差异层面来评价模子的优劣，从而使模子的构建者更加的全面的相识模子的性能，同时依据使命的方向和要求来对模子举行弃取。常用的分类模子的评价指标有正确率（Precision）、召回率（Recall）、F1-Score （F1）等等
二、评价指标的界说及其作用

1、Precision

这是一个比力常见的评价指标，也比力紧张。式中，TP 表现 True Positives，FP 表现 False Positive；相应的，另有FN 表现 False Negatives，TN表现True Negatives。

[/td]相干（Relevent）无关（NonRelevent）[/tr]
未被检索到（Not Retrieved）	False Negatives（FN）	True Negatives（TN）
被检索到（Retrieved）	True Positives（TP）	False Positives（FP）

那么Precision（P）表现的就是被检测到的且正确的比例。换句话说，它衡量了模子正确检测到的对象中，有多少是真正的对象。它是模子的猜测结果中真正对象的比例。这个很紧张，但也有缺陷
比方有一个模子岂论怎么训练都只能检测到两个，还都是对的对象，那么它的P理论上就是100%。它是度量被检测到的目标里的真真假假
2、Recall

召回率（Recall）衡量了真实对象中，模子乐成检测到了多少。它是模子检测到的真正对象占全部真实对象的比例。它也有缺陷：
假设有一个数据集真实框只有10个，但是我模子检测出了1000个框，内里包罗了那十个，这就算R=1了。R只能衡量真实框被检测的结果怎样，多检测错的就没办法思量了
3、IoU与置信度

IoU就是交并比（Intersection Over Union），IOU 盘算的是“猜测的边框”和“真实的边框”的交集和并集的比值。

置信度得分可以有效的资助我们筛选检测较差的结果。如图中检测到bounding box中的右上角的数值即为置信度得分。置信的得分是一个0-1之间的数值。

看起来非常复杂，着实明白起来也不容易。此中，Pr(Object) 是猜测框内存在对象的概率，Pr(Classi|Object) 是猜测框内是某类对象的概率，IoU是猜测框与全部真实框之间的最大IoU值（如果存在真实框与猜测框匹配）。
在YOLO中，置信度是通过将对象存在的概率与猜测框和真实框的最高IoU（如果有一个真实框与该猜测框匹配）相乘来盘算的。然而，在训练过程中，由于没有真实的IoU值（由于我们在训练时必要猜测它），以是通常将置信度简化为对象存在的概率。在推理（测试）时，我们会利用猜测的对象存在概率和猜测的框与全部真实框的IoU中的最大值（如果存在匹配的真实框）来盘算置信度。
4、AP与mAP

AP即Average Precision，称为均匀正确率，是对差异召回率点上的正确率举行均匀。AP的值越大，则分析模子的均匀正确率越高。
为了说清晰这个就必须先容P-R曲线：

横坐标是R，纵坐标是P。假设现在一张图片内里有十个人，我们检测这张图片有十多个框，每个框上面都会有一个置信度。我们必要把每个框的P，R都给列出来。

P-R曲线就是前面的那张。AP(Average Precision)就是直接求 P-R 曲线下的面积。AP的值越大，则分析模子的均匀正确率越高。但要留意的是，它的本质上就是P的均匀值！
mAP是英文mean average precision的缩写，意思是均匀精度均值。在目标检测中，一个模子通常会检测很多种物体。那么如果有多个类呢，就必要用到mAP了。界说就是每种种别的AP的均值，还是P的均匀值！
5、mAP50和mAP50-95

很多文章里也写作mAP@50和mAP@50：95；也有写作mAP@0.5，mAP@0.5：0.95
AP50，AP60，AP70……等等指的是取detector的IoU阈值大于0.5，大于0.6，大于0.7……等等。数值越高，即阈值越大，这个AP某某的值越低。mAP50就好明白了，就是IoU的阈值大于0.5的时间的每种分类的AP的均匀值。
mAP@0.5：0.95则体现在差异IoU阈值（从0.5到0.95，步长0.05）（0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95）上的均匀mAP。这个一样平常肯定比mAP@0.5低不少。
三、总结

在呆板学习和深度学习的使掷中，模子的性能评估至关紧张，而评价指标则为我们提供了多角度的衡量尺度。常见的分类模子评价指标包罗正确率（Precision）、召回率（Recall）、F1-Score、IoU、置信度、AP（均匀精度）和mAP（均匀精度均值）等。每个指标偏重于差异方面的性能表现，如正确率衡量模子正确猜测的比例，召回率则关注模子对真实对象的检测本领，IoU用于衡量猜测框与真实框的重叠度，置信度则资助筛选高质量的检测结果。
AP和mAP进一步将评价指标拓展到多个种别和差异IoU阈值下的精度盘算，使得评估更加全面和正确。在目标检测使掷中，mAP特殊紧张，由于它综合了多个种别的表现，并在差异的IoU阈值下提供了更过细的模子性能分析。mAP50和mAP50-95的差异阈值设定，表现了差异精度要求下的模子结果，因此在模子优化过程中，公道选择这些指标并综合思量它们的优缺点，可以大概资助构建者更好地明白和提升模子性能。
总体而言，正确明白并运用这些评价指标，对于优化模子、提升模子在实际使掷中的表现具有紧张意义。
四、参考文章

YOLO--置信度（超详细解读）_yolo置信度-CSDN博客
YOLO等目标检测模子的非极大值克制NMS和评价指标(Acc, Precision, Recall, AP, mAP, RoI)、YOLOv5中mAP@0.5与mAP@0.5:0.95的寄义_nms yolo-CSDN博客
YOLO系列条记（一）——YOLO先容与衡量指标_yolo one stage-CSDN博客

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

认知篇#4：YOLO评价指标及其数学原理的学习

本帖子中包含更多资源

守听