一-YOLO algorithm

把输入的图片分割成3X3个格子或19X19个格子,每个格子进行检测输出八个特征,3X3就输出3X3X8个向量。YOLO算法的优点是不需要一个算法跑很多次。相反这是单次卷积实现,在处理计算时很多步骤都是共享的,而且运行速度非常快可以达到实时识别。

对象中点的坐标在哪个格子就分配到哪个格子,因为对象可能横跨多个格子。

二、YOLO算法用非极大值抑制可以使输出更好

基本思想就是高亮出(留下)交叉比最大值的,去掉比较小的边框即去掉那些跟高亮的边框重叠率很高的边框,所以就认为最大值的边框就是物体。

二、YOLO算法检测两个对象中心点重合时,用anchor box算法

anchor box 1表示行人,anchor box2表示汽车,如果两个物体的形状都是anchor box1,那么这种方法就不能用,而是需要引入另外一种打破僵局的方法,实际上这种情况很少。