Faster-rcnn
原理
conver layer原图resize到800x600, Conv layer出来(50x38x256)的输出
RPN
从conv layer出来后每一个像素点配9个anchor;上面的分之经过1x1卷积形成50x38x18的张量,channel维度上每两个点代表一个anchor,分表表示前景与背景;
下一个分支经过1x1卷积形成50x38x36的张量,channel维度上每四个点代表一个anchor,用来回归位置的准确性,输出的anchor是(x,y,w,h), GT是($x_a,y_a,w_a,h_a$),通过线性映射使得两者比较接近,需
...