论文总结:《基于人员再识别的综合管廊智慧监管系统》

论文的结构

这是一篇对现有的综合管廊智慧监管系统的分析的论文。


背景:综合管廊一般建于地下,因为封闭不好管理,需要大量的摄像仪器来进行监控,大数据技术可以帮助人们摆脱人力监控,高效的获取和处理监测信息。

引用文献:
【1】郑立宁,王建,罗春燕,田强,孙春平.城市综合管廊运营管理系统构建[J].建筑经济,2016,37(10):92-98.DOI:10.14181/j.cnki.1002-851x.201610092
【2】谭飞刚,黄玲,翟聪,刘伟铭,周书仁,刘建.一种用于大型交通枢纽的跨摄像机行人再识别算法研究[J].铁道学报,2017,39(01):76-82.
【3】 TAN Feigang, HUANG Ling, ZHAI Cong, et.al. A Crosscamera Pedestrian Re-identification Algorithm for MajorTransport Hub[J]. Journal of the China Railway Society,2017,39(1):76-82.(in Chinese)
【4】Bedagkar-Gala,Apurva, Shah,Shishir K. A survey of approaches and trends in person re-identification[J].Imageand Vision Computing, 2014, 32(4):270-286.
【5】HUBEL D H, WIESEL T N. Receptive fields and functional architecture of monkey striate cortex[J]. The journal of physiology, 1968, 195(1):215-243.
【6】LECUN Y, BOTTOU L, BENGIO Y, et al. Gradientbasedlearning applied to document recognition[J].Proceedings of the IEEE,1998, 86(11):2278-2324.
【7】JI Shuiwang, XU Wei, YANG Ming, et al. 3D convolutional neural networks for human action recognition[J].IEEE transactions on pattern analysis and machine intelligence, 2013,35(1):221-231.


理论基础

使用卷积神经网络算法,梯度优化算法,加权融合,softmax分类器

论文的主要贡献:提出了融合改进的神经网络算法

一、论文中的图表

论文总结:《基于人员再识别的综合管廊智慧监管系统》
这个图从视频获取,处理,展示三个阶段把系统分为的三个端。
论文总结:《基于人员再识别的综合管廊智慧监管系统》
作为最重要的一个步骤,那就是视频特征识别,算法结构图将特征识别服务端来得到人员识别结果。
论文总结:《基于人员再识别的综合管廊智慧监管系统》
这里的xavier初始化我不是很懂,通过网上搜索解释这个基本思想就是保持输入和输出的方差一致,避免了所有的输出值都为0,使得网络信息能够更好的流动。Fan(in)指第i层神经元个数,Fan(out)指i+1层神经元的个数。
通过使用这种方法能够保证输入变量的变化尺度不变,进而到达最后一层时候不会爆炸或者缩小。

二、什么是卷积?

这个之后应该更加深入的了解,因为他是计算机视觉中重要的一部分。首先,卷积是为了方便计算学习而定义的一个概念,是一种抽象的符号。类比加减乘除

三、为什么要引入卷积神经网络

前馈神经网路中的,前一层的神经网络 和后一层的神经网络都有连接,这样就会造成参数太多,容易导致过拟合。因此就要用卷积的局部连接来代替全连接。

四、什么是滤波器

滤波器会识别卷积层中特定的某些特征,每个滤波器会滑动卷积上一层的特征图,在卷积的过程中滤波器的参数是不变的且共享的。
滤波器是一个矩阵,大小为m*n是用来检测图像中特定特征,不同的滤波器有不同的参数。
CNN可以自动学习滤波器,调整滤波器的参数。下图是每个卷积层额特征映射计算??这里我还不太懂。
论文总结:《基于人员再识别的综合管廊智慧监管系统》
其中⊗表示卷积运算,FMi-1是前一层的特征映射。在第一层,FMi-1代表GEI的原始像素。每个特征图都具有偏差项β,偏差项初始化为零值。
卷积层的**函数?
**函数解决非线性问题,把**的神经元的特征通过函数保留并映射到下一层
这里的卷积层**函数选用的是HyperTan函数
论文总结:《基于人员再识别的综合管廊智慧监管系统》
tan函数具有软饱和性,输出以0为中心,收敛速度比sigmoid快,但是无法解决梯度消失的问题。
因为在综合管廊中的行人数据特征相差明显,在循环过程中会不断扩大特征效果并显示出来,所以用tan比较好。。

池化方法

在这篇论文中也提到了池化方法,什么是池化?
池化就是在卷积层后面,通过池化来降低卷积层输出的特征向量值,同时改善结果,不出现过拟合。池化的局域是不重复的,
平均池化:计算图像区域的平均值作为该区域池化后的值。
最大池化:选择图像区域的最大值作为该区域池化后的值。
论文总结:《基于人员再识别的综合管廊智慧监管系统》
在论文中使用最大池化,

论文总结:《基于人员再识别的综合管廊智慧监管系统》
其中MaxP表示最大池操作。在第一个子采样层中,8个合并滤波器中的每一个产生68×68输出。在第4层中,每个池化滤波器产生32×32输出。在第六层中,每一层产生14×14输出。在最后一个池化层中,8个8个池化过滤器中的每一个都产生5×5输出。在完全连接的部分,只有两层(输入层和输出层),其中soft-max是本文的分类器。本文所提架构没有任何隐藏的图层。输入层有200个神经元,其主要来自最后一个池

五、softmax分类

将多个神经元的输出,映射到(0,1)区间内,可以看成概率来进行理解,从而来进行多分类。总结来说就是将值通过softmax函数转换为概率值,。

总结

综合管廊规模的扩大带来了非法入侵的风险。采用智慧监管系统对进入综合管廊内部的人员进行识别,是对抗非法入侵的有效方法。本文提出融合改进的卷积神经网络算法(Improved CNN)识别进入管廊内部的人员
论文总结:《基于人员再识别的综合管廊智慧监管系统》
上面是几种算法的比较。

这是第一次自己写读计算机视觉方面的论文做的笔记,因为专业知识欠缺,里面有很多公式还不是很理解。。以后会慢慢补回来。研究生专业是网络空间安全,之前想着做信息安全这方面,后面由于种种原因或者可以说是缘分吧,选择了计算机视觉这个方向。