目标检测-图片视频识别系统

服务近2000家企业，依托一系列实践中打磨过的技术和产品，根据企业的具体业务问题和需求，针对性的提供各行业大数据解决方案。

目标检测-图片视频识别系统
来源：未知　时间：2021-41-9　浏览次数：211次

目标检测（Object Detection）的任务是找出图像中所有感兴趣的目标（物体），确定它们的类别和位置，是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态，加上成像时光照、遮挡等因素的干扰，目标检测一直是计算机视觉领域最具有挑战性的问题。该软件实现了目标视频检测过程，训练好的模型可直接做预测，也可以做二次训练

一、工程内容

这个程序是基于tensorflow实现Fast-RCNN功能。

二、开发环境

Ubuntu16.04（i5-7500 + GTX 1070Ti ） + python3.5 + tensorflow1.3 + cv2 + roi-pooling

roi-pooling ：是需要额外安装的op

　github地址为：https://github.com/deepsense-ai/roi-pooling

　安装的必须条件：linux系统 + GPU

　安装过程的坑：注意makefile文件中cuda的安装路径是否与自己电脑上的安装路径一致

　　　　　　　　tensorflow1.4以上版本还可能涉及到动态库的问题，不过网上都有解决方案

三.数据集

通用数据集：

　数据集来源：北京理工大学BIT车辆数据集（1万张照片、6类车辆）

　数据集数量：从1万张中选取了2100张，每一类350张。

　数据集制作：由于数据源没有带xml文件，带了mat文件，所以重新制作了PASCAL VOC格式的xml标注文件。

　数据集下载地址：https://pan.baidu.com/s/1X-8E5eGldAfTHdyJXlFllA 密码：ivq8

自己用的数据集：接触网6C成像图（由于在车数据集上的实验结果被误删了、所以下面用此数据集的实验结果展示）

四、程序说明

1、config.py---网络定义、训练与数据处理所需要用到的参数

2、Net.py---用于定义Alexnet_Net模型

4、Data.py---用于处理数据的各种方法

5、train.py---用于各类模型的训练与测试、主函数

6、selectivesearch.py---选择性搜索代码

五、文件夹说明

1、Data：

　Annotations--存放图片标注的xml文件（手动存放）

　Images --存放用于训练与测试的图片（手动存放）

　Processes --存放处理xml文件之后形成图片label信息的npy文件（程序执行）

　all_list.txt --存放图片序号用于处理与序号所对应的xml文件，以形成label信息的npy文件（手动存放）

　test_list.txt --存放测试图片序号（手动存放）

　train_list.txt --存放训练图片序号（手动存放）

2、Output --存放训练过程的config文件、log文件、weight文件（程序执行）

3、Test_output 图片 -- 存放测试图片的测试结果（程序执行）

4、train_alexnet

　　存放Alexnet的在Imagenet上训练好的权重，用这个权重来finetune （手动存放）

六、实验结果展示

自己用的数据集：接触网6C成像图（由于在车数据集上的实验结果被误删了、所以下面用此数据集的实验结果展示

（只是为了验证自己写的程序没有错误，并未经过十分深入的调参，所以结果的准确度应该可用再提升）

检测结果：

![result_2](https://github.com/Liu-Yicheng/Fast-RCNN/raw/master/result/2.jpg)

特征层可视化结果（第五个卷积层经过relu后第49张特征图）：

![result_1](https://github.com/Liu-Yicheng/Fast-RCNN/raw/master/result/1.jpg)

![result_3](https://github.com/Liu-Yicheng/Fast-RCNN/raw/master/result/3.jpg)

七、程序问题

1.由于此次的程序大体上都是自己编写，代码或许不太健壮。在自己的环境下运行过没有问题，如在其他环境下不能运行应该只需要微调下

2.程序使用流程：

　　　　---------------------训练过程---------------------------

　　　　A.将需要训练与测试的图片放入Data/Images文件夹，将XML文件放入Data/Annotation文件夹

　　　　B.将要训练与测试图片的编号写入all_list,训练图片的编号写入train_list，测试图片的编号写入test_list

　　　　C.下载Alexnet预训练权重，放入Alexnet_weight文件夹。

　　　　　权重下载地址：https://pan.baidu.com/s/1XhEpG_dNeUlnegH4zYxgrw 密码：l7um

　　　　D.针对自己的项目修改config文件中的参数

　　　　E.将train.py中main函数的train改为True，开始训练

　　　　----------------------测试过程---------------------------

　　　　A.修改config中的weight_file改为你训练输出的权重文件地址

　　　　B.修改train.py文件第29行为：

　　　　　　self.variable_to_restore = slim.get_variables_to_restore((exclude=[])

　　　　C.将train.py中main函数的train改为False，开始测试

3.Fast_RCNN检测的准确度与提取的候选框质量有很大的关系、因此提取候选框的算法至关重要。

　在我的数据集上selectivesearch提取候选框的效果并不好所以自己根据自己数据集的特点重新

　写了一个候选框提取的算法，以此达到了还算不错的效果。这里还是放上了selectivesearch的提取算法。
软件下载 目标检测-图片视频识别系统1 http://filesearch.ixiera.com/XHEasyTST1.zip
目标检测-图片视频识别系统2 http://filesearch.ixiera.com/XHEasyTST2.zip

上一篇: 大数据爬虫系统软件
下一篇: wsdm智慧农业物联网应用平台软件下载

目标检测-图片视频识别系统 来源：未知 时间：2021-41-9 浏览次数：211次

目标检测-图片视频识别系统
来源：未知　时间：2021-41-9　浏览次数：211次