(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210287339.9
(22)申请日 2022.03.22
(71)申请人 重庆大学
地址 400044 重庆市沙坪坝区沙正 街174号
(72)发明人 宋永端 沈志熙 徐赞林 李韵聪
(74)专利代理 机构 重庆晟轩知识产权代理事务
所(普通合伙) 50238
专利代理师 王海凤
(51)Int.Cl.
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/762(2022.01)
G06V 10/774(2022.01)
G06V 10/82(2022.01)
G06K 9/62(2022.01)
(54)发明名称
一种基于改进YOLOv3的轻量化目标检测方
法
(57)摘要
本发明涉及一种基于改进YOLOv3的轻量化
目标检测方法, 该方法包括S1采集包含待检测目
标物的图像数据, 依据VOC2012数据集格式制作
得到训练集, S2对原始YOLOv3网络模型的
backbone进行改进, S3对改进的YOLOv3网络模型
进行训练, S4向训练好的最终改进的YOL Ov3网络
模型输入待检测图像, 输出目标物用外接矩形框
标记并显示。 本发明对传统YOLOv3算法进行轻量
化改进, 在保证其精度和实时性的同时, 将模型
大小减小到3.17MB, 操作 简单, 易于实现, 具有较
高的实用性。
权利要求书1页 说明书6页 附图3页
CN 114707639 A
2022.07.05
CN 114707639 A
1.一种基于改进YOLOv3的轻量 化目标检测方法, 其特 征在于: 包括如下步骤:
S1: 采集包含待检测目标物的图像数据, 使用labelImage工具对所有图像进行标注, 即
在每个图像上采用矩形框标注待检测目标物, 将所有标注后的图像依据VOC2012数据集格
式制作得到训练集;
S2: 构建改进的YOLOv3网络模型, 包括如下两个部分的改进:
S21: 对原始YOLOv3网络模型中 的backbone进行改进得到初步改进的YOLOv3网络模型,
具体如下:
对原始YOLOv3网络模型中的backbone进行剪枝处理, 将原本的1 ‑2‑8‑8‑4残差结构调
整为1‑2‑3‑3‑2稀疏残差结构, 并设置各个稀 疏残差结构的长度因子; 同时限制每个卷积层
的卷积核个数不超过64个;
构建一条包含5个卷积层的卷积支路, 将第一个卷积层的输出作为卷积支路的输入, 并
将卷积支路各层的输出按顺序分别与backbo ne的5个下采样层的输出进行拼接;
构建一条包含3个池化层的池化支路, 将第1个残差结构的输出经过第1池化层处理与
第1个稀疏残差结构的输出进行拼接, 作为第3个下采样层和第2池化层的输入; 将第2池化
层的输出与第2个稀疏残差结构的输出进 行拼接, 作为第4个下采样层和第3池化层的输入;
将第3池化层的输出与第3个稀疏残差结构的输出进行拼接, 作为第5个下采样层的输入;
S22: 对S2 1得到的初步改进的YOLOv3网络模型进行损失函数和后处理模块的改进得到
最终改进的YOLOv3网络模型;
S3: 对S22得到的最终改进的YOLOv3网络模型进行训练:
S31: 采用K ‑means聚类算法对训练集中的标注待检测目标物的矩形框对应的高和宽进
行聚类, 获得需要的锚框尺寸初始值;
S32: 利用训练集中的数据, 采用神经网络进行梯度反向传播的方法对最终改进的
YOLOv3网络模型训练;
S4: 将训练好的最终改进的YOLOv3网络模型载入到嵌入式设备中, 向训练好的最终改
进的YOLOv3网络模 型输入待检测图像, 训练好的最 终改进的YOLOv3网络模 型将检测到的目
标物用外 接矩形框标记并显示。
2.如权利 要求1所述的基于改进YOLOv3的轻量化目标检测方法, 其特征在于: 所述S2中
将原本的残差结构调整为稀疏残差结构的具体步骤如下
当l=2时: 所述 l表示长度因子, 即稀疏残差单 元中输入层的个数;
y2=y0+f1(y0)+f2(f1(y0))
其中y0为稀疏残差模块的输入, f1(y0)和f2(f1(y0))为该稀疏残差模块中卷积层输出特
征图, y2为该稀疏残差模块的输出;
当l=3时:
y3=y0+f1(y0)+f2(f1(y0))+f3(f2(f1(y0)))
其中y0为稀疏残差模块的输入, f1(y0)和f2(f1(y0))、 f3(f2(f1(y0)))为该稀疏残差模块
中卷积层输出 特征图, y3为该稀疏残差模块的输出。
3.如权利要求2所述的基于改进YOLOv3的轻量化目标检测方法, 其特征在于: 所述S22
得到最终改进的YOLOv3网络模型的改进 过程为: 将S2得到的改进的YOLOv3网络模 型的损失
函数调整为CI oU损失函数, 将后处 理模块中NMS类型调整为DI oU‑NMS。权 利 要 求 书 1/1 页
2
CN 114707639 A
2一种基于改进Y OLOv3的轻量化 目标检测方法
技术领域
[0001]本发明涉及 计算机视觉领域, 尤其涉及一种基于改进YOLOv3的轻量化目标检测方
法。
背景技术
[0002]近年来, 计算机科学技术发展迅猛, 计算机处理能力和算法不断取得突破, 自动驾
驶、 工业质检和智能安防等应用不断商业化, 这些技术中都离不开目标检测, 目标检测通过
识别待测物体特征为用户提供各种服务和技术支持。 大型商场使用自动测温系统通过目标
检测算法识别出进入摄像头视野的行人, 再调用红外温度传感器获取行人温度, 这种应用
节约了人力成本减少 了人员接触; 在自动驾驶中, 车辆识别交通信号、 进行路径规划、 避让
车辆和行人, 也都需要目标检测技术提供支持。 目标检测 技术在这些应用场景发挥着无可
替代的作用, 越来越多的科研人员也都聚焦于该 领域。
[0003]随着深度学习在目标识别和检测领域的不断发展, 继AlexNet以来, VGG、
GoogleNet、 ResNet等网络向网络层数更深地方向发展, 以寻求更好的检测精度。 然而, 在目
前许多应用, 如自动驾驶、 疲劳检测、 机器人等受限于集成设备与处理速度, 模型压缩研究
应运而生新的深度神经网络不断提出; 相关研究人员运用增加卷积层数, 增加卷积核的个
数等方法来提取检测目标 的深层次特征; 尽管深度网络模型在许多问题中表现优越, 但实
际应用时受到了时间上和空间上 的制约, 大而深的网络模型运算量巨大, 即使借助于图形
处理器, 也难以嵌入开发在计算资源和存储资源有限的设备上, 时间上也难以满足日常生
活中的许多场景需求; 高性能的计算机生产及维护成本较高, 不适合大量普及推广; 例如传
统的行人检测设备(比如摄像监控头)是将录制的视频上传到远程的大型服务器上进行数
据处理, 因受带宽和传输时延的影响, 无法实时对目标行人进 行有效的识别, 于是在一些特
殊的场合应用比较局限。
发明内容
[0004]针对现有技术存在的上述问题, 本发明要解决的技术问题是: 深度学习的目标检
测算法在嵌入式系统中部署困难的问题。
[0005]为解决上述技术问题, 本发明采用如下技术方案: 一种基于改进YOLOv3的轻量化
目标检测方法, 包括如下步骤:
[0006]S1: 采集包含待检测目标物的图像数据, 使用labelImage工具对所有图像进行标
注, 即在每个图像上采用矩形框标注待检测目标物, 将所有 标注后的图像依据VOC2012数据
集格式制作得到训练集;
[0007]S2: 构建改进的YOLOv3网络模型, 包括如下两个部分的改进:
[0008]S21: 对原始YOLOv3网络模型中的backbone进行改进得到初步改进的YOLOv3网络
模型, 具体如下:
[0009]对原始YOLOv3网络模型中的backbone进行剪枝处理, 将原本的1 ‑2‑8‑8‑4残差结说 明 书 1/6 页
3
CN 114707639 A
3
专利 一种基于改进YOLOv3的轻量化目标检测方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:31:57上传分享