国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210138123.6 (22)申请日 2022.02.15 (71)申请人 南通大学 地址 226019 江苏省南 通市崇川区啬园路9 号 (72)发明人 邵叶秦 曹秋阳 李登亮 宋锦伟 高瞻 施佺 (74)专利代理 机构 南京瑞弘专利商标事务所 (普通合伙) 32249 专利代理师 许海洲 (51)Int.Cl. G06V 10/40(2022.01) G06V 10/762(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01)G06T 3/40(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于注意力YOLOv5模型的自动水果识 别方法 (57)摘要 本发明公开了一种基于注意力YOLOv5模型 的自动水果识别方法, 包括以下步骤: 1、 将数据 集的原始图像进行预处理; 2、 输入主干网络提取 特征, 并使用SENet注意力模块得到一个与通道 对应的一维向量作为评价 分数; 3、 将评价 分数通 过乘法操作作用到feature map的对应通道上, 得到用于水果识别的有效特征; 4、 经过Feature Pyramid Networks和Path Aggregation Network结构将特征融合; 5、 对图像特征进行预 测, 使用CIOU 考虑目标框与预测框的高宽比和中 心点之间的关系, 提升预测精度, 根据大、 中、 小 目标分别输出识别结果。 权利要求书2页 说明书6页 附图2页 CN 114494710 A 2022.05.13 CN 114494710 A 1.一种基于注意力YOLOv5模型的自动水果识别方法, 其特 征在于, 包括以下步骤: 步骤1、 将数据集的原 始图像进行 预处理; 步骤2、 输入主干网络提取特征, 并使用SENet注意力模块得到一个与通道对应的一维 向量作为评价分数; 步骤3、 将评价分数通过乘法操作作用到feature map的对应通道上, 得到用于水果识 别的有效特 征; 步骤4、 经 过特征金字塔和路径聚合网络结构将特 征融合; 步骤5、 对图像特征进行预测, 使用CIOU考虑目标框与预测框的高宽比和中心点之间的 关系, 提升预测精度, 根据大、 中、 小目标分别输出识别结果。 2.根据权利 要求1所述的基于注意力YOLOv5模型的自动水果识别方法, 其特征在于, 所 述步骤1中使用Mosaic数据增强的方式进行图像拼接 。 3.根据权利 要求2所述的基于注意力YOLOv5模型的自动水果识别方法, 其特征在于, 所 述步骤1中对数据集的尺寸归一化处理, 对原始图像进 行自适应填充最少的灰度值, 具体包 括以下步骤: 步骤1.1、 设置图像缩放比例; 令原始图像为A ×B, 缩放至a ×a, 其中A为原始图像的宽, B为原始图像的高, a为缩放后图像的宽, 缩放后图像宽和高相等, 将缩放后图像的宽高除以 原始图像相应宽高, 得到2个系数, 取其小的系数; 步骤1.2、 设置缩放后的尺寸; 将原 始图片宽高乘以最小的系数, 则宽为C, 高为D; 步骤1.3、 设置灰边的填充值; 先将C减去D, 并采用取余的方式得需要填充的像素值(C ‑ D)%E=F, 其中E=2n, n是网络经过的下采样次数, 两端各 个像素; 在测试过程中采用灰色 填充, 训练过程使用原 始的resize操作以提高物体的检测、 计算速度。 4.根据权利 要求1所述的基于注意力YOLOv5模型的自动水果识别方法, 其特征在于, 所 述主干网络是CS PDarknet‑53, 能增强卷积网络的学习能力, 降低内存消耗。 5.根据权利 要求1所述的基于注意力YOLOv5模型的自动水果识别方法, 其特征在于, 步 骤2所述SENet 注意力模块操作过程包括以下步骤: 步骤2.1、 使用全局平均池化作为Sque eze操作; 步骤2.2、 使用两个全连接层得到通道间的相关性, 同时减少参数与计算 量; 步骤2.3、 通过Sigmo id归一化权重; 步骤2.4、 通过Scale操作将归一 化后的权 重作用在原 始通道的特 征上。 6.根据权利 要求1所述的基于注意力YOLOv5模型的自动水果识别方法, 其特征在于, 所 述步骤5中CIOU将真实框与预测框之间的距离、 重叠率、 边框尺度以及惩罚因子均考虑进 去, 使得目标边框回归更加稳定; CIOU公式: 其中, ρ2(b, bgt)即预测框与真实框中心点之间的欧式距离d, c表示 同时包含真实框与 预测框最小闭包矩形框的对角线距离 。 惩罚项α v中α 的公式如下 所示:权 利 要 求 书 1/2 页 2 CN 114494710 A 2惩罚项α v中v的公式如下 所示: 其中, wgt表示真实框的宽, hgt表示真实框的高, w表示预测框的宽, h表示预测框的高; CIOU在回归时l oss的计算公式如下 所示: 目标框与预测框重合时, CIOU值不相同; c值相同时, 通过目标框与预测框中心点的欧 式距离与对角线的比值d, 度量两者 位置关系, 使损失函数收敛。权 利 要 求 书 2/2 页 3 CN 114494710 A 3
专利 一种基于注意力YOLOv5模型的自动水果识别方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:32:14
上传分享
举报
下载
原文档
(626.5 KB)
分享
友情链接
GB-T 37950-2019 信息安全技术 桌面云安全技术要求.pdf
DB44-T 2189.2-2019 移动终端信息安全 第2部分:敏感信息安全等级保护与测评 广东省.pdf
商用密码应用安全性测评机构管理办法(试行).pdf
NIST 软件开发安全框架SSDF v1.0 2020 英文版.pdf
GB-T 12230-2023 通用阀门 不锈钢铸件技术条件.pdf
ISO SAE 21434 Road vehicles— Cybersecurity engineering.pdf
国家医疗保障局关于加强网络安全和数据保护工作的指导意见.pdf
创业黑马 aigc安全研究报告新版.pdf
GB-T 42574-2023 信息安全技术 个人信息处理中告知和同意的实施指南.pdf
SN-T 4243-2015 铜精矿中金、银、铂、钯、砷、汞、镉、镓、铟、锗、硒、碲、铊、镧的测定 电感耦合等离子体质谱法.pdf
GB-T 30271-2013 信息安全技术 信息安全服务能力评估准则.pdf
GB-T 38249-2019 信息安全技术 政府网站云计算服务安全指南.pdf
DB23-T 2844—2021 电子政务云平台安全管理规范 黑龙江省.pdf
GB-T 22739-2008 地理标志产品 建莲.pdf
GB-T 35437-2017 星载光电跟踪成像系统通用规范.pdf
GB-T 21837-2023 铁磁性钢丝绳电磁检测方法.pdf
信创云安全建设实践.pdf
T-CEC 621.1—2022 电力系统外绝缘用硅橡胶老化评估及修复技术 第1 部分:硅橡胶清洗修复剂技术条件.pdf
GM-T 0097-2020 射频识别电子标签统一名称解析服务安全技术规范.pdf
GB-T 34587-2017 钢质冷藏集装箱修理技术要求.pdf
1
/
3
11
评价文档
赞助2.5元 点击下载(626.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。