国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210768594.5 (22)申请日 2022.07.01 (71)申请人 东南大学 地址 210096 江苏省南京市玄武区四牌楼 2 号 (72)发明人 王田浩 夏思宇 (74)专利代理 机构 南京众联专利代理有限公司 32206 专利代理师 薛雨妍 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/766(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) (54)发明名称 一种基于深度学习的通用椭圆目标检测方 法 (57)摘要 本发明公开了一种基于深度学习的通用椭 圆目标检测方法, 该方法包括: 构建通用椭圆目 标检测器; 建立基于Anchor ‑free目标检测的卷 积神经网络结构; 使用通用椭圆目标检测数据集 训练建立好的卷积神经网络的参数; 将待检测图 片输入到训练好的卷积神经网络中检测, 输出检 测结果图。 本发明通过Anchor ‑free目标检测卷 积神经网络能够实现自动、 准确地对任意椭圆 目 标进行检测 和定位。 权利要求书2页 说明书3页 附图1页 CN 115049848 A 2022.09.13 CN 115049848 A 1.一种基于深度学习的通用椭圆目标检测方法, 其特 征在于, 该 方法包括以下步骤: 步骤(1)构建通用椭圆目标检测数据集; 步骤(2)建立基于Anc hor‑free目标检测的卷积神经网络结构; 步骤(3)使用通用椭圆目标检测数据集训练建立 好的卷积神经网络的参数; 步骤(4)将待检测图片输入到训练好的卷积神经网络中检测, 输出检测结果图。 2.如权利要求1所述的一种基于深度 学习的通用椭圆目标检测方法, 其特征在于: 所述 步骤(1)中构建通用椭圆目标检测数据集, 该数据集包含真实场景中的多种类别的椭圆物 体, 共537张图片。 3.如权利要求1所述的一种基于深度 学习的通用椭圆目标检测方法, 其特征在于: 所述 步骤(2)中建立的基于Anchor ‑free目标检测的卷积神经网络结构中, 我们使用灰度化和拉 普拉斯算子的边缘提取作为数据增强方式, 使得模型更加关注目标的形状信息; 在角度参 数回归的损失函数上增加了基于长 短轴比值的权重, 解决了长 短轴比值对角度回归精度的 不利影响; 在损失函数设计上使用了二维高斯分布的Wasserstein距离来计算真实边界框 和预测边界框的相似度, 作为损失函数的一部 分, 提高模型回归精度; 同时使用了二值掩膜 预测分支, 基于多任务学习的硬参数分享的思想, 能够进一步优化模型参数, 提高回归精 度。 4.根据权利要求3所述的一种基于深度 学习的通用椭圆目标检测方法, 其特征在于: 所 述步骤2中: 在图片输入到模型网络之前, 首先将图片尺寸统一化为512*512, 再按照概率p 进行灰度化和 3*3的拉普拉斯算子边缘提取的数据增强, 然后输入到模型的骨干网络DLA ‑ 34中进行特征提取, 其下采样倍率为4, 即输出特征图尺 寸为输入图尺 寸的1/4, 即128*128, 获取的特征的特征图再分别五条并行的输出头, 分别预测目标的中心 点坐标热图、 长 短轴、 偏移量、 旋转角度以及二 值掩膜图; 在中心点坐标热图回归中, 使用FocalLoss作 为训练时的损失函数进行参数优化, 计算 公式如下: 其中xyc表示其在特征 图中的坐标, α和β 是两个超参数, N是关键点数量, Yxyc表示真实 标签, 表示预测值。 真实标签使用高斯核计算, 即中心点值为1, 越远离中心点值越小。 将输出头输出的128*128的中心点坐标热图先通过非极大抑制获取局 部最大值, 再根据预 测分数的大小, 选出最大的K个点作为预测目标的中心点。 在长短轴回归和偏移量回归中, 均使用smooth ‑L1 Loss作为训练时的损失函数进行参 数优化, 计算公式如下: 其输出头输出的是K组长短轴和偏移量; 偏移量是用来解决模型在下采样过程中所带 来的精度损失。 在旋转角 度回归中, 也使用了smooth ‑L1 Loss作为训练时的损失函数进行参数优化;权 利 要 求 书 1/2 页 2 CN 115049848 A 2在此基础上, 本模型使用了基于长 短轴比值的权重, 在损失计算时与角度损失函数相; 具体 实现为, 给定一个阈值, 当目标预测长 短轴的比值大于该阈值时, 将权重置为2, 否则权重置 为1; 从而 使模型重 视扁长形椭圆目标的旋转角度回归精度, 整体 计算公式如下: 其中, wθ为基于长短轴比值的权重, R为长短轴比值的阈值, θp为旋转角 度的预测值, θg 为旋转角度的真实值; 在二值掩膜预测中, 使用二值交叉熵作为损 失函数进行参数优化, 其真实标签是根据 椭圆目标五参数 的真实标签变换到1/4原尺寸而绘制的一系列椭圆掩膜; 其输出头输出 的 特征图为 128*128, 每个点的值为1或0, 1表 示目标区域, 0表 示非目标背景区域。 该分支不直 接参与椭圆参数 的回归, 而是基于多任务学习的硬参数分享对模型参数进一步优化, 间接 提高检测精度; 此外在损失函数计算中, 本模型还增加了基于二维高斯分布的Wasserstein距离的损 失函数; 二 维高斯分布的由均值和协方差来表示, 对于椭圆参数到二维 高斯分布的转换, 首 先均值等于中心点的横纵坐标, 协方差矩阵可通过椭圆的长短轴以及旋转角度来表示, 具 体计算方法如下: μ=[x,y] 其中, μ和Σ表示二维高斯分布的均值和协方差, x和y是椭圆中心点横纵坐标, a和b是 椭圆长短轴, θ是椭圆旋转角度; 之后通过Wasserstein距离计算真实边界框与预测边界框 的拟合程度, 计算公式如下: 其中 μ1, Σ1和 μ2, Σ2分别为预测值和真实值的二维高斯分布的均值和协方差矩阵。权 利 要 求 书 2/2 页 3 CN 115049848 A 3
专利 一种基于深度学习的通用椭圆目标检测方法
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-24 00:42:59
上传分享
举报
下载
原文档
(645.1 KB)
分享
友情链接
GB-T 20945-2023 信息安全技术 网络安全审计产品技术规范.pdf
JR-T 0036-2016 再保险数据交换规范.pdf
T-WHDQHX 004—2022 电气成套设备制造业数字化车间 通用要求.pdf
GB-T 28625-2012 彩色复印机测试版.pdf
DB34-T 4757-2024 固定污染源废气挥发性有机物监测技术规范 安徽省.pdf
GB-T 29156-2012 金属复合装饰板材生产生命周期评价技术规范 产品种类规则.pdf
GB-T 43290-2023 电子商务逆向物流通用服务规范.pdf
GB-T 16620-2023 林木育种及种子管理术语.pdf
GB-T 40018-2021 信息安全技术 基于多信道的证书申请和应用协议.pdf
GB-T 43044-2023 数码照相机 规格指南.pdf
T-CEC 699—2022 换电式纯电动重型卡车电池箱连接器.pdf
GB-T 28827.7-2022 信息技术服务 运行维护 第7部分:成本度量规范.pdf
GB-T 39335-2020 信息安全技术 个人信息安全影响评估指南.pdf
T-NIFA 28—2023 网上银行服务 应用安全规范.pdf
GB-T 32915-2016 信息安全技术 二元序列随机性检测方法.pdf
GB 10395.2-2010 农林机械 安全 第2部分:自卸挂车.pdf
GB-T 43046-2023 信息技术服务 应对突发公共安全事件的信息技术应急风险管理.pdf
DB4405-T 197—2019 近江牡蛎养殖技术操作规程 汕头市.pdf
GB-T 31506-2022 信息安全技术 政务网站系统安全指南.pdf
DB11-T 1595-2018 生态清洁小流域初步设计编制规范 北京市.pdf
1
/
7
评价文档
赞助2元 点击下载(645.1 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。