(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210568801.2
(22)申请日 2022.05.24
(71)申请人 智慧互通科技股份有限公司
地址 075000 河北省张家口市空港经济技
术开发区一期十号楼
(72)发明人 闫军 纪双西
(51)Int.Cl.
G06V 10/774(2022.01)
G06V 10/25(2022.01)
G06V 10/42(2022.01)
G06V 10/762(2022.01)
G06F 16/538(2019.01)
(54)发明名称
一种基于目标检测学习算法的图片数据筛
选方法及系统
(57)摘要
本发明公开一种基于目标检测学习算法的
图片数据筛选方法及系统, 涉及智能停车管理领
域, 包括: 利用修正后的目标检测模型训练方法
和初始标注的图片数据集, 获取基本目标检测模
型, 并在此基础上利用划分的测试集根据图片内
容识别准确度信息进行图片级别不确定性定义,
以此获取初步的图片筛选指标; 进一步当一次筛
选图片数据量远大于预期标注数据量时, 再通过
图片特征聚类的方式进一步进行二次图片筛选,
以保证同等数据量条件下筛选图片内容具有多
样性分布; 通过几次循环迭代更新模型, 可最终
实现新增数据标注量和模型准确度的能效比提
升。
权利要求书3页 说明书8页 附图2页
CN 114898182 A
2022.08.12
CN 114898182 A
1.一种基于目标检测学习算法的图片数据筛 选方法, 其特 征在于, 所述方法包括:
将初始待标注图片数据集划分为训练集、 验证集、 测试集;
通过所述训练集和所述验证集对初始目标检测模型进行训练, 获取目标检测模型;
根据所述测试集、 所述目标检测模型的综合评分指标、 所述目标检测模型的预测结果,
确定所述初始待标注图片数据集对应的综合图片不确定性指标, 并根据所述综合图片不确
定性指标对所述初始待标注图片数据集进行筛 选;
通过所述目标检测模型和预置图片特征聚类算法对筛选后的待标注图片数据进行二
次筛选;
将所述进行二 次筛选后的待标注图片数据集通过所述目标检测模型进行预测, 获取预
标注标签;
根据所述预标注标签对待标注图片数据集进行修正, 并通过修正后的待标注图片数据
集更新所述训练集后, 训练所述目标检测模型。
2.根据权利要求1所述的一种基于目标检测学习算法的图片数据筛选方法, 其特征在
于, 所述根据所述测试集、 所述目标检测模型的综合评 分指标、 所述目标检测模 型的预测结
果, 确定所述初始待标注图片数据集对应的综合图片不确定性指标的步骤 包括:
通过所述综合评分指标的上下限阈值获取两组预测结果, 并根据两组预测结果获取图
片级目标框 定位不稳定性指标;
通过所述综合评分指标和目标检测模型在预期最终输出条件下的评分阈值获取的预
测结果, 获取图片级分类预测不稳定性指标;
根据所述测试集的标注信息, 获取所述预测结果相对于标注信息的图片级平均准确
率;
通过所述图片级目标框定位不稳定性指标、 图片级分类预测不稳定性指标以及图片级
平均准确率, 确定综合图片不确定性指标。
3.根据权利要求2所述的一种基于目标检测学习算法的图片数据筛选方法, 其特征在
于, 所述通过所述图片级目标框定位不稳定性指标、 图片级分类预测不稳定性指标以及图
片级平均准确 率, 确定综合图片不确定性指标, 并根据所述综合图片不确定性指标对所述
初始待标注图片数据集进行筛 选的步骤 包括:
根据所有测试集图片分别对应的图片级目标框定位不稳定性指标、 图片级分类预测不
稳定性指标以及图片级平均准确率, 获取 各个图片分别对应的综合图片不确定性指标;
获取综合图片不确定性指标大于预设阈值的图片作为筛选后的初始待标注图片数据
集。
4.根据权利要求1或2所述的一种基于目标检测学习算法的图片数据筛选方法, 其特征
在于, 所述通过所述目标检测模型和预置图片特征聚类算法对筛选后的待标注数据进 行二
次筛选的步骤 包括:
将所述待标注图片数据输入到所述目标检测模型, 提取模型FPN层输出的多尺度特征
图, 并将所述多尺度特 征图进行池化 拼接后得到每 个待标注图片对应的特 征向量;
将所述所有图片的特征向量组合的特征向量矩阵进行压缩得到预期 维度的特征表示,
并通过对所有图片的特 征表示集合进行聚类 计算, 获取 各个图片的聚类簇类别;
根据各个图片的聚类簇类别对所述待标注图片数据集进行二次筛 选。权 利 要 求 书 1/3 页
2
CN 114898182 A
25.根据权利要求4所述的一种基于目标检测学习算法的图片数据筛选方法, 其特征在
于, 所述根据各个图片的聚类簇类别对所述待标注图片数据集进行二次筛 选的步骤 包括:
根据各个图片的聚类簇类别标签,计算经过第 一次筛选后的数据集中各个聚类簇 内数
据量占总数据量的比值以及各个簇内二次筛 选数据量;
根据各个聚类簇内数据分别对应的综合图片不确定性指标, 从大到小选取预置个数的
数据进行整合作为 最终的二次筛 选数据集。
6.一种基于目标检测学习算法的图片数据筛 选系统, 其特 征在于, 所述系统包括:
划分单元, 用于将初始待标注图片数据集划分为训练集、 验证集、 测试集;
获取单元, 用于通过所述训练集和所述验证集对初始目标检测模型进行训练, 获取目
标检测模型;
筛选单元, 用于根据 所述测试集、 所述目标检测模型的综合评分指标、 所述目标检测模
型的预测结果, 确定所述初始待标注图片数据集对应的综合图片不确定性指标, 并根据所
述综合图片不确定性指标对所述初始待标注图片数据集进行筛 选;
所述筛选单元, 还用于通过所述目标检测模型对筛选后的待标注图片数据进行二 次筛
选;
所述获取单元, 还用于将所述进行二 次筛选后的待标注图片数据集通过所述目标检测
模型进行预测, 获取预标注标签; 根据所述预标注标签对待标注图片数据集进 行修正, 并通
过修正后的待标注图片数据集更新所述训练集后, 训练所述目标检测模型。
7.根据权利要求6所述的一种基于目标检测学习算法的图片数据筛选系统, 其特征在
于,
所述筛选单元, 具体用于通过所述综合评分指标的上下限阈值获取两组预测结果, 并
根据两组预测结果获取图片级目标框定位不稳定性指标; 通过所述综合评 分指标和目标检
测模型在预期最 终输出条件下的评 分阈值获取的预测结果, 获取图片级分类预测不稳定性
指标; 根据所述测试集的标注信息, 获取所述预测结果相对于标注信息的图片级平均准确
率; 通过所述图片级目标框定位不稳定性指标、 图片级分类预测 不稳定性指标以及图片级
平均准确率, 确定综合图片不确定性指标。
8.根据权利要求6所述的一种基于目标检测学习算法的图片数据筛选系统, 其特征在
于,
所述筛选单元, 具体还用于根据所有测试集图片分别对应的图片级目标框定位不稳定
性指标、 图片级分类预测不稳定性指标以及图片级平均准确 率, 获取各个图片分别对应的
综合图片不确定性指标; 获取综合图片不确定性指标大于预设阈值的图片作为筛选后的初
始待标注图片数据集。
9.根据权利要求6或7所述的一种基于目标检测学习算法的图片数据筛选系统, 其特征
在于, 所述筛选单元, 具体还用于将所述待标注图片数据输入到所述目标检测模 型, 提取模
型FPN层输出 的多尺度特征图, 并将所述多尺度特征图进行池化拼接后得到每个待标注图
片对应的特征向量; 将所述所有图片的特征向量组合的特征向量矩阵进 行压缩得到预期维
度的特征表示, 并通过对所有图片的特征表示集合进行聚类计算, 获取各个图片的聚类簇
类别; 根据各个图片的聚类簇类别对所述待标注图片数据集进行二次筛 选。
10.根据权利要求9所述的一种基于目标检测学习算法的图片数据筛选系统, 其特征在权 利 要 求 书 2/3 页
3
CN 114898182 A
3
专利 一种基于目标检测学习算法的图片数据筛选方法及系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:32:32上传分享