(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210354367.8
(22)申请日 2022.04.06
(71)申请人 中国人民解 放军陆军工程大 学
地址 210014 江苏省南京市秦淮区后标营
88号
(72)发明人 李阳 王亚鹏 苗壮 王家宝
张睿 李航
(74)专利代理 机构 南京纵横知识产权代理有限
公司 32224
专利代理师 韩红莉
(51)Int.Cl.
G06F 16/53(2019.01)
G06F 16/55(2019.01)
G06V 10/762(2022.01)
G06V 20/70(2022.01)G06V 10/774(2022.01)
(54)发明名称
一种基于等量约束聚类的无监督图像哈希
检索方法及系统
(57)摘要
本发明公开一种基于等量约束聚类的无监
督图像哈希检索方法及系统, 包括: 将数据库图
像输入哈希特征提取网络模型, 得到数据库图像
的二值化哈希码并构建哈希码数据库; 将待检索
图像输入训练获得的哈希特征提取网络模型, 得
到该待检索图像的哈希码, 计算该待检索图像的
哈希码与哈希码数据库中所有二值化哈希码的
汉明距离, 将汉明距离最小的数据库图像作为待
检索图像的检索结果。 本发明利用等量约束聚类
对无标签训练图像进行聚类, 有效避免K ‑Means
聚类算法面临的空聚类和聚类不平衡问题, 提高
硬伪标签标注精度; 利用去噪的软伪标签监督哈
希特征提取网络训练, 充分利用软伪标签挖掘图
像类间关系, 避免硬伪标签造成的过拟合, 提升
哈希编码精度。
权利要求书2页 说明书7页 附图3页
CN 114969404 A
2022.08.30
CN 114969404 A
1.一种基于等 量约束聚类的无监 督图像哈希检索方法, 其特 征在于, 包括:
获取待检索图像;
将数据库图像输入训练获得的哈希特征提取网络模型, 得到数据库图像的二值化哈希
码, 所有数据库图像的二 值化哈希码构成哈希码数据库;
将待检索图像输入训练获得的哈希特征提取网络模型, 得到该待检索图像的哈希码,
计算该待检索图像的哈希码与哈希码数据库中所有二值化哈希码的汉明距离, 将汉明距离
最小的数据库图像作为待检索图像的检索结果。
2.根据权利要求1所述的一种基于等量约束聚类的无监督图像哈希检索方法, 其特征
在于, 训练获得哈希特 征提取网络模型, 包括:
获取无标签训练图像;
利用软伪标签标注方法对无标签训练图像进行标注, 得到无标签训练图像的软伪标
签, 并利用软伪标签去噪方法去除软伪标签的部分噪声标签;
基于得到的去除噪声标签的软伪标签, 预设的损失函数ΛS采用梯度更新对预先构建的
哈希特征提取网络进行参数迭代更新, 满足预设的迭代更新次数后, 获得最终的哈希特征
提取网络模型。
3.根据权利要求2所述的一种基于等量约束聚类的无监督图像哈希检索方法, 其特征
在于, 所述软伪标签标注方法包括:
利用预训练深度网络提取 无标签训练图像的深度特 征;
利用等量约束聚类算法对深度 特征进行聚类, 根据深度 特征所在的聚类簇给无标签训
练图像标注硬伪标签;
基于得到的硬伪标签, 利用训练获得的软伪标签标注网络模型对无标签训练图像进行
软伪标签标注, 得到无 标签训练图像的软伪标签。
4.根据权利要求3所述的一种基于等量约束聚类的无监督图像哈希检索方法, 其特征
在于, 训练获得 软伪标签标注网络模型, 包括:
获取包括带硬伪标签的无 标签训练图像的无 标签训练数据集;
将无标签训练数据集输入预先构建的软伪标签标注网络, 预设的损失函数ΛH采用梯度
更新对预先构建的软伪标签标注网络进行参数迭代更新, 满足预设的的迭代更新次数后输
出获得最终的软伪标签标注网络模型。
5.根据权利要求3所述的一种基于等量约束聚类的无监督图像哈希检索方法, 其特征
在于, 所述等量约束聚类算法为在K ‑Means聚类算法基础上加入了聚类等量约束, 等量约束
聚类算法的目标函数J为:
式中, f表示利用预训练深度网络提取的无标签训练图像的深度特征, Ci表示第i个聚类
簇, ui表示第i个聚类簇的聚类中心, N表示无标签训练图像的数量; k表示无标签训练图像
类别数量, i∈[1,k]。
6.根据权利要求4所述的一种基于等量约束聚类的无监督图像哈希检索方法, 其特征
在于, 所述预设的损失函数ΛH为:权 利 要 求 书 1/2 页
2
CN 114969404 A
2式中,
表示无标签训练图像的硬伪标签;
表示软伪标签。
7.根据权利要求6所述的一种基于等量约束聚类的无监督图像哈希检索方法, 其特征
在于, 所述预设的损失函数ΛS为:
式中,
表示哈希特征提取网络对无标签训练图像的预测概率分布, k表 示无标签训练
图像类别数量, i∈[1,k]。
8.根据权利要求1所述的一种基于等量约束聚类的无监督图像哈希检索方法, 其特征
在于, 所述梯度更新 为:
θ =θ0‑η·g'( θ0),
式中, θ0表示梯度更新前的网络参数, θ表示梯度更新后的网络参数; η表示学习率, 取值
范围为[0,1], g'( θ0)表示哈希特 征提取网络或软伪标签标注网络在 θ0处的梯度。
9.一种基于等 量约束聚类的无监 督图像哈希检索系统, 其特 征在于,
获取模块, 用于获取待检索图像;
哈希码数据库获取模块, 用于将数据库图像输入训练获得的哈希特征提取网络模型,
得到数据库图像的二 值化哈希码, 所有数据库图像的二 值化哈希码构成哈希码数据库;
检索模块, 用于将待检索图像输入训练获得的哈希特征提取网络模型, 得到该待检索
图像的哈希码;
汉明距离计算模块, 用于计算该待检索图像的哈希码与哈希码数据库中所有二值化哈
希码的汉明距离;
结果确定模块, 用于将汉明距离最小的数据库图像作为待检索图像的检索结果。
10.一种基于等量约束聚类的无监督图像哈希检索装置, 其特征在于, 包括处理器及存
储介质;
所述存储介质用于存 储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1~8任一项所述方法的
步骤。
11.计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执行
时实现权利要求1~8任一项所述方法的步骤。权 利 要 求 书 2/2 页
3
CN 114969404 A
3
专利 一种基于等量约束聚类的无监督图像哈希检索方法及系统
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:32:34上传分享