国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210751884.9 (22)申请日 2022.06.29 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 谢群义 钦夏孟 李煜林 姚锟  (74)专利代理 机构 北京猷德知识产权代理有限 公司 16084 专利代理师 范继晨 (51)Int.Cl. G06V 10/44(2022.01) G06T 5/00(2006.01) G06T 5/50(2006.01) G06N 20/00(2019.01) (54)发明名称 训练模型的方法、 装置、 电子设备及存储介 质 (57)摘要 本公开提供了训练模型的方法、 装置、 电子 设备及存储介质, 涉及人工智 能技术领域, 尤其 涉及深度学习、 图像处理、 计算机视觉技术领域, 可应用于光学字符识别等场景。 具体实现方案 为: 对原始图像进行掩码处理, 得到掩码图像; 基 于预设模型对掩码图像进行编码处理, 得到编码 序列; 基于编码序列进行图像重建, 得到重建图 像; 基于重建图像及原始图像对 预设模型的模型 参数进行调整, 得到目标模型。 权利要求书3页 说明书10页 附图8页 CN 115294349 A 2022.11.04 CN 115294349 A 1.一种训练模型的方法, 包括: 对原始图像进行掩码处 理, 得到掩码图像; 基于预设模型对所述掩码图像进行编码处 理, 得到编码序列; 基于所述编码序列进行图像重建, 得到 重建图像; 基于所述重建图像及所述原始图像对所述预设模型的模型参数进行调整, 得到目标模 型。 2.根据权利要求1所述的方法, 其中, 所述对原始图像进行掩码处理, 得到掩码图像, 包 括: 将所述原 始图像划分为多个切块, 其中, 所述多个切块之间不重合; 获取所述原始图像所对应的掩蔽比, 其中, 所述掩蔽比表征所述原始图像的遮挡部分 与未遮挡部分的比值; 基于所述掩蔽比对所述多个切块进行随机掩码处 理, 得到所述掩码图像。 3.根据权利要求1所述的方法, 其中, 所述基于预设模型对所述掩码图像进行编码处 理, 得到编码序列, 包括: 在所述预设模型中对所述掩码图像进行区域划分, 得到多个子图像; 对所述多个子图像进行线性特 征提取, 得到图像特 征; 对所述图像特 征进行多次合并处 理, 得到所述编码序列。 4.根据权利要求3所述的方法, 其中, 所述基于所述编码序列进行图像重建, 得到重建 图像, 包括: 对所述编码序列进行 上采样处 理, 得到目标 特征向量; 基于所述目标 特征向量进行图像重建, 得到所述重建图像。 5.根据权利要求4所述的方法, 其中, 所述对所述编码序列进行上采样处理, 得到目标 特征向量, 包括: 获取多个合并阶段对应的合并特征以及所述多个合并阶段对应的阶段标识, 其中, 所 述多个合并阶段用于对所述图像特 征进行多次合并; 基于所述合并特征以及所述阶段标识对所述编码序列进行上采样处理, 得到所述目标 特征向量。 6.根据权利要求5所述的方法, 其中, 所述基于所述合并特征以及所述阶段标识对所述 编码序列进行 上采样处 理, 得到所述目标 特征向量, 包括: 按照所述多个合并阶段的合并顺序对应的逆向顺序, 对所述阶段标识进行排序, 得到 排序后的阶段 标识; 获取与所述 排序后的阶段 标识对应的合并特 征; 对所述编码序列进行 上采样处 理, 得到第一编码序列; 对所述合并特征与所述第一编码序列进行连接处理, 得到第二编码序列, 并将所述编 码序列更新 为所述第二编码序列; 直至所述多个合并阶段的合并特征均与 所述第一编码序列 连接, 并基于所述第 二编码 序列生成所述目标 特征向量。 7.根据权利要求1所述的方法, 其中, 所述基于所述重建图像及所述原始图像对所述预 设模型的模型参数进行调整, 得到目标模型, 包括:权 利 要 求 书 1/3 页 2 CN 115294349 A 2计算所述重建图像与所述原 始图像的差值; 对所述差值的绝对值进行求和计算, 得到所述重建图像及所述原始图像之间的损失 值; 响应于所述损失值大于预设值, 对所述预设模型的模型参数进行调整; 响应于所述损失值小于或等于所述预设值, 确定所述预设模型为所述目标模型。 8.根据权利要求1所述的方法, 在基于所述重建图像及所述原始图像对所述预设模型 的模型参数进行调整, 得到目标模型之后, 所述方法还 包括: 获取目标场景 所对应的训练集; 基于所述训练集对所述目标模型的模型参数进行调整, 得到所述目标场景对应的识别 模型。 9.一种训练模型的装置, 包括: 掩码模块, 用于对原 始图像进行掩码处 理, 得到掩码图像; 编码模块, 用于基于预设模型对所述掩码图像进行编码处 理, 得到编码序列; 重建模块, 用于基于所述编码序列进行图像重建, 得到 重建图像; 调整模块, 用于基于所述重建图像及所述原始图像对所述预设模型的模型参数进行调 整, 得到目标模型。 10.根据权利要求9所述的装置, 其中, 所述掩码模块包括: 第一划分模块, 用于将所述原始图像划分为多个切块, 其中, 所述多个切块之间不重 合; 第一获取模块, 用于获取所述原始图像所对应的掩蔽比, 其中, 所述掩蔽比表征所述原 始图像的遮挡部分与未遮挡部分的比值; 第一掩码模块, 用于基于所述掩蔽比对所述多个切块进行随机掩码处理, 得到所述掩 码图像。 11.根据权利要求9所述的装置, 其中, 所述编码模块包括: 第二划分模块, 用于在所述预设模型中对所述掩码图像进行区域划分, 得到多个子 图 像; 特征提取模块, 用于对所述多个子图像进行线性特 征提取, 得到图像特 征; 特征合并模块, 用于对所述图像特 征进行多次合并处 理, 得到所述编码序列。 12.根据权利要求1 1所述的装置, 其中, 所述重建模块包括: 第一采样模块, 用于对所述编码序列进行 上采样处 理, 得到目标 特征向量; 第一重建模块, 用于基于所述目标 特征向量进行图像重建, 得到所述重建图像。 13.根据权利要求12所述的装置, 其中, 所述第一采样模块包括: 第二获取模块, 用于获取多个合并阶段对应的合并特征以及所述多个合并阶段对应的 阶段标识, 其中, 所述多个合并阶段用于对所述图像特 征进行多次合并; 第二采样模块, 用于基于所述合并特征以及所述阶段标识对所述编码序列进行上采样 处理, 得到所述目标 特征向量。 14.根据权利要求13所述的装置, 其中, 所述第二采样模块执 行如下步骤: 按照所述多个合并阶段的合并顺序对应的逆向顺序, 对所述阶段标识进行排序, 得到 排序后的阶段 标识;权 利 要 求 书 2/3 页 3 CN 115294349 A 3

PDF文档 专利 训练模型的方法、装置、电子设备及存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 训练模型的方法、装置、电子设备及存储介质 第 1 页 专利 训练模型的方法、装置、电子设备及存储介质 第 2 页 专利 训练模型的方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:43:03上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。