(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210362995.0
(22)申请日 2022.04.08
(65)同一申请的已公布的文献号
申请公布号 CN 114494982 A
(43)申请公布日 2022.05.13
(73)专利权人 华夏文广传媒 集团股份有限公司
地址 100000 北京市朝阳区高井文化园路8
号东亿国际传媒产业园区三期A 座5层
502室A区
(72)发明人 吴新军
(74)专利代理 机构 成都鱼爪智云知识产权代理
有限公司 513 08
专利代理师 杨洪婷
(51)Int.Cl.
G06V 20/40(2022.01)G06V 20/62(2022.01)
G06V 10/74(2022.01)
G06V 10/762(2022.01)
G06V 10/82(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
(56)对比文件
CN 104618 803 A,2015.0 5.13
CN 113010701 A,2021.0 6.22
CN 110837579 A,2020.02.25
CN 114297434 A,202 2.04.08
US 20193 62154 A1,2019.1 1.28
CN 110688526 A,2020.01.14
审查员 刘芳
(54)发明名称
一种基于人工智能的直播视频大数据精准
推荐方法及系统
(57)摘要
本发明公开了一种基于人工智能的直播视
频大数据精 准推荐方法及系统, 涉及数据识别分
析技术领域。 该方法包括: 选取并对基准直播视
频进行识别; 挑选核心基准关键帧图像; 识别得
到核心基准高频词汇; 对待识别直播视频进行识
别; 挑选并对待识别核心关键帧图像进行识别,
得到目标高频词汇; 若至少存在一个核心基准高
频词汇与目标高频词汇相同, 则进行显著性检
测, 基于正负样本采用谱聚类方法进行聚类, 确
定待识别直播视频是否为目标推荐直播视频。 本
发明利用关键帧检测、 代表性关键帧图像选取方
法对直播视频中核心帧图像进行有效选取, 并将
基于OCR的高频词汇匹配方法和聚类方法进行结
合, 有效精准判别, 为用户精准推荐相关视频数
据。
权利要求书3页 说明书9页 附图5页
CN 114494982 B
2022.12.20
CN 114494982 B
1.一种基于人工智能的直 播视频大数据精准推荐方法, 其特 征在于, 包括以下步骤:
获取并统计目标用户的多段历史观看视频数据, 生成并根据统计结果选取一段历史观
看视频数据作为基准 直播视频;
采用关键帧检测方法对基准直播视频进行关键帧图像识别检测, 以得到基准关键帧图
像;
利用代表性关键帧图像选取 方法从基准关键帧图像中挑选得到核心基准关键帧图像;
采用OCR识别方法对核心基准关键帧图像中的词汇进行识别, 得到并统计核心基准高
频词汇;
获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别
检测, 以得到待识别关键帧图像;
利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关键帧
图像;
采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别, 得到并统计目标高频
词汇;
分别判断各个核心基准高频词汇与 各个目标高频词汇是否相同, 若至少存在一个核心
基准高频词汇与目标高频词汇相同, 则对待识别核心关键帧图像进行显著性检测, 以得到
显著核心关键帧图像; 反 之, 则将该 段待识别直 播视频标记为非推荐直 播视频;
将核心基准关键帧图像作为正样本, 选取网络直播平台中目标用户未观看的直播视频
作为负样本;
基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行聚类处理, 得到聚类
结果;
根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频, 将目标
推荐直播视频推送给对应的目标用户。
2.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法, 其特征
在于, 所述利用代表 性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧
图像的方法包括以下步骤:
对基准关键帧图像进行深度自编码;
计算并根据各个 基准关键帧图像自编码后的欧式距离确定核心基准关键帧图像。
3.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法, 其特征
在于, 所述采用OCR识别方法对核心基准关键帧图像中的词汇进 行识别, 得到并统计核心基
准高频词汇的方法包括以下步骤:
采用OCR识别方法对核心基准关键帧图像中的词汇进行识别, 以得到多个识别词汇;
根据预置的关键词汇数据集对多个识别词汇进行筛 选, 以得到关键词汇;
统计并根据各个关键词汇出现的次数确定核心基准高频词汇。
4.根据权利要求3所述的一种基于人工智能的直播视频大数据精准推荐方法, 其特征
在于, 所述统计并根据各个关键词汇出现的次数确定核心基准高频词汇的方法包括以下步
骤:
统计各个关键词汇出现的次数, 当关键词汇出现的次数超过预置的次数阈值时, 将对
应的关键词汇确定为核心基准高频词汇。权 利 要 求 书 1/3 页
2
CN 114494982 B
25.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法, 其特征
在于, 所述对待识别核心关键帧图像进行显著性检测的方法包括以下步骤:
采用ITTI模型、 GBVS模型、 SF模型、 ST模型和FT模型其 中一种或多种模型对待识别核心
关键帧图像进行显著性检测。
6.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法, 其特征
在于, 所述根据聚类结果将待识别直播视频标记 为目标推荐直播视频或非推荐直播视频的
方法包括以下步骤:
若聚类结果 为与正样本聚为 一类, 则将待识别直 播视频标记为目标推荐直 播视频;
若聚类结果 为与负样本聚为 一类, 则将待识别直 播视频标记为非推荐直 播视频。
7.一种基于人工智能的直播视频大数据精准推荐系统, 其特征在于, 包括基准视频选
取模块、 关键帧识别模块、 核心基准选取模块、 第一识别模块、 待识别图像模块、 待识别挑选
模块、 第二识别模块、 词汇对比模块、 样本选取模块、 聚类处理模块 以及识别推荐模块, 其
中:
基准视频选取模块, 用于获取并统计目标用户的多段历史观看视频数据, 生成并根据
统计结果选取一段历史观看视频 数据作为基准 直播视频;
关键帧识别模块, 用于采用关键帧检测方法对基准直播视频进行关键帧图像识别检
测, 以得到基准关键帧图像;
核心基准选取模块, 用于利用代表性关键帧图像选取方法从基准关键帧图像中挑选得
到核心基准关键帧图像;
第一识别模块, 用于采用OCR识别方法对核心基准关键帧图像 中的词汇进行识别, 得到
并统计核心基准高频词汇;
待识别图像模块, 用于获取并采用关键帧检测方法对 网络直播平台中的任意一段待识
别直播视频进行识别检测, 以得到待识别关键帧图像;
待识别挑选模块, 用于利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得
到待识别核心关键帧图像;
第二识别模块, 用于采用OCR识别方法对待识别核心关键帧图像 中的词汇进行识别, 得
到并统计目标高频词汇;
词汇对比模块, 用于分别判断各个核心基准高频词汇与各个目标高频词汇是否相同,
若至少存在一个核心基准高频词汇与目标高频词汇相同, 则对待识别核心关键帧图像进 行
显著性检测, 以得到显著核心关键帧图像; 反之, 则将该段待识别直播视频标记为 非推荐直
播视频;
样本选取模块, 用于将核心基准关键帧图像作为正样本, 选取网络直播平台中目标用
户未观看的直 播视频作为负 样本;
聚类处理模块, 用于基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行
聚类处理, 得到聚类结果;
识别推荐模块, 用于根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推
荐直播视频, 将目标推荐直 播视频推送给对应的目标用户。
8.根据权利要求7所述的一种基于人工智能的直播视频大数据精准推荐系统, 其特征
在于, 所述核心基准选取模块包括自编码子模块和核心确定 子模块, 其中:权 利 要 求 书 2/3 页
3
CN 114494982 B
3
专利 一种基于人工智能的直播视频大数据精准推荐方法及系统
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:31:20上传分享