专利 一种基于人工智能的直播视频大数据精准推荐方法及系统

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210362995.0 (22)申请日 2022.04.08 (65)同一申请的已公布的文献号申请公布号 CN 114494982 A (43)申请公布日 2022.05.13 (73)专利权人华夏文广传媒集团股份有限公司地址 100000 北京市朝阳区高井文化园路8 号东亿国际传媒产业园区三期A 座5层 502室A区 (72)发明人吴新军　 (74)专利代理机构成都鱼爪智云知识产权代理有限公司 513 08 专利代理师杨洪婷 (51)Int.Cl. G06V 20/40(2022.01)G06V 20/62(2022.01) G06V 10/74(2022.01) G06V 10/762(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (56)对比文件 CN 104618 803 A,2015.0 5.13 CN 113010701 A,2021.0 6.22 CN 110837579 A,2020.02.25 CN 114297434 A,202 2.04.08 US 20193 62154 A1,2019.1 1.28 CN 110688526 A,2020.01.14 审查员刘芳 (54)发明名称一种基于人工智能的直播视频大数据精准推荐方法及系统 (57)摘要本发明公开了一种基于人工智能的直播视频大数据精准推荐方法及系统，涉及数据识别分析技术领域。该方法包括：选取并对基准直播视频进行识别；挑选核心基准关键帧图像；识别得到核心基准高频词汇；对待识别直播视频进行识别；挑选并对待识别核心关键帧图像进行识别，得到目标高频词汇；若至少存在一个核心基准高频词汇与目标高频词汇相同，则进行显著性检测，基于正负样本采用谱聚类方法进行聚类，确定待识别直播视频是否为目标推荐直播视频。本发明利用关键帧检测、代表性关键帧图像选取方法对直播视频中核心帧图像进行有效选取，并将基于OCR的高频词汇匹配方法和聚类方法进行结合，有效精准判别，为用户精准推荐相关视频数据。权利要求书3页说明书9页附图5页 CN 114494982 B 2022.12.20 CN 114494982 B 1.一种基于人工智能的直播视频大数据精准推荐方法，其特征在于，包括以下步骤：获取并统计目标用户的多段历史观看视频数据，生成并根据统计结果选取一段历史观看视频数据作为基准直播视频；采用关键帧检测方法对基准直播视频进行关键帧图像识别检测，以得到基准关键帧图像；利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像；采用OCR识别方法对核心基准关键帧图像中的词汇进行识别，得到并统计核心基准高频词汇；获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别检测，以得到待识别关键帧图像；利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关键帧图像；采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别，得到并统计目标高频词汇；分别判断各个核心基准高频词汇与各个目标高频词汇是否相同，若至少存在一个核心基准高频词汇与目标高频词汇相同，则对待识别核心关键帧图像进行显著性检测，以得到显著核心关键帧图像；反之，则将该段待识别直播视频标记为非推荐直播视频；将核心基准关键帧图像作为正样本，选取网络直播平台中目标用户未观看的直播视频作为负样本；基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行聚类处理，得到聚类结果；根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频，将目标推荐直播视频推送给对应的目标用户。 2.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法，其特征在于，所述利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像的方法包括以下步骤：对基准关键帧图像进行深度自编码；计算并根据各个基准关键帧图像自编码后的欧式距离确定核心基准关键帧图像。 3.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法，其特征在于，所述采用OCR识别方法对核心基准关键帧图像中的词汇进行识别，得到并统计核心基准高频词汇的方法包括以下步骤：采用OCR识别方法对核心基准关键帧图像中的词汇进行识别，以得到多个识别词汇；根据预置的关键词汇数据集对多个识别词汇进行筛选，以得到关键词汇；统计并根据各个关键词汇出现的次数确定核心基准高频词汇。 4.根据权利要求3所述的一种基于人工智能的直播视频大数据精准推荐方法，其特征在于，所述统计并根据各个关键词汇出现的次数确定核心基准高频词汇的方法包括以下步骤：统计各个关键词汇出现的次数，当关键词汇出现的次数超过预置的次数阈值时，将对应的关键词汇确定为核心基准高频词汇。权　利　要　求　书 1/3 页 2 CN 114494982 B 25.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法，其特征在于，所述对待识别核心关键帧图像进行显著性检测的方法包括以下步骤：采用ITTI模型、 GBVS模型、 SF模型、 ST模型和FT模型其中一种或多种模型对待识别核心关键帧图像进行显著性检测。 6.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法，其特征在于，所述根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频的方法包括以下步骤：若聚类结果为与正样本聚为一类，则将待识别直播视频标记为目标推荐直播视频；若聚类结果为与负样本聚为一类，则将待识别直播视频标记为非推荐直播视频。 7.一种基于人工智能的直播视频大数据精准推荐系统，其特征在于，包括基准视频选取模块、关键帧识别模块、核心基准选取模块、第一识别模块、待识别图像模块、待识别挑选模块、第二识别模块、词汇对比模块、样本选取模块、聚类处理模块以及识别推荐模块，其中：基准视频选取模块，用于获取并统计目标用户的多段历史观看视频数据，生成并根据统计结果选取一段历史观看视频数据作为基准直播视频；关键帧识别模块，用于采用关键帧检测方法对基准直播视频进行关键帧图像识别检测，以得到基准关键帧图像；核心基准选取模块，用于利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像；第一识别模块，用于采用OCR识别方法对核心基准关键帧图像中的词汇进行识别，得到并统计核心基准高频词汇；待识别图像模块，用于获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别检测，以得到待识别关键帧图像；待识别挑选模块，用于利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关键帧图像；第二识别模块，用于采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别，得到并统计目标高频词汇；词汇对比模块，用于分别判断各个核心基准高频词汇与各个目标高频词汇是否相同，若至少存在一个核心基准高频词汇与目标高频词汇相同，则对待识别核心关键帧图像进行显著性检测，以得到显著核心关键帧图像；反之，则将该段待识别直播视频标记为非推荐直播视频；样本选取模块，用于将核心基准关键帧图像作为正样本，选取网络直播平台中目标用户未观看的直播视频作为负样本；聚类处理模块，用于基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行聚类处理，得到聚类结果；识别推荐模块，用于根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频，将目标推荐直播视频推送给对应的目标用户。 8.根据权利要求7所述的一种基于人工智能的直播视频大数据精准推荐系统，其特征在于，所述核心基准选取模块包括自编码子模块和核心确定子模块，其中：权　利　要　求　书 2/3 页 3 CN 114494982 B 3

专利 一种基于人工智能的直播视频大数据精准推荐方法及系统

专利一种基于人工智能的直播视频大数据精准推荐方法及系统