国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210305947.8 (22)申请日 2022.03.25 (71)申请人 联通沃音乐文化有限公司 地址 510300 广东省广州市黄埔区 (中新广 州知识城) 亿创街1号 406房之283 (72)发明人 李韩 张晶晶 庞文刚 乔治  邹西山 李雪欣 罗岚 弋翔  陈星 林泽涛 罗志亮 张杰辉  温雪阳 张寒  (74)专利代理 机构 广州恒华智 信知识产权代理 事务所(普通 合伙) 44299 专利代理师 廖金燕 (51)Int.Cl. H04M 3/42(2006.01) G06F 16/215(2019.01)G06F 16/25(2019.01) G06F 16/2457(2019.01) G06F 17/18(2006.01) G06V 10/762(2022.01) (54)发明名称 一种基于摘机时长预测算法的视频彩铃播 放方法 (57)摘要 本发明公开了一种基于摘机时长预测算法 的视频彩铃播放方法, 包括如下步骤: S1、 数据获 取步骤, 从用户数据后台获取所有的必要数据特 征信息并输 出为CSV数据格式; S2、 对获取的用户 特征数据完成质量控制, 通过传统数据清洗算法 解决用户数据信息的空缺值、 异常值、 无数据的 问题, 获得经过质量控制的用户数据信息; S3、 对 获取的质量控制数据进行关键特征筛选, 并提取 对应的关键特征数据作为回归拟合数据; S4、 被 叫用户摘机时长预测算法的计算; S5、 根据预测 的被叫用户 摘机时长对视频彩铃进行精彩片段 提取播放。 本发明采用视频精彩片段提取技术, 根据被叫用户摘机时长预测编制新的视频彩铃 内容, 让用户观接受到更多的关键视频内容信 息。 权利要求书2页 说明书5页 附图1页 CN 114928675 A 2022.08.19 CN 114928675 A 1.一种基于摘机时长预测算法的视频彩铃播 放方法, 其特 征在于: 包括如下步骤: S1、 数据获取步骤, 从用户数据后台获取所有的必要数据特征信息并输出为CSV数据格 式; S2、 对获取的用户特征数据完成质量控制, 通过传统数据清洗算法解决用户数据信息 的空缺值、 异常值、 无 数据的问题, 获得 经过质量控制的用户数据信息; S3、 对获取的质量控制数据进行关键特征筛选, 并提取对应的关键特征数据作为回归 拟合数据; S4、 被叫用户摘机时长预测算法的计算; S5、 根据预测的被叫用户摘机时长对视频彩铃进行精彩片段提取播 放。 2.根据权利要求1所述的一种基于摘机时长预测算法的视频彩铃播放方法, 其特征在 于: S1的具体步骤如下: Ⅰ、 首先打开数据库查询窗口, 输出需要导出数据的结构化查询语言Structured  Query  Language语句; Ⅱ、 检索的结果中复制所有查询出来的数据并将结果另存为Comma ‑Separated  Values  CSV文本文件并导出。 3.根据权利要求1所述的一种基于摘机时长预测算法的视频彩铃播放方法, 其特征在 于: S2获得 经过质量控制的用户数据信息方法如下: Ⅰ、 利用邻近插值和平均值插值的方法解决空缺值, 邻 近插值是利用相邻的数据值进行 插值, 平均值插值 为利用该维特 征的平均值进行插; Ⅱ、 利用自设计阈值判断异常值, 电话拨打时长最大长度为54s若超过该阈值则为异常 值, 同时负值与非正常数值都为异常值; Ⅲ、 通过整体用户的接通时长的均值或中值完成对无 数据用户的电话接通时长填充。 4.根据权利要求1所述的一种基于摘机时长预测算法的视频彩铃播放方法, 其特征在 于: S3中关键特征数据包含: 1、 摘机时长; 2、 当日的时间节点; 3、 性别; 4、 周一至周末; 5、 用 户的电话接通时长的真值。 5.根据权利要求1所述的一种基于摘机时长预测算法的视频彩铃播放方法, 其特征在 于: S4中被叫用户摘机时长预测算法步骤如下: Ⅰ、 通过在通信方面的多年经验、 和对大数据的观察与分析, 进行了用户摘机时长的关 键特征信息的筛选, 并建立摘机时长预测的多维特征数据集, 同时某些语义特征要转换为 对应的数字特 征; Ⅱ、 将建立的用户多维特征数据集分别打上对应的标签, 让每个特征向量都有对应的 摘机时长真值标签, 数据集包 含四个维度的特 征、 并对应一个电话接通时长的真值; Ⅲ、 数据集作为Lasso  Regression回归模型的输入, 经过对模型的训练学习与参数更 新获得最终模型参数, 并获得回归预测结果, 回归结果即为对用户电话接通时长的预测结 果; 回归模型是从多维特征数据中获取经过训练的参数模型, Lasso  Regression的回归误 差公式如下: Ⅳ、 将测试集送入训练好的模型预测, 判断模型回归效果, 主要通过均方误差Mean  权 利 要 求 书 1/2 页 2 CN 114928675 A 2Squared Error, MSE、 均方根误差root  mean squared error, RMSE、 或者R ‑square系数进行 评估, 公式如下: 6.根据权利要求1所述的一种基于摘机时长预测算法的视频彩铃播放方法, 其特征在 于: S5具体步骤如下: Ⅰ、 通过将短视频拆帧, 利用降维算法对每一帧画面进行数据降维后放入数组, 得到代 表整个视频数据的二 维特征向量, 并根据每一帧的时序信息为该特征向量添加一个代表时 间的维度得到三维特 征向量, 这个三维特 征向量代 表了短视频的特 征信息; Ⅱ、 针对短视频特征基于k ‑means算法即K均 值算法, 根据时间特征, 在保留时序信息的 基础上对该三维特征向量进行无监督聚类, 其聚类类别的数量也是自适应的, 从而提取出 多个视频片段, 这些片段就是 该短视频的精彩片段; Ⅲ、 在预测出用户接通电话 时长的基础上, 对视频片段按时序进行拼接, 根据各视频片 段的时长整合出不少于且最近预测时长的精彩视频, 通过对视频彩铃内容的压缩和提取可 以让电话拨通方的用户在有限的时间获取尽可能多的视频信息 。 7.根据权利要求6所述的一种基于摘机时长预测算法的视频彩铃播放方法, 其特征在 于: k‑means算法步骤如下: Ⅰ、 在时间序列上均匀选取n个聚类中心点, n是总帧数的三分之一; Ⅱ、 计算每个聚类中心点t邻域内的平均值, t是中心点间距的二分之一; Ⅲ、 若相邻簇的平均值差值的绝对值小于设置的阈值T, 则合并这两个簇; Ⅳ、 迭代重复步骤 Ⅱ、Ⅲ直至不再产生 新的簇; Ⅴ、 根据各个簇内样本点的数量, 取top  k的簇作为短视频的精彩片段。权 利 要 求 书 2/2 页 3 CN 114928675 A 3

.PDF文档 专利 一种基于摘机时长预测算法的视频彩铃播放方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于摘机时长预测算法的视频彩铃播放方法 第 1 页 专利 一种基于摘机时长预测算法的视频彩铃播放方法 第 2 页 专利 一种基于摘机时长预测算法的视频彩铃播放方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:31:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。