专利 一种基于摘机时长预测算法的视频彩铃播放方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210305947.8 (22)申请日 2022.03.25 (71)申请人联通沃音乐文化有限公司地址 510300 广东省广州市黄埔区（中新广州知识城）亿创街1号 406房之283 (72)发明人李韩　张晶晶　庞文刚　乔治　邹西山　李雪欣　罗岚　弋翔　陈星　林泽涛　罗志亮　张杰辉　温雪阳　张寒　 (74)专利代理机构广州恒华智信知识产权代理事务所(普通合伙) 44299 专利代理师廖金燕 (51)Int.Cl. H04M 3/42(2006.01) G06F 16/215(2019.01)G06F 16/25(2019.01) G06F 16/2457(2019.01) G06F 17/18(2006.01) G06V 10/762(2022.01) (54)发明名称一种基于摘机时长预测算法的视频彩铃播放方法 (57)摘要本发明公开了一种基于摘机时长预测算法的视频彩铃播放方法，包括如下步骤： S1、数据获取步骤，从用户数据后台获取所有的必要数据特征信息并输出为CSV数据格式； S2、对获取的用户特征数据完成质量控制，通过传统数据清洗算法解决用户数据信息的空缺值、异常值、无数据的问题，获得经过质量控制的用户数据信息； S3、对获取的质量控制数据进行关键特征筛选，并提取对应的关键特征数据作为回归拟合数据； S4、被叫用户摘机时长预测算法的计算； S5、根据预测的被叫用户摘机时长对视频彩铃进行精彩片段提取播放。本发明采用视频精彩片段提取技术，根据被叫用户摘机时长预测编制新的视频彩铃内容，让用户观接受到更多的关键视频内容信息。权利要求书2页说明书5页附图1页 CN 114928675 A 2022.08.19 CN 114928675 A 1.一种基于摘机时长预测算法的视频彩铃播放方法，其特征在于：包括如下步骤： S1、数据获取步骤，从用户数据后台获取所有的必要数据特征信息并输出为CSV数据格式； S2、对获取的用户特征数据完成质量控制，通过传统数据清洗算法解决用户数据信息的空缺值、异常值、无数据的问题，获得经过质量控制的用户数据信息； S3、对获取的质量控制数据进行关键特征筛选，并提取对应的关键特征数据作为回归拟合数据； S4、被叫用户摘机时长预测算法的计算； S5、根据预测的被叫用户摘机时长对视频彩铃进行精彩片段提取播放。 2.根据权利要求1所述的一种基于摘机时长预测算法的视频彩铃播放方法，其特征在于： S1的具体步骤如下： Ⅰ、首先打开数据库查询窗口，输出需要导出数据的结构化查询语言Structured Query Language语句； Ⅱ、检索的结果中复制所有查询出来的数据并将结果另存为Comma ‑Separated Values CSV文本文件并导出。 3.根据权利要求1所述的一种基于摘机时长预测算法的视频彩铃播放方法，其特征在于： S2获得经过质量控制的用户数据信息方法如下： Ⅰ、利用邻近插值和平均值插值的方法解决空缺值，邻近插值是利用相邻的数据值进行插值，平均值插值为利用该维特征的平均值进行插； Ⅱ、利用自设计阈值判断异常值，电话拨打时长最大长度为54s若超过该阈值则为异常值，同时负值与非正常数值都为异常值； Ⅲ、通过整体用户的接通时长的均值或中值完成对无数据用户的电话接通时长填充。 4.根据权利要求1所述的一种基于摘机时长预测算法的视频彩铃播放方法，其特征在于： S3中关键特征数据包含： 1、摘机时长； 2、当日的时间节点； 3、性别； 4、周一至周末； 5、用户的电话接通时长的真值。 5.根据权利要求1所述的一种基于摘机时长预测算法的视频彩铃播放方法，其特征在于： S4中被叫用户摘机时长预测算法步骤如下： Ⅰ、通过在通信方面的多年经验、和对大数据的观察与分析，进行了用户摘机时长的关键特征信息的筛选，并建立摘机时长预测的多维特征数据集，同时某些语义特征要转换为对应的数字特征； Ⅱ、将建立的用户多维特征数据集分别打上对应的标签，让每个特征向量都有对应的摘机时长真值标签，数据集包含四个维度的特征、并对应一个电话接通时长的真值； Ⅲ、数据集作为Lasso Regression回归模型的输入，经过对模型的训练学习与参数更新获得最终模型参数，并获得回归预测结果，回归结果即为对用户电话接通时长的预测结果；回归模型是从多维特征数据中获取经过训练的参数模型， Lasso Regression的回归误差公式如下: Ⅳ、将测试集送入训练好的模型预测，判断模型回归效果，主要通过均方误差Mean 权　利　要　求　书 1/2 页 2 CN 114928675 A 2Squared Error， MSE、均方根误差root mean squared error， RMSE、或者R ‑square系数进行评估，公式如下： 6.根据权利要求1所述的一种基于摘机时长预测算法的视频彩铃播放方法，其特征在于： S5具体步骤如下： Ⅰ、通过将短视频拆帧，利用降维算法对每一帧画面进行数据降维后放入数组，得到代表整个视频数据的二维特征向量，并根据每一帧的时序信息为该特征向量添加一个代表时间的维度得到三维特征向量，这个三维特征向量代表了短视频的特征信息； Ⅱ、针对短视频特征基于k ‑means算法即K均值算法，根据时间特征，在保留时序信息的基础上对该三维特征向量进行无监督聚类，其聚类类别的数量也是自适应的，从而提取出多个视频片段，这些片段就是该短视频的精彩片段； Ⅲ、在预测出用户接通电话时长的基础上，对视频片段按时序进行拼接，根据各视频片段的时长整合出不少于且最近预测时长的精彩视频，通过对视频彩铃内容的压缩和提取可以让电话拨通方的用户在有限的时间获取尽可能多的视频信息。 7.根据权利要求6所述的一种基于摘机时长预测算法的视频彩铃播放方法，其特征在于： k‑means算法步骤如下： Ⅰ、在时间序列上均匀选取n个聚类中心点， n是总帧数的三分之一； Ⅱ、计算每个聚类中心点t邻域内的平均值， t是中心点间距的二分之一； Ⅲ、若相邻簇的平均值差值的绝对值小于设置的阈值T，则合并这两个簇； Ⅳ、迭代重复步骤 Ⅱ、Ⅲ直至不再产生新的簇； Ⅴ、根据各个簇内样本点的数量，取top k的簇作为短视频的精彩片段。权　利　要　求　书 2/2 页 3 CN 114928675 A 3

专利 一种基于摘机时长预测算法的视频彩铃播放方法

专利一种基于摘机时长预测算法的视频彩铃播放方法