国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210277784.7 (22)申请日 2022.03.16 (71)申请人 中南民族大 学 地址 430000 湖北省武汉市洪山区民族大 道708号、 823号 申请人 武汉空天软件技 术有限公司 (72)发明人 孟博 赵俊杰 王德军 王俊 康怡琳 李娜 (74)专利代理 机构 武汉天领众智专利代理事务 所(普通合伙) 42300 专利代理师 谢非 (51)Int.Cl. G06N 20/20(2019.01) G06V 10/762(2022.01) G06K 9/62(2022.01)G06F 21/60(2013.01) (54)发明名称 一种基于聚类分析的安全横向联邦学习方 法 (57)摘要 本发明公开了一种基于聚类分析的安全横 向联邦学习方法, 属于联邦学习数据安全性技术 领域, 通过采用密文计算的方式, 让梯度值在密 文的情况加进行计算, 等计算完毕后在进行解 密, 通过聚类 分析和服务器端参数的分析对比评 分机制, 来解决横向联邦学习中存在的数据投毒 攻击和不诚实参与者问题, 这在解决这个问题的 同时, 还可以在一定程度上提升训练的准确度, 本发明方法通过同态加密的方式, 实现在服务器 上进行密态计算, 来保证服务器上计算的安全 性, 本申请的方法主要是解决数据投毒和不诚实 参与者的问题, 可以在防止数据投毒和不诚实用 户的同时, 提高训练的准确度, 并且通过同态加 密的方式保证 了梯度的安全性。 权利要求书2页 说明书6页 附图2页 CN 114611722 A 2022.06.10 CN 114611722 A 1.一种基于聚类分析的安全横向联邦学习方法, 其特 征在于, 包括以下步骤: S1、 模型下载: 首先用户从服 务器下载初始模型; S2、 模型训练: 通过初始模型对数据集进行清洗, 去除数据集中的空值, 然后再进行聚 类分析, 找出数据集中的离群点, 最后进 行模型训练得到训练后的参数, 从而 形成用户训练 模型; S3、 数据集分析: 用户的进行数据清洗后的数据集进行分析, 针对于其分布情况, 数据 集的集中趋势(众数、 中位数、 均值)、 数据的离散趋势(四分位差、 极差、 平均差、 标准差)、 数 据的形状(峰度系数、 偏度系数); S4、 参数传递: 用户把训练完的参数发送到服 务器, 且用户发送的消息包括: 离群值在数据集中的占比、 离群点数量、 数据集的大小、 模型训练后得到的参数; 数据集的集中趋势(众数、 中位数、 均 值)、 数据的离散趋势(四分位差、 极差、 平均差、 标 准差)、 数据的形状(峰度系数、 偏度系数); 模型训练后得到的参数, 需进行同态加密, 之后再进行传输; S5、 数据集的分布趋势分析: 服务器进行数据分析和训练结果的密态加权平均, 判断各 个用户的数据集的分布趋势 一致性, 把数据分布趋势相似而且评价值高于60的训练梯度值 进行计算, 对梯度的处 理, 主要保证其在 密态的情况 下, 进行加权平均计算; S6、 训练模型更新: 用户获取新的参数信息, 更新模型, 重复S2 ‑S6的步骤, 直到训练模 型达到训练轮次或者到 达到设置的阈值。 2.根据权利要求1所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S2的模型训练中, 首先需要进行数据清洗去除其中的空值和零值, 然后采用Kmeans聚类 算法找出 数据集中的离群点和离群簇, 模型 再拿数据进行训练, 得到梯度w i。 3.根据权利要求2所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S3的数据集分析中, 主 要分析数据集的参数: 集中趋势: 众 数、 中位数、 均值; 离散趋势: 四分位差、 极差、 平均差、 标准差; 数据集的形状: 峰度系数、 偏度系数。 4.根据权利要求3所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S4中参与者需要发送给服务器的参数, 离群值在数据集中的占比、 离群点数量、 数据集的 大小、 模型训练后得到的参数, 数据集的集中趋势(众数、 中位数、 均值)、 数据的离散趋势 (四分位差、 极差、 平均差、 标准差)、 数据集的形状(峰度系数、 偏度系数)、 加密的梯度值, 梯 度和数据量的乘积的加密值 wij。 5.根据权利要求4所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S5中进行数据分析和梯度 的密态加权平均, 首先对收到的所有参数的数据进行分类整 合, 按照参数 的重要性设置除了梯度外的每一个参数 的评分值, 评分规则按照各类型参数 的正太的分布范围进行打分, 只有数据评分达到60的参与者的梯度值才能参与最后的聚 合, 在梯度值确定之后, 进行梯度值的密态的加权计算, 6.根据权利要求5所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S6中获取到新的参数之后, 需要把Δw解密, 解密后的再除以新参数中聚合参数的数据量权 利 要 求 书 1/2 页 2 CN 114611722 A 2的和, 达到新的Δw ′, 之后进行新一轮的训练, 直到训练模 型达到训练轮次或者到达到 设置 的阈值。权 利 要 求 书 2/2 页 3 CN 114611722 A 3
专利 一种基于聚类分析的安全横向联邦学习方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:32:38
上传分享
举报
下载
原文档
(503.0 KB)
分享
友情链接
T-JSQX 0011—2022 江苏省纯电动重型卡车换电电池包系统技术规范.pdf
GB-T 43557-2023 信息安全技术 网络安全信息报送指南.pdf
GB-T 711-2017 优质碳素结构钢热轧钢板和钢带.pdf
GB-T 22264.7-2022 安装式数字显示电测量仪表 第7部分:多功能仪表的特殊要求.pdf
GB-T 33563-2017 信息安全技术 无线局域网客户端安全技术要求(评估保障级2级增强).pdf
信通院 量子信息技术发展与应用研究报告 2023年.pdf
T-CSAE 137—2020 汽车紧固点防水密封性能试验及评价方法.pdf
GB-T 28839-2012 进出境货物木质包装申报规范.pdf
GB-T 39243-2020 船用生物可溶性矿物棉制品技术要求及试验方法.pdf
DB3502-T 056.1-2020 政务信息共享协同平台 第1部分:总体设计 厦门市.pdf
ISO IEC 19770-1 2017 Amd 1 2024 Information technology — IT asset manage.pdf
DB11-T 1652-2019 空气源热泵节能监测 北京市.pdf
GB-T 26698-2022 考试用铅笔和涂卡专用笔.pdf
YY-T 1869-2023 探测器阵列剂量测量系统 性能和试验方法.pdf
Linux安全配置基线.pdf
GB-T 29544-2013 离网型风光互补发电系统 安全要求.pdf
数据全生命周期管理办法.pdf
DB14-T 2658—2023 农村公路工程技术标准 山西省.pdf
T-NIFA 23—2023 公共数据在企业征信领域应用的指南.pdf
GM-T 0044.4-2016 SM9标识密码算法 第4部分:密钥封装机制和公钥加密算法.pdf
1
/
3
11
评价文档
赞助2.5元 点击下载(503.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。