国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210175784.6 (22)申请日 2022.02.24 (71)申请人 重庆邮电大 学 地址 400065 重庆市南岸区南 山街道崇文 路2号 (72)发明人 白明泽 赵雪霏 (74)专利代理 机构 重庆辉腾律师事务所 5 0215 专利代理师 王海军 (51)Int.Cl. G16B 40/00(2019.01) G16B 20/00(2019.01) G16B 25/10(2019.01) G06K 9/62(2022.01) G06V 10/762(2022.01) (54)发明名称 一种基于深度学习特征提取的胃癌蛋白质 组学分型框架 识别方法 (57)摘要 本发明属于人工智能和蛋白质组学领域, 具 体涉及一种基于深度学习特征提取的胃癌蛋白 质组学分型框架识别方法, 该方法包括: 获取待 识别的蛋白表达谱, 对蛋白表达谱进行预处理; 将预处理后的蛋白表达谱输入到训练好的自动 编码器, 提取自动编码器瓶颈层的节点, 利用该 节点进行一致性聚类, 得到待识别蛋白表达谱的 聚类标签; 根据聚类标签训练分类器, 对未知标 签样本进行预测, 完成胃癌蛋白质组学分型框架 识别; 本发 明使用深度学习的自动编码器对来自 多中心的二期、 三期胃癌患者特征提取进行一致 性聚类后获得了具有显著生存差异的分子亚型, 且亚型表现为预后好、 化疗获益和预后差、 化疗 无效。 权利要求书2页 说明书7页 附图4页 CN 114550831 A 2022.05.27 CN 114550831 A 1.一种基于深度学习特征提取的胃癌蛋白质组学分型框架识别方法, 其特征在于, 包 括: 获取待识别的蛋白表达谱, 对蛋白表达谱进 行预处理; 将预处理后的蛋白表达谱输入到 自动编码器中提取瓶颈层特征, 采用一致性聚类算法对提取的瓶颈层特征进行一致性聚 类, 得到亚型标签; 将亚型标签输入到分类器中, 得到亚型标签的分类结果, 完成胃癌蛋白 质组学分型框架 识别; 对分类器进行训练的过程包括: S1: 获取患者的蛋白表达谱数据集, 并对数据集中的蛋白表达谱进行 预处理; S2: 采用自动 编码器对预处 理后的蛋白表达谱进行瓶颈层特 征提取; S3: 采用一致性聚类算法对自动编码器提取的特征进行一致性聚类, 得到亚型标签; 将 所有的亚型标签划分为训练集和测试集, 其中训练集用于对分类器进行训练, 测试集用于 对训练的分类 器进行测试; S4: 采用单因素Cox风险比例模型对训练集中的蛋白进行选择, 并对选择后的蛋白进行 标准化; S5: 将标准 化后的蛋白输入到分类 器中进行训练, 得到训练好的分类 器。 2.根据权利要求1所述的一种基于深度学习特征提取的胃癌蛋白质组学分型框架识别 方法, 其特征在于, 对蛋白表达谱进 行预处理包括: 在蛋白表达谱数据集中筛选出高置信蛋 白; 剔除高置信蛋白中的高丰度蛋白和冗余蛋白; 对经过删除高丰度蛋白和冗余蛋白后的 高置信蛋白进行基于综合的定量数据标准化, 并去除鉴定频次低于样本总 数10%的蛋白, 得到标准蛋白表达谱。 3.根据权利要求1所述的一种基于深度学习特征提取的胃癌蛋白质组学分型框架识别 方法, 其特征在于, 采用自动编 码器对标准蛋白表达谱进行瓶颈层特征提取的过程包括: 将 预处理后的蛋白表达谱数据输入自动编 码器进行非线性转换, 并计算输入 数据和重构数据 的损失值, 当损失值越小时, 瓶颈层节点对原始数据的解释性越强, 输出此时的瓶颈层节 点; 采用自动编码器对蛋白表达谱数据进行非线性转换 的过程包括: 将标准化后的蛋白表 达谱输入到自动编 码器中, 在第一个隐藏层经过relu激活函数转换, 得到隐藏节 点; 将隐藏 节点输入到瓶颈层中进行转换, 得到转换后的瓶颈节点; 将瓶颈节点输入到解码器的第一 个隐藏层, 并通过relu激活函数转换, 得到第一个解码 器隐藏层的 隐藏节点, 将此隐藏节 点 输入到重构层中, 并经 过sigmiod函数进行转换, 得到 重构的数据。 4.根据权利要求3所述的一种基于深度学习特征提取的胃癌蛋白质组学分型框架识别 方法, 其特 征在于, 输入数据和重构数据的损失值公式为: 其中, MSE表示 目标函数, xi表示当前样本的输入数据, xi`表示自动编码器的输出值, n 表示样本总数。 5.根据权利要求1所述的一种基于深度学习特征提取的胃癌蛋白质组学分型框架识别 方法, 其特征在于, 采用一致性聚类算法对自动编码器提取出来的特征进行一致性聚类的 过程包括: 一致性聚类算法为基于欧几里得的k ‑means聚类算法; 设置最大聚类数、 重复抽 样的比例以及抽样次数; 根据设置的重复抽样的比例对样本进行抽样聚类, 每次迭代记录 样本间的聚类距离; 当迭代完成后计算样本间的聚类距离的平均值, 将该平均值作为最终权 利 要 求 书 1/2 页 2 CN 114550831 A 2的距离矩阵; 根据 距离矩阵计算样本间的相似性, 根据样 本相似性计算结果得到聚类结果; 聚类结果中每 个簇表示 亚型标签。 6.根据权利要求1所述的一种基于深度学习特征提取的胃癌蛋白质组学分型框架识别 方法, 其特 征在于, 分类 器采用随机森林分类 器。 7.根据权利要求1所述的一种基于深度学习特征提取的胃癌蛋白质组学分型框架识别 方法, 其特征在于, 采用单因素Cox风险比例模型对训练集中的蛋白进行选择的过程包括: 将训练集中的蛋白输入到单因素Cox风险比例模型中进行风险评估, 输出每个蛋白对预后 影响的显著性统计值以及风险值; 设置阈值, 将每个蛋白对预后影响的显著性统计值与设 置的阈值进行大小比较, 当小于设置的阈值时, 则保留该蛋白, 否则在训练集中去除该蛋 白; 单因素Cox风险比例模型对蛋白数据进行处 理的公式为: h(t)=h0(t)*exp(b1x1+b2x2+…+bnxn) 其中, t表示时间, h(t)表示该时间点的死 亡风险, x表示因素, exp(bi)表示该因素的HR。 8.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被 处理器执行, 以实现权利要求 1至7中任一项基于深度学习特征提取的胃癌蛋白质组学分型 框架识别方法。 9.一种基于深度学习特征提取的胃癌蛋白质组学分型框架识别装置, 其特征在于, 包 括处理器和存储器; 所述存储器用于存储计算机程序; 所述处理器与所述存储器相连, 用于 执行所述存储器存储的计算机程序, 以使 所述一种基于深度学习特征提取的胃癌蛋白质组 学分型框架识别装置执行权利要求1至7中任一项基于深度学习 特征提取 的胃癌蛋白质组 学分型框架 识别方法。权 利 要 求 书 2/2 页 3 CN 114550831 A 3
专利 一种基于深度学习特征提取的胃癌蛋白质组学分型框架识别方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:32:17
上传分享
举报
下载
原文档
(681.6 KB)
分享
友情链接
GB-T 9176-2016 桑蚕干茧.pdf
GB-T 41269-2022 网络关键设备安全技术要求 路由器设备.pdf
GB-T 41985-2022 230MeV~250MeV超导质子回旋加速器.pdf
GB-T 12538-2023 道路车辆 质心位置的测定.pdf
GB-T 24554-2022 燃料电池发动机性能试验方法.pdf
GB-T 33174-2016 资产管理 管理体系 GB-T 33173 应用指南.pdf
GB-T 25341.1-2019 铁路旅客运输服务质量 第1部分:总则.pdf
GB-T 32212-2015 液相色谱用固定波长光度检测器的测试方法.pdf
国家健康医疗大数据标准、安全和服务管理办法(试行).pdf
DB42-T 1726-2021 自然资源“一张图”数据应用服务规范 湖北省.pdf
GB-T 31200-2014 电梯、自动扶梯和自动人行道乘用图形标志及其使用导则.pdf
沙利文 眼科药物市场发展现状与未来趋势研究报告 2022.pdf
GM-T 0006-2023 密码应用标识规范.pdf
T-CVMA 41—2020 犬致病性钩端螺旋体荧光PCR检测方法.pdf
GB-T 36620-2018 面向智慧城市的物联网技术应用指南.pdf
密码使用管理制度.pdf
证券期货业信息系统渗透测试指南 (JRT 0276—2023).pdf
burp web cache poisoning web缓存投毒 英文版.pdf
医院信息化整体解决方案.pdf
易观分析 AIGC产业研究报告2023——图像生成篇.pdf
1
/
3
14
评价文档
赞助2.5元 点击下载(681.6 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。