青岛科技大学 信息科学技术学院
TP391
山东省重点研发计划基金(2015GSF119016); 青岛市科技惠民示范专(23-2-8-smjk-20-nsh); 山东省产教融合研究生联合培养示范基地项目(2020-19)
针对组学数据挖掘中遇到的数据样本量少,数据高维度和特征泛化性问题,本研究提出了结合残差网络与软阈值化方法的生成模型RS-CGAN。该模型通过一维卷积层和残差网络结构提升高维数据的特征学习能力,并引入残差软阈值化的生成器和残差注意力的判别器以降低噪声影响并防止过拟合;采用距离相似度惩罚项指导生成器学习,增强训练质量;提出基于结构因果模型的特征选择模块,通过构建因果结构图,实现群体平均因果治疗效应估计值的计算,识别具有泛化性和因果关系的生物标志物。实验结果表明,该方法在数据生成质量方面具有优势,且特征选择后的数据集在预测模型中的准确率提升了30.58%,最终识别10个乳腺癌生物标志物,其中4个已经过临床医学验证为风险位点,证明了该标志物选择方法的有效性。
杨 锦,边太成,李晓晖,焦 强,朱习军.基于生成对抗网络的乳腺癌基因数据生成与挖掘计算机测量与控制[J].,2025,33(11):219-227.