最新动态

您当前的位置:首页>>个人介绍>>最新动态>>

智能医学影像分析团队在数据降维研究中取得进展

时间:2022-11-03 14:44:19   来源:  点击:[1025]

1667461547401082.jpg


近日,山西大学计算机与信息技术学院杜宇慧教授带领的智能医学影像分析团队的博士生邢颖的研究成果《A novel neighborhood rough set-based feature selection method and its application to biomarker identification of schizophrenia》发表在期刊《IEEE Journal of Biomedical and Health Informatics》(J-BHI)上。该期刊在中科院SCI分区为:工程技术2区(大类),计算机:跨学科应用2区(小类),数学与计算生物学1区(小类),影响因子7.021。论文第一作者为邢颖(单位:山西大学计算机与信息技术学院),通讯作者为杜宇慧(单位:山西大学计算机与信息技术学院),合作作者为Peter Kochunov(单位:Maryland Psychiatric Research Center and Department of Psychiatry, University of Maryland)、Theo G.M. van Erp(单位:Department of Psychiatry and Human Behavior, School of Medicine, University of California)、Tianzhou Ma(单位:Department of Epidemiology and Biostatistics, University of Maryland, College Park)以及Vince D. Calhoun(单位:Tri-Institutional Center for Translational Research in Neuroimaging and Data Science (TReNDS), Georgia State University, Georgia Institute of Technology, Emory University),该研究获得国家自然科学基金项目(No.62076157和No.61703253)、山西省留学人员科技活动择优资助项目、山西省的1331项目、美国国立卫生研究院基金项目(No.R01MH118695和No.R01MH123610),以及美国国家科学基金会项目(No.2112455)的资助。


封面.png


论文提出了基于邻域粗糙集与信息熵结合的多粒度加权特征选择算法(multi-granularity weighted neighborhood rough set combined with entropy-based feature selection method,MGWNRE)。该算法基于邻域粗糙集理论和信息熵理论构建一个加权的特征重要性度量函数以评估不同特征子集区分全部样本的能力,并根据判别能力将不同邻域参数下得到的特征子集融合起来,得到一个稳定且可靠的重要特征子集。该方法在三个公开的全基因组数据集以及包含393名精神分裂症患者和429名健康对照者的静息状态fMRI数据上进行了验证。文章对比了六种现有的特征选择方法,包括三种基于邻域粗糙集的方法(NDDM, EGGS, FSDNE)和三种传统的方法(UCFS, ReliefF, SVM-RFE),采用了三种分类器,包括SVM, 3NN以及AdaBoost。与这六种对比方法相比,所提方法在三个分类器上均得到了更高的分类性能,且在独立的fMRI数据集(BSNIP和MPRC)上验证了所提方法选择的特征子集具有更高的泛化能力。另外,相对于正常人而言,论文发现了精神分裂症异常的脑功能网络连接,主要涉及丘脑与颞上回之间的连接以及中央后回与距状回之间的连接。

 


算法示意图如下:

1667459913582527.png



部分实验结果如下:

(1) 就判别能力而言,使用fMRI数据集(FBIRN),我们的方法(MGWNRE) 与六种对比方法相比,在三种分类器上获得了更优的分类性能,见TABLE II;

(2) 就泛化性能来看,基于各个方法在FBIRN数据集中选择的高频重要特征,MGWNRE在两个完全独立的fMRI数据集上同样获得了更优的分类性能,见TABLE II;

(3) 我们的方法发现,相对于正常人而言,精神分裂症在丘脑-颞上回、颞中回-岛叶、颞中回-前扣带皮层、右枕中回-海马之间显示出增强的脑功能网络连接,在丘脑-小脑、丘脑-尾状核、顶上小叶-枕下回、中央后回-距状回之间显示出减弱的脑功能网络连接,并且这些连接在多个数据集中显示出一致的变化趋势,见TABLE III和Fig. 4。

1667459963556273.png


1667461170607234.png


Fig4.png



文章详细内容请参见:

https://ieeexplore.ieee.org/document/9913333

 

山西大学计算机与信息技术学院

智能医学图像分析实验室

2022年11月3日