首頁 資訊 Nat Commun:覆蓋1560種疾病!中科大/阿里巴巴等團隊開發(fā)綜合性生物醫(yī)學(xué)預(yù)測和風(fēng)險評估模型UKB

Nat Commun:覆蓋1560種疾病!中科大/阿里巴巴等團隊開發(fā)綜合性生物醫(yī)學(xué)預(yù)測和風(fēng)險評估模型UKB

來源:泰然健康網(wǎng) 時間:2025年06月25日 06:04

2025-04-30 測序中國 測序中國 發(fā)表于陜西省

中科大等團隊提出 UKB - MDRMF 綜合框架,能預(yù)測評估 1560 種疾病健康風(fēng)險,介紹了其構(gòu)建流程及優(yōu)勢,為醫(yī)療保健提供新方案。

近日,中國科學(xué)技術(shù)大學(xué)團隊、阿里巴巴團隊聯(lián)合美國北卡羅來納大學(xué)團隊,通過整合來自英國生物銀行的多模態(tài)數(shù)據(jù),提出了可預(yù)測和評估1560種疾病健康風(fēng)險的綜合框架UKB-MDRMF。與單一疾病模型不同,UKB-MDRMF結(jié)合了多發(fā)病機制,具有更高的預(yù)測準(zhǔn)確性,在所有疾病類型的風(fēng)險評估中都表現(xiàn)更好。研究團隊利用UKB-MDRMF預(yù)測和評估了多種疾病,有效揭示了風(fēng)險因素和疾病之間的共同和獨特聯(lián)系,為健康和多病機制提供了更廣闊的視角。

同時,研究團隊簡化了從數(shù)據(jù)輸入到模型構(gòu)建的整個過程,增強了跨各種下游任務(wù)使用UKB-MDRMF框架的靈活性和便利性,并開發(fā)了一個互動平臺(https://luminite.shinyapps.io/ukb-mdrmf/)來展示UKB-MDRMF的詳細結(jié)果,允許探索疾病預(yù)測以及特定風(fēng)險因素和疾病類別的合并癥。

圖片

個人的健康受生活方式、環(huán)境、遺傳學(xué)以及醫(yī)療衛(wèi)生服務(wù)等因素的影響。目前,已有多項研究對某特定疾病或某一類型疾病進行了大型的生物醫(yī)學(xué)預(yù)測或評估研究,這些數(shù)據(jù)的快速積累為探索疾病機制、危險因素和預(yù)后標(biāo)志物提供了大量資源,但疾病的覆蓋范圍仍然不足。通過將多維健康信息與各種疾病類型相結(jié)合,可以更準(zhǔn)確的預(yù)測和更深入分析個體的健康狀況,并理解不同疾病風(fēng)險因素以及疾病之間的復(fù)雜聯(lián)系。

基于UK Biobank的數(shù)據(jù),研究團隊開發(fā)了一個全面的標(biāo)準(zhǔn)化流程來構(gòu)建UKB-MDRMF框架,包括數(shù)據(jù)預(yù)處理、模型構(gòu)建和應(yīng)用程序。UKB-MDRMF包括基本信息、生活方式、檢測、環(huán)境因素、遺傳學(xué)和影像數(shù)據(jù),是一個用于多種疾病聯(lián)合預(yù)測和風(fēng)險評估的綜合性生物醫(yī)學(xué)模型,可對1560種疾病進行個體多疾病預(yù)測和健康風(fēng)險評估。

圖片

圖:UKB-MDRMF構(gòu)建流程

1 數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理包括分別構(gòu)建和處理預(yù)測因子和反應(yīng)變量。研究團隊將輸入數(shù)據(jù)分為六類,從易到難逐步進行建模和分析,最終獲得了1106個輸入變量,其中幾種表型在預(yù)處理過程中產(chǎn)生了多個變量。同時,研究團隊還考慮了數(shù)據(jù)缺失問題,并適當(dāng)?shù)靥幚砹巳笔е?,獲得了準(zhǔn)確和可解釋的插補結(jié)果。對于反應(yīng)變量,研究使用了1560個苯丙氨酸氨基轉(zhuǎn)移酶代碼來系統(tǒng)地總結(jié)疾病。

2 模型構(gòu)建

UKB-MDRMF的模型構(gòu)建關(guān)注了個體疾病預(yù)測和風(fēng)險評估。對預(yù)測因子類型,研究從基本信息變量開始,逐漸結(jié)合不同的特征類型,最終包括遺傳變量。在疾病預(yù)測任務(wù)中,研究人員評估了各種方法,包括邏輯回歸、隨機森林、XGBoost、LightGBM、FCNN。不同疾病預(yù)測模型在各數(shù)據(jù)類別中的結(jié)果顯示,F(xiàn)CNN模型表現(xiàn)最好,在增加數(shù)據(jù)后,總體中值A(chǔ)UC超過0.7。傳統(tǒng)的非參數(shù)機器學(xué)習(xí)方法在多任務(wù)學(xué)習(xí)中表現(xiàn)中等。隨著更多的特征信息用于預(yù)測,所有模型的預(yù)測精度不斷提高。對于罕見病,CATI和FCNN的AUC較高,對于常見疾病,CATI、FCNN和邏輯回歸均表現(xiàn)良好。

各種類型疾病的預(yù)測準(zhǔn)確性揭示了口腔和腸道疾病具有相對較低的AUC值。相比之下,與生殖系統(tǒng)相關(guān)的疾病表現(xiàn)出明顯較高的預(yù)測準(zhǔn)確性,妊娠相關(guān)疾病的AUC超過0.95,生殖器疾病的AUC超過0.8。

圖片

圖:跨數(shù)據(jù)類別、疾病類型和流行水平的疾病預(yù)測和生存模型的比較性能。

風(fēng)險評估過程同樣遵循每一類預(yù)測因子的逐步增加策略,研究使用了傳統(tǒng)的Cox比例風(fēng)險模型、DeepSurv以及POPDxSurv等高級模型。在四個生存模型中,DeepSurv的表現(xiàn)優(yōu)于其他模型,其次是CATISurv。相比之下,POPDxSurv的性能相對較差,需要所有六個數(shù)據(jù)類別作為輸入才能獲得更好的預(yù)測結(jié)果。此外,CoxPH模型的準(zhǔn)確性隨著更多陽性病例的出現(xiàn)而提高,深度學(xué)習(xí)方法在罕見和常見疾病中的表現(xiàn)一直優(yōu)于DeepSurv。

對于幾乎所有疾病類型,疾病預(yù)測和生存模型都隨著更多的數(shù)據(jù)類別而改善。在增加生活方式、檢測和影像數(shù)據(jù)變量后,模型性能顯著改善。對于疾病預(yù)測任務(wù),生活方式和影像學(xué)變量對90.5%和100%疾病類型的顯著表現(xiàn)改善有貢獻,平均AUC分別增加2.3%和2.4%。相比之下,環(huán)境和遺傳學(xué)變量產(chǎn)生的改善較少。通過增加消化和神經(jīng)疾病的生活方式變量,模型性能實現(xiàn)了顯著改善;對于生殖疾病,僅使用基本信息就獲得了高度準(zhǔn)確的預(yù)測。

圖片

圖:采用FCNN和DeepSurv的不同疾病類型的模型性能圖。

3 模型驗證

研究團隊對UKB-MDRMF和幾種現(xiàn)有方法進行了比較分析,發(fā)現(xiàn)UKB-MDRMF利用不同的數(shù)據(jù)類型,對特定疾病表現(xiàn)出優(yōu)越的預(yù)測性能。

此外,研究通過UKB-MDRMF分析危險因素,評估了各種疾病的特征影響。結(jié)果顯示,基本信息對妊娠、血管和生殖器疾病最有預(yù)測性。生活方式變量對妊娠和皮質(zhì)神經(jīng)疾病有意義,而檢測變量影響生殖器疾病。環(huán)境變量影響上呼吸道疾病,影像變量影響心臟、血液和泌尿系統(tǒng)疾病,遺傳學(xué)變量對幾種疾病的影響相對一致,如心臟和眼睛疾病。同時,某些變量對疾病結(jié)果有著總體積極和消極影響。例如“躁郁癥或抑郁癥”的消失降低了所有疾病的發(fā)病率。相反,腰圍、體重指數(shù)、膽固醇和尿微量白蛋白的增加會促進各種疾病的發(fā)生。

為了突出疾病預(yù)測和風(fēng)險評估模型之間重要性的相似性和差異,研究團隊比較了表現(xiàn)最好的FCNN和DeepSurv模型的前十個變量。在預(yù)測和生存模型的重要性指標(biāo)中觀察到相似性,如影像相關(guān)、抑郁相關(guān)、脂肪相關(guān)和年齡相關(guān)變量。

最后,研究團隊利用All of Us研究數(shù)據(jù)對UKB-MDRMF框架進行了驗證,強調(diào)了該模型的穩(wěn)健性及其在分析不同人群多病性方面的適應(yīng)性和潛力。

4 結(jié)語

UKB-MDRMF為利用大規(guī)模生物醫(yī)學(xué)數(shù)據(jù)進行分析和建模提供了高效靈活的解決方案,可聯(lián)合預(yù)測和評估數(shù)千種疾病。結(jié)果表明,UKB-MDRMF超越了單一疾病模型,有效地揭示了多種風(fēng)險因素和疾病之間以及疾病本身之間的潛在聯(lián)系,并產(chǎn)生了優(yōu)越的預(yù)測性能。

UKB-MDRMF通過為多種疾病預(yù)測、風(fēng)險評估和多樣化應(yīng)用提供全面的解決方案,代表了該領(lǐng)域的重大進步,有望為醫(yī)療保健系統(tǒng)做出重大貢獻。多種疾病的聯(lián)合建模增強了表征多種疾病模式的能力,提供了對疾病如何共存的數(shù)據(jù)驅(qū)動探索,并揭示了大規(guī)模生物醫(yī)學(xué)數(shù)據(jù)集內(nèi)疾病之間相互聯(lián)系和影響的潛在機制,為更有針對性和個性化的患者護理方法鋪平了道路。

論文原文:

Jiang, Y., Zhao, B., Wang, X. et al. UKB-MDRMF: a multi-disease risk and multimorbidity framework based on UK biobank data. Nat Commun 16, 3767 (2025). https://doi.org/10.1038/s41467-025-58724-3

版權(quán)聲明:
本網(wǎng)站所有內(nèi)容來源注明為“梅斯醫(yī)學(xué)”或“MedSci原創(chuàng)”的文字、圖片和音視頻資料,版權(quán)均屬于梅斯醫(yī)學(xué)所有。非經(jīng)授權(quán),任何媒體、網(wǎng)站或個人不得轉(zhuǎn)載,授權(quán)轉(zhuǎn)載時須注明來源為“梅斯醫(yī)學(xué)”。其它來源的文章系轉(zhuǎn)載文章,或“梅斯號”自媒體發(fā)布的文章,僅系出于傳遞更多信息之目的,本站僅負責(zé)審核內(nèi)容合規(guī),其內(nèi)容不代表本站立場,本站不負責(zé)內(nèi)容的準(zhǔn)確性和版權(quán)。如果存在侵權(quán)、或不希望被轉(zhuǎn)載的媒體或個人可與我們聯(lián)系,我們將立即進行刪除處理。
在此留言

相關(guān)知識

Nat Commun(IF=17.694):藥物性肝損傷的候選血清蛋白生物標(biāo)志物
蘭州理工大學(xué)冉奮教授團隊 Nat. Commun.:肝素摻雜導(dǎo)電聚合物
解讀健康風(fēng)險評估和疾病風(fēng)險評估
Nat Med:基于73萬人遺傳和健康數(shù)據(jù)揭示遺傳風(fēng)險因素對壽命的影響
基于大數(shù)據(jù)老年多重慢性病風(fēng)險預(yù)測模型構(gòu)建探究
上海交大研究團隊合作破解腸道菌群結(jié)構(gòu)密碼,人體菌群“蹺蹺板”模型有望成為健康評估新標(biāo)準(zhǔn)
預(yù)測上百種疾病風(fēng)險,發(fā)現(xiàn)26個潛力新靶點!《細胞》:復(fù)旦團隊繪制人類健康與疾病蛋白質(zhì)組圖譜
手臂水腫粗如“大腿”?腫瘤醫(yī)院“上肢淋巴水腫兩全管理模式”已為1.4萬例患者提供專業(yè)評估及健康指導(dǎo)
三年內(nèi)研發(fā)動態(tài)風(fēng)險評估預(yù)測模型 為亞健康人群提供心血管病早期預(yù)警和干預(yù)
建立具有中國特色的環(huán)境與健康監(jiān)測、調(diào)查和風(fēng)險評估體系

網(wǎng)址: Nat Commun:覆蓋1560種疾??!中科大/阿里巴巴等團隊開發(fā)綜合性生物醫(yī)學(xué)預(yù)測和風(fēng)險評估模型UKB http://www.gysdgmq.cn/newsview1459354.html

推薦資訊