首頁(yè) 資訊 跨物種細(xì)胞圖譜:陳

跨物種細(xì)胞圖譜:陳

來(lái)源:泰然健康網(wǎng) 時(shí)間:2025年06月01日 07:02
The Cross-Species Cell Atlas: Chan Zuckerberg Initiative Releases TranscriptFormer AI Model

美國(guó)英語(yǔ)科技、生物

新聞源:GEN - Genetic Engineering and Biotechnology News

2025-04-30 21:00:00閱讀時(shí)長(zhǎng)4分鐘1709字

TranscriptFormerAI模型細(xì)胞生物學(xué)人類健康疾病狀態(tài)識(shí)別細(xì)胞療法免疫系統(tǒng)疾病檢測(cè)預(yù)防細(xì)胞類型分類跨物種分析

內(nèi)容摘要

陳-扎克伯格倡議(CZI)發(fā)布了新的生成式AI模型TranscriptFormer,該模型基于覆蓋15億年進(jìn)化的單細(xì)胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)訓(xùn)練而成,能夠跨物種探究細(xì)胞生物學(xué),為治療應(yīng)用提供支持。

“嘿,模型,如果我用某個(gè)細(xì)胞類型的標(biāo)記基因提示你,你能完成這些基因表達(dá)的轉(zhuǎn)錄因子嗎?” 陳-扎克伯格倡議(CZI)的人工智能負(fù)責(zé)人Theofanis Karaletsos提出了這個(gè)問(wèn)題。他設(shè)想了一個(gè)未來(lái),在這個(gè)未來(lái)中,科學(xué)家不再需要通過(guò)大量的文獻(xiàn)、數(shù)據(jù)和實(shí)驗(yàn)來(lái)提出一個(gè)非常具體的生物學(xué)問(wèn)題。

相反,Karaletsos看到了一個(gè)轉(zhuǎn)折點(diǎn),即AI模型可以從大數(shù)據(jù)中提取模式,按需產(chǎn)生有意義的生物學(xué)見(jiàn)解,這與查詢ChatGPT和瀏覽數(shù)百本圖書(shū)館書(shū)籍之間的區(qū)別。

為了實(shí)現(xiàn)這一愿景,Karaletsos和他的CZI同事發(fā)布了TranscriptFormer,這是一種生成式多物種模型,用于跨生物體探究細(xì)胞生物學(xué)。

這篇預(yù)印本已發(fā)布在bioRxiv上,尚未經(jīng)過(guò)同行評(píng)審,作者展示了TranscriptFormer可以被提示預(yù)測(cè)特定細(xì)胞類型的轉(zhuǎn)錄因子和基因-基因相互作用,這些預(yù)測(cè)與獨(dú)立實(shí)驗(yàn)觀察結(jié)果一致。

TranscriptFormer是在來(lái)自12個(gè)不同物種的超過(guò)1.1億個(gè)細(xì)胞的單細(xì)胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)上訓(xùn)練的,從而涵蓋了15億年的進(jìn)化。該模型的其他廣泛功能包括疾病狀態(tài)識(shí)別、比較生物學(xué)、編碼多層次生物結(jié)構(gòu)等。

“如果你考慮細(xì)胞圖譜領(lǐng)域,人們?cè)谶^(guò)去十年里一直在生成數(shù)據(jù),但沒(méi)有人知道如何將這些數(shù)據(jù)整合成一個(gè)單一的參考?!盋ZI科學(xué)負(fù)責(zé)人Stephen Quake博士在接受《GEN》雜志采訪時(shí)說(shuō),“我們認(rèn)為T(mén)ranscriptFormer可以像對(duì)所有細(xì)胞圖譜數(shù)據(jù)進(jìn)行基因組組裝一樣?!?/p>

Quake表示,TranscriptFormer將在設(shè)計(jì)合成生物學(xué)和細(xì)胞療法的工程細(xì)胞狀態(tài)方面提供強(qiáng)大的應(yīng)用,同時(shí)還能提供進(jìn)化見(jiàn)解,以理解物種之間的關(guān)系。

TranscriptFormer是CZI虛擬細(xì)胞計(jì)劃的一個(gè)進(jìn)步,這是非營(yíng)利組織在四月份設(shè)定的四個(gè)科學(xué)重大挑戰(zhàn)之一,旨在通過(guò)AI和生物學(xué)的交叉來(lái)改變?nèi)祟惤】怠F渌魬?zhàn)包括開(kāi)發(fā)成像技術(shù)以繪制復(fù)雜的生物系統(tǒng)圖譜,創(chuàng)建新的工具以實(shí)時(shí)測(cè)量組織中的炎癥,以及利用免疫系統(tǒng)進(jìn)行疾病的早期檢測(cè)、預(yù)防和治療。

此外,CZI認(rèn)為“你需要更多的數(shù)據(jù)”,同時(shí)在選擇要生成的數(shù)據(jù)時(shí)要有策略。TranscriptFormer的發(fā)布緊隨CZI于二月份宣布的十億細(xì)胞項(xiàng)目,該項(xiàng)目與10X Genomics和Ultima Genomics合作,生成前所未有的十億細(xì)胞數(shù)據(jù)集,以推動(dòng)生物學(xué)中AI模型的快速發(fā)展。

CZI并不是唯一涉足虛擬細(xì)胞領(lǐng)域的實(shí)體。本周早些時(shí)候,Arc研究所宣布了擴(kuò)展Arc虛擬細(xì)胞圖譜的努力。這家位于帕洛阿爾托的研究機(jī)構(gòu)也以在大數(shù)據(jù)驅(qū)動(dòng)的AI方面進(jìn)行大規(guī)模投資而聞名。今年二月,Arc與Nvidia合作構(gòu)建的基因組基礎(chǔ)模型Evo 2引起了轟動(dòng),成為迄今為止最大的公開(kāi)可用的生物AI模型。

什么是細(xì)胞類型

根據(jù)作者的說(shuō)法,TranscriptFormer展示了擴(kuò)大進(jìn)化預(yù)訓(xùn)練數(shù)據(jù)如何增強(qiáng)模型在任務(wù)和物種上的泛化能力。

“我們沒(méi)有賦予模型關(guān)于‘什么是細(xì)胞類型’或‘什么是物種’的知識(shí)。它看到數(shù)百萬(wàn)個(gè)細(xì)胞并學(xué)習(xí)出現(xiàn)的結(jié)構(gòu),”Karaletsos告訴《GEN》。

在細(xì)胞類型分類中,TranscriptFormer成功地識(shí)別了新物種的細(xì)胞類型,這些新物種在訓(xùn)練過(guò)程中未見(jiàn)過(guò),并且相隔超過(guò)6.85億年的進(jìn)化距離。在疾病狀態(tài)預(yù)測(cè)中,該模型有效地分離了感染SARS-CoV-2的健康和患病細(xì)胞,無(wú)需特定的COVID-19細(xì)胞數(shù)據(jù)集。TranscriptFormer還能夠?qū)W習(xí)多層次生物結(jié)構(gòu)的出現(xiàn)特性,并根據(jù)不同的組織環(huán)境對(duì)細(xì)胞進(jìn)行聚類。

此外,Karaletsos強(qiáng)調(diào),跨物種分析的能力提供了闡明模型生物如何轉(zhuǎn)化為人類的機(jī)會(huì)。

“我們知道小鼠教會(huì)了我們很多關(guān)于毒性和一期臨床試驗(yàn)的知識(shí),但在機(jī)制上,我們還沒(méi)有一個(gè)模型來(lái)預(yù)測(cè)哪些東西會(huì)轉(zhuǎn)移,哪些不會(huì)?!盞araletsos告訴《GEN》?!癟ranscriptFormer是這一軌跡上的堅(jiān)實(shí)第一步。”

至于我們是否已經(jīng)到達(dá)了生物數(shù)據(jù)的ChatGPT提示器階段,Karaletsos表示TranscriptFormer還有很長(zhǎng)的迭代增長(zhǎng)之路。展望未來(lái),團(tuán)隊(duì)將專注于擴(kuò)展模型數(shù)據(jù)到更多樣化的物種和多種模態(tài),如蛋白質(zhì)組學(xué)和基因組學(xué),以進(jìn)一步增加其泛化范圍。

TranscriptFormer在CZI的虛擬細(xì)胞平臺(tái)上公開(kāi)可訪問(wèn),代碼可在GitHub上獲得。此外,研究社區(qū)已發(fā)布了一個(gè)跨物種細(xì)胞預(yù)測(cè)的演示教程筆記本。


(全文結(jié)束)

相關(guān)知識(shí)

人類細(xì)胞圖譜將成為健康研究的“谷歌地圖”
中國(guó)科學(xué)家系統(tǒng)揭示人類消化道“發(fā)育細(xì)胞圖譜”
《自然》重磅專題:“人類細(xì)胞圖譜”40余篇論文齊發(fā),重新認(rèn)識(shí)人體!一文看懂三大新進(jìn)展
促進(jìn)細(xì)胞新陳代謝
單細(xì)胞多組學(xué)分析揭示哺乳期母體低蛋白飲食對(duì)子代的跨代傳遞
綠色細(xì)胞食品批發(fā)
合理膳食是健康的基礎(chǔ),細(xì)胞通過(guò)氧化分解有機(jī)物獲得能量,脂肪、蛋白質(zhì)等有機(jī)物可以作為細(xì)胞呼吸的原料,也可以相互轉(zhuǎn)化。如圖是人體肝細(xì)胞內(nèi)的部分生化反應(yīng)及其聯(lián)系的示意
多發(fā)性硬化癥基因組圖譜暗示免疫細(xì)胞對(duì)疾病的敏感性
科學(xué)網(wǎng)—細(xì)胞的基本生命活動(dòng)——新陳代謝
細(xì)胞培養(yǎng)生物污染有哪些?

網(wǎng)址: 跨物種細(xì)胞圖譜:陳 http://www.gysdgmq.cn/newsview1349330.html

推薦資訊