首頁(yè) 資訊 MedBench 最新榜單出爐！潤(rùn)達(dá)醫(yī)療聯(lián)合華為攬獲評(píng)測(cè)雙冠

MedBench 最新榜單出爐！潤(rùn)達(dá)醫(yī)療聯(lián)合華為攬獲評(píng)測(cè)雙冠

來(lái)源：泰然健康網(wǎng) 時(shí)間：2025年05月07日 18:51

5 月 6 日，醫(yī)療大模型評(píng)測(cè)平臺(tái) MedBench 發(fā)布新版評(píng)測(cè)榜單，潤(rùn)達(dá)醫(yī)療與華為基于華為云盤(pán)古大模型創(chuàng)新研發(fā)的潤(rùn)醫(yī)醫(yī)療大模型以 92.9 分在自測(cè)榜單中拔得頭籌，在專(zhuān)業(yè)評(píng)測(cè)榜單中以 85.2 分榮膺桂冠。潤(rùn)醫(yī)醫(yī)療大模型在醫(yī)學(xué)語(yǔ)言理解、醫(yī)學(xué)安全和倫理等核心測(cè)評(píng)維度中表現(xiàn)突出。

最新版 MedBench 榜單（2025 年 2 月版）

MedBench 作為中文醫(yī)療大模型權(quán)威評(píng)測(cè)平臺(tái)，由上海人工智能實(shí)驗(yàn)室、上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合多家機(jī)構(gòu)打造，已成為全球醫(yī)療 AI 領(lǐng)域重要參照標(biāo)準(zhǔn)之一。目前，平臺(tái)已累計(jì)評(píng)測(cè)全球 387 個(gè)醫(yī)療大模型，從醫(yī)學(xué)語(yǔ)言理解、生成、知識(shí)問(wèn)答、復(fù)雜推理及醫(yī)療安全倫理五大維度，提供客觀(guān)科學(xué)的性能評(píng)估。

潤(rùn)醫(yī)醫(yī)療大模型能夠一舉斬獲雙料第一，甚至在自測(cè)榜單中，醫(yī)學(xué)語(yǔ)言理解、醫(yī)療安全和倫理維度分別斬獲 122.1、103.1 高分，及在專(zhuān)業(yè)評(píng)測(cè)榜中，醫(yī)學(xué)語(yǔ)言理解維度斬獲 119.7 高分，充分佐證了潤(rùn)達(dá)醫(yī)療在醫(yī)療大模型研發(fā)領(lǐng)域深厚的技術(shù)積累與強(qiáng)大的創(chuàng)新硬實(shí)力。此外，在醫(yī)學(xué)復(fù)雜推理等高階復(fù)雜醫(yī)療場(chǎng)景中，模型也取得了領(lǐng)先的效果，凸顯了模型運(yùn)用醫(yī)學(xué)知識(shí)進(jìn)行復(fù)雜分析和嚴(yán)謹(jǐn)推理的能力，將在醫(yī)學(xué)輔助診療、提升醫(yī)療效率和準(zhǔn)確率等方面發(fā)揮重要作用。

多維能力突出重構(gòu)人機(jī)協(xié)同范式

潤(rùn)醫(yī)醫(yī)療大模型在華為云盤(pán)古大模型 L0 層的基礎(chǔ)上，訓(xùn)練使用了千億級(jí)高質(zhì)量的中英文醫(yī)學(xué)文獻(xiàn)、醫(yī)學(xué)指南、書(shū)籍，及千萬(wàn)量級(jí)醫(yī)療健康檔案和知識(shí)圖譜等數(shù)據(jù)，融合高質(zhì)量通用數(shù)據(jù)，構(gòu)成了潤(rùn)醫(yī)醫(yī)療大模型底座。

從技術(shù)特性來(lái)看，380 億高參數(shù)量賦予模型強(qiáng)大的學(xué)習(xí)能力，使其能夠精準(zhǔn)捕捉醫(yī)療數(shù)據(jù)中的復(fù)雜模式與內(nèi)在關(guān)系，顯著提升語(yǔ)言理解和生成能力，足以勝任各類(lèi)復(fù)雜醫(yī)療任務(wù)。而支持 32k 序列長(zhǎng)度，則確保模型具備卓越的長(zhǎng)文本處理能力，能夠充分理解上下文語(yǔ)義，極大增強(qiáng)對(duì)復(fù)雜醫(yī)療文本的分析解讀效能，可在多輪對(duì)話(huà)、復(fù)雜病例分析等應(yīng)用場(chǎng)景中優(yōu)勢(shì)明顯。作為大模型訓(xùn)練的核心要素，海量高質(zhì)量數(shù)據(jù)為模型提供了豐富且準(zhǔn)確的知識(shí)來(lái)源，可有效提升模型泛化能力，使其在各類(lèi)實(shí)際醫(yī)療場(chǎng)景中能夠做出更精準(zhǔn)的判斷與決策。

基于模型底座，潤(rùn)達(dá)醫(yī)療還創(chuàng)新研發(fā)了循證推理引擎，通過(guò)構(gòu)建“動(dòng)態(tài)權(quán)重分配、證據(jù)鏈追溯與不確定性量化”的“三位一體”臨床決策系統(tǒng)。其中，動(dòng)態(tài)權(quán)重分配確保了模型可實(shí)時(shí)聚焦關(guān)鍵醫(yī)學(xué)信息；證據(jù)鏈追溯則通過(guò)知識(shí)圖譜，能夠驗(yàn)證推理路徑；不確定性量化則對(duì)模糊信息進(jìn)行概率評(píng)估。三項(xiàng)創(chuàng)新機(jī)制的協(xié)同運(yùn)作，有效將模型幻覺(jué)率嚴(yán)格控制了在醫(yī)療級(jí)安全閾值內(nèi)。不僅如此，潤(rùn)達(dá)醫(yī)療還打造具有雙向進(jìn)化機(jī)制的可信 AI 大腦，在服務(wù)醫(yī)生的過(guò)程中持續(xù)學(xué)習(xí)臨床反饋，反向優(yōu)化自身推理路徑，重構(gòu)人機(jī)協(xié)同范式，讓 AI 成為醫(yī)生智慧的延伸，更精準(zhǔn)地滿(mǎn)足醫(yī)生和患者的知識(shí)需求，真正成為醫(yī)療場(chǎng)景中可靠的智能助手。

得益于多項(xiàng)核心創(chuàng)新技術(shù)的有力支撐，潤(rùn)醫(yī)醫(yī)療大模型在 MedBench 評(píng)測(cè)的多個(gè)維度中均展現(xiàn)卓越性能，尤其是語(yǔ)言理解與醫(yī)療安全和倫理維度。在醫(yī)學(xué)語(yǔ)言理解上，動(dòng)態(tài)權(quán)重分配、證據(jù)鏈追溯與不確定性量化機(jī)制協(xié)同，可精準(zhǔn)捕捉文本關(guān)鍵信息與邏輯。而在醫(yī)療安全與倫理維度，“循證推理 + 可信 AI”架構(gòu)深度剖析復(fù)雜場(chǎng)景，嚴(yán)格審查倫理風(fēng)險(xiǎn)，為醫(yī)療質(zhì)效提升與合規(guī)安全筑牢雙重保障。

真實(shí)場(chǎng)景驗(yàn)證賦能醫(yī)療質(zhì)效革新

從技術(shù)突破到民生福祉，潤(rùn)達(dá)醫(yī)療基于大模型和數(shù)據(jù)治理的智慧醫(yī)療解決方案，貫穿“防-治-管”全流程，提供覆蓋疾病預(yù)防、診斷治療、患者管理的全生命周期服務(wù)，已在智慧檢驗(yàn)、病情分析、病歷生成與質(zhì)控、區(qū)域健康管理等多維度真實(shí)醫(yī)療場(chǎng)景中完成實(shí)踐驗(yàn)證，成功實(shí)現(xiàn)智慧診療全場(chǎng)景落地應(yīng)用。

基于潤(rùn)醫(yī)醫(yī)療大模型，潤(rùn)達(dá)醫(yī)療與美年健康共同孵化的國(guó)內(nèi)首款 AI 私人健康管理師“健康小美”，截至今年 3 月底，其智能主檢應(yīng)用已在美年健康 109 家體檢中心上線(xiàn)應(yīng)用，且審核并生成超 39 萬(wàn)份體檢報(bào)告，重點(diǎn)指標(biāo)精準(zhǔn)率 90%+。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

網(wǎng)址: MedBench 最新榜單出爐！潤(rùn)達(dá)醫(yī)療聯(lián)合華為攬獲評(píng)測(cè)雙冠 http://www.gysdgmq.cn/newsview1218282.html