首頁(yè) 資訊 MedBench 最新榜單出爐!潤(rùn)達(dá)醫(yī)療聯(lián)合華為攬獲評(píng)測(cè)雙冠

MedBench 最新榜單出爐!潤(rùn)達(dá)醫(yī)療聯(lián)合華為攬獲評(píng)測(cè)雙冠

來源:泰然健康網(wǎng) 時(shí)間:2025年05月07日 18:51

5 月 6 日,醫(yī)療大模型評(píng)測(cè)平臺(tái) MedBench 發(fā)布新版評(píng)測(cè)榜單,潤(rùn)達(dá)醫(yī)療與華為基于華為云盤古大模型創(chuàng)新研發(fā)的潤(rùn)醫(yī)醫(yī)療大模型以 92.9 分在自測(cè)榜單中拔得頭籌,在專業(yè)評(píng)測(cè)榜單中以 85.2 分榮膺桂冠。潤(rùn)醫(yī)醫(yī)療大模型在醫(yī)學(xué)語(yǔ)言理解、醫(yī)學(xué)安全和倫理等核心測(cè)評(píng)維度中表現(xiàn)突出。

最新版 MedBench 榜單(2025 年 2 月版)

MedBench 作為中文醫(yī)療大模型權(quán)威評(píng)測(cè)平臺(tái),由上海人工智能實(shí)驗(yàn)室、上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合多家機(jī)構(gòu)打造,已成為全球醫(yī)療 AI 領(lǐng)域重要參照標(biāo)準(zhǔn)之一。目前,平臺(tái)已累計(jì)評(píng)測(cè)全球 387 個(gè)醫(yī)療大模型,從醫(yī)學(xué)語(yǔ)言理解、生成、知識(shí)問答、復(fù)雜推理及醫(yī)療安全倫理五大維度,提供客觀科學(xué)的性能評(píng)估。

潤(rùn)醫(yī)醫(yī)療大模型能夠一舉斬獲雙料第一,甚至在自測(cè)榜單中,醫(yī)學(xué)語(yǔ)言理解、醫(yī)療安全和倫理維度分別斬獲 122.1、103.1 高分,及在專業(yè)評(píng)測(cè)榜中,醫(yī)學(xué)語(yǔ)言理解維度斬獲 119.7 高分,充分佐證了潤(rùn)達(dá)醫(yī)療在醫(yī)療大模型研發(fā)領(lǐng)域深厚的技術(shù)積累與強(qiáng)大的創(chuàng)新硬實(shí)力。此外,在醫(yī)學(xué)復(fù)雜推理等高階復(fù)雜醫(yī)療場(chǎng)景中,模型也取得了領(lǐng)先的效果,凸顯了模型運(yùn)用醫(yī)學(xué)知識(shí)進(jìn)行復(fù)雜分析和嚴(yán)謹(jǐn)推理的能力,將在醫(yī)學(xué)輔助診療、提升醫(yī)療效率和準(zhǔn)確率等方面發(fā)揮重要作用。

多維能力突出重構(gòu)人機(jī)協(xié)同范式

潤(rùn)醫(yī)醫(yī)療大模型在華為云盤古大模型 L0 層的基礎(chǔ)上,訓(xùn)練使用了千億級(jí)高質(zhì)量的中英文醫(yī)學(xué)文獻(xiàn)、醫(yī)學(xué)指南、書籍,及千萬(wàn)量級(jí)醫(yī)療健康檔案和知識(shí)圖譜等數(shù)據(jù),融合高質(zhì)量通用數(shù)據(jù),構(gòu)成了潤(rùn)醫(yī)醫(yī)療大模型底座。

從技術(shù)特性來看,380 億高參數(shù)量賦予模型強(qiáng)大的學(xué)習(xí)能力,使其能夠精準(zhǔn)捕捉醫(yī)療數(shù)據(jù)中的復(fù)雜模式與內(nèi)在關(guān)系,顯著提升語(yǔ)言理解和生成能力,足以勝任各類復(fù)雜醫(yī)療任務(wù)。而支持 32k 序列長(zhǎng)度,則確保模型具備卓越的長(zhǎng)文本處理能力,能夠充分理解上下文語(yǔ)義,極大增強(qiáng)對(duì)復(fù)雜醫(yī)療文本的分析解讀效能,可在多輪對(duì)話、復(fù)雜病例分析等應(yīng)用場(chǎng)景中優(yōu)勢(shì)明顯。作為大模型訓(xùn)練的核心要素,海量高質(zhì)量數(shù)據(jù)為模型提供了豐富且準(zhǔn)確的知識(shí)來源,可有效提升模型泛化能力,使其在各類實(shí)際醫(yī)療場(chǎng)景中能夠做出更精準(zhǔn)的判斷與決策。

基于模型底座,潤(rùn)達(dá)醫(yī)療還創(chuàng)新研發(fā)了循證推理引擎,通過構(gòu)建“動(dòng)態(tài)權(quán)重分配、證據(jù)鏈追溯與不確定性量化”的“三位一體”臨床決策系統(tǒng)。其中,動(dòng)態(tài)權(quán)重分配確保了模型可實(shí)時(shí)聚焦關(guān)鍵醫(yī)學(xué)信息;證據(jù)鏈追溯則通過知識(shí)圖譜,能夠驗(yàn)證推理路徑;不確定性量化則對(duì)模糊信息進(jìn)行概率評(píng)估。三項(xiàng)創(chuàng)新機(jī)制的協(xié)同運(yùn)作,有效將模型幻覺率嚴(yán)格控制了在醫(yī)療級(jí)安全閾值內(nèi)。不僅如此,潤(rùn)達(dá)醫(yī)療還打造具有雙向進(jìn)化機(jī)制的可信 AI 大腦,在服務(wù)醫(yī)生的過程中持續(xù)學(xué)習(xí)臨床反饋,反向優(yōu)化自身推理路徑,重構(gòu)人機(jī)協(xié)同范式,讓 AI 成為醫(yī)生智慧的延伸,更精準(zhǔn)地滿足醫(yī)生和患者的知識(shí)需求,真正成為醫(yī)療場(chǎng)景中可靠的智能助手。

得益于多項(xiàng)核心創(chuàng)新技術(shù)的有力支撐,潤(rùn)醫(yī)醫(yī)療大模型在 MedBench 評(píng)測(cè)的多個(gè)維度中均展現(xiàn)卓越性能,尤其是語(yǔ)言理解與醫(yī)療安全和倫理維度。在醫(yī)學(xué)語(yǔ)言理解上,動(dòng)態(tài)權(quán)重分配、證據(jù)鏈追溯與不確定性量化機(jī)制協(xié)同,可精準(zhǔn)捕捉文本關(guān)鍵信息與邏輯。而在醫(yī)療安全與倫理維度,“循證推理 + 可信 AI”架構(gòu)深度剖析復(fù)雜場(chǎng)景,嚴(yán)格審查倫理風(fēng)險(xiǎn),為醫(yī)療質(zhì)效提升與合規(guī)安全筑牢雙重保障。

真實(shí)場(chǎng)景驗(yàn)證賦能醫(yī)療質(zhì)效革新

從技術(shù)突破到民生福祉,潤(rùn)達(dá)醫(yī)療基于大模型和數(shù)據(jù)治理的智慧醫(yī)療解決方案,貫穿“防-治-管”全流程,提供覆蓋疾病預(yù)防、診斷治療、患者管理的全生命周期服務(wù),已在智慧檢驗(yàn)、病情分析、病歷生成與質(zhì)控、區(qū)域健康管理等多維度真實(shí)醫(yī)療場(chǎng)景中完成實(shí)踐驗(yàn)證,成功實(shí)現(xiàn)智慧診療全場(chǎng)景落地應(yīng)用。

基于潤(rùn)醫(yī)醫(yī)療大模型,潤(rùn)達(dá)醫(yī)療與美年健康共同孵化的國(guó)內(nèi)首款 AI 私人健康管理師“健康小美”,截至今年 3 月底,其智能主檢應(yīng)用已在美年健康 109 家體檢中心上線應(yīng)用,且審核并生成超 39 萬(wàn)份體檢報(bào)告,重點(diǎn)指標(biāo)精準(zhǔn)率 90%+。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)知識(shí)

“京醫(yī)千詢”大模型斬獲MedBench評(píng)測(cè)榜首 京東健康領(lǐng)跑醫(yī)療健康智能化賽道
北京減肥瘦身醫(yī)院排名榜單新鮮出爐,附價(jià)格表!
長(zhǎng)沙市瓷肌祛痘醫(yī)生排行榜單出爐
武漢腹部減肥醫(yī)院新排名前十榜單重磅出爐!
2024胡潤(rùn)中國(guó)醫(yī)療青年企業(yè)家榜單 2024醫(yī)療行業(yè)杰出青年企業(yè)家名單→買購(gòu)網(wǎng)
深圳抽脂醫(yī)院排名前十榜單新鮮出爐!*新排名揭曉!
北京按摩治療減肥口碑醫(yī)院排名榜新出爐!
東莞埋線減肥醫(yī)院排行榜揭曉:榜單新鮮出爐!
呼吸系統(tǒng)化藥TOP20出爐!8億感冒藥領(lǐng)跑,13個(gè)品牌大漲,吳太感康、葵花、華潤(rùn)上榜
大同市臀部抽脂塑形手術(shù)醫(yī)院排名前十榜單出爐,資訊已發(fā)布

網(wǎng)址: MedBench 最新榜單出爐!潤(rùn)達(dá)醫(yī)療聯(lián)合華為攬獲評(píng)測(cè)雙冠 http://www.gysdgmq.cn/newsview1218282.html

推薦資訊