人工智能正在深刻改變?nèi)祟惿鐣姆椒矫婷?,而醫(yī)療健康領(lǐng)域無疑是AI技術(shù)最具變革潛力的應(yīng)用場景之一。自2022年OpenAI發(fā)布ChatGPT以來,基于大語言模型(LLMs)的AI系統(tǒng)在醫(yī)療領(lǐng)域的應(yīng)用呈現(xiàn)爆發(fā)式增長。從臨床診斷輔助、醫(yī)療文檔生成,到患者溝通教育、科研文獻(xiàn)分析, LLMs正在重新定義醫(yī)療服務(wù)的交付方式。然而,數(shù)據(jù)隱私、算法偏見、監(jiān)管倫理等挑戰(zhàn)也日益凸顯。如何平衡創(chuàng)新與安全,實(shí)現(xiàn)LLMs在醫(yī)療領(lǐng)域的負(fù)責(zé)任應(yīng)用,成為亟待解答的關(guān)鍵問題。

近日,來自巴基斯坦、孟加拉國等多國醫(yī)學(xué)院的研究團(tuán)隊(duì)在《 Journal of Intelligent Medicine》發(fā)表了題為"Transforming healthcare with large language models: Current applications, challenges, and future directions—a literature review" 的綜述文章。該研究系統(tǒng)梳理了LLMs在醫(yī)療領(lǐng)域的多維應(yīng)用現(xiàn)狀,深入分析了實(shí)施障礙與倫理挑戰(zhàn),并前瞻性地展望了多模態(tài)模型、生物分子分析等前沿方向,為醫(yī)療AI的健康發(fā)展提供了全面的參考框架。
在本次綜述中,作者總結(jié)了LLMs在增強(qiáng)臨床實(shí)踐中從診斷到治療的臨床應(yīng)用、醫(yī)療文書撰寫、醫(yī)患溝通與教育、前沿研究與藥物研發(fā)四個方面的新興作用,深入研究了這些技術(shù)的應(yīng)用、優(yōu)勢、挑戰(zhàn)和實(shí)際實(shí)施。LLMs具有革新醫(yī)療中溝通、信息管理和教育的巨大潛力。
一、臨床應(yīng)用:從診斷到治療的全流程賦能 心電圖(ECG)解讀:ChatGPT-4在解讀心電圖時(shí),展現(xiàn)了驚人的97.5%的準(zhǔn)確率,其表現(xiàn)優(yōu)于急診醫(yī)學(xué)專家和心臟病專家。 影像學(xué)診斷:在針對861項(xiàng)研究的回顧中發(fā)現(xiàn),ChatGPT在多項(xiàng)醫(yī)療任務(wù)中的中位準(zhǔn)確率達(dá)到70.5%,其結(jié)論與金標(biāo)準(zhǔn)的一致性中位數(shù)高達(dá)83.6%。在更高級的思考、放射學(xué)術(shù)語理解和圖像描述準(zhǔn)確性方面,GPT-4版本顯著優(yōu)于GPT-3.5。 復(fù)雜病例挑戰(zhàn):在一項(xiàng)針對具有挑戰(zhàn)性的胃腸道癥狀病例的診斷研究中,醫(yī)生的準(zhǔn)確率在2.6%到40.3% 之間波動,而ChatGPT-4o的診斷準(zhǔn)確率高達(dá)72.7%,顯著高于醫(yī)生。 專業(yè)資格考試:ChatGPT在509道神經(jīng)病學(xué)委員會式文本問題中,首次嘗試正確率為65.87%,經(jīng)過三次嘗試后可提升至75.3%。Med-PaLM 2模型在USMLE風(fēng)格的MedQA問題上取得了86.5% 的優(yōu)異成績。 圖1 大語言模型架構(gòu)序列示意圖
二、醫(yī)療文書與效率革命:解放醫(yī)生的雙手 醫(yī)療文檔占用了臨床醫(yī)生大量時(shí)間。Veen等人的研究顯示,針對臨床摘要任務(wù)調(diào)整的LLMs在完整性和準(zhǔn)確性等多個維度上超越了人類專家,醫(yī)生甚至更偏好LLMs生成的摘要。將LLMs整合到臨床環(huán)境可以大幅減少醫(yī)生的文檔負(fù)擔(dān),讓他們更專注于患者護(hù)理。 圖2 醫(yī)學(xué)大語言模型的訓(xùn)練過程 圖3 公共衛(wèi)生中使用的預(yù)測模型可視化表示 三、醫(yī)患溝通與教育:更貼心、更高效的“AI顧問” LLMs能夠提供個性化、高同理心的健康咨詢與教育,改善患者體驗(yàn)。 溝通質(zhì)量:一項(xiàng)評估發(fā)現(xiàn),在回答患者提問時(shí),ChatGPT提供的回答質(zhì)量被認(rèn)為是醫(yī)生回答的3.6倍,其同理心水平被認(rèn)為是醫(yī)生回答的9.8倍。 行為干預(yù):與基于LLMs的聊天機(jī)器人進(jìn)行關(guān)于戒煙等健康行為的交流,可以增強(qiáng)用戶的治療聯(lián)盟和戒煙動機(jī),顯示出其在慢性病管理和健康促進(jìn)中的應(yīng)用潛力。

四、前沿研究與藥物研發(fā) 在生物醫(yī)學(xué)研究領(lǐng)域,專業(yè)化的LLMs正成為科學(xué)家們的強(qiáng)大工具。BioBERT模型在生物醫(yī)學(xué)實(shí)體識別、關(guān)系抽取和問答任務(wù)上,分別實(shí)現(xiàn)了0.62%、2.80% 和12.24% 的F1分?jǐn)?shù)提升。Galactica模型在科學(xué)推理和技術(shù)知識方面,以68.2% 的優(yōu)勢超越ChatGPT。以AlphaFold為代表的AI系統(tǒng),利用先進(jìn)的預(yù)測算法,以前所未有的精度預(yù)測蛋白質(zhì)三維結(jié)構(gòu),為靶點(diǎn)發(fā)現(xiàn)和新藥設(shè)計(jì)開辟了革命性道路。 圖4 醫(yī)療應(yīng)用大語言模型開發(fā)和發(fā)布的量子飛躍 本綜述在強(qiáng)調(diào)大語言模型(LLMs)的潛在益處與應(yīng)用的同時(shí),也指出了其使用中的若干局限性和挑戰(zhàn),例如缺乏醫(yī)學(xué)知識、回復(fù)不準(zhǔn)確或過時(shí)、提供有偏見的信息,以及涉及透明度、數(shù)據(jù)隱私、公平性和問責(zé)制等社會與倫理問題。解決這些挑戰(zhàn),對于提升醫(yī)學(xué)教育、醫(yī)療管理效率和患者護(hù)理水平至關(guān)重要。未來應(yīng)采取步驟提高LLMs準(zhǔn)確性,特別是在管理建議和臨床診斷方面,并通過使用偏見檢測機(jī)制和持續(xù)偏見監(jiān)測來解決偏見。應(yīng)解決與知情同意、患者保密性和錯誤信息潛在風(fēng)險(xiǎn)相關(guān)的倫理問題。需要進(jìn)一步探索LLMs在復(fù)雜醫(yī)學(xué)場景和專業(yè)醫(yī)學(xué)領(lǐng)域中的應(yīng)用,需要進(jìn)一步研究LLMs在管理復(fù)雜和罕見疾病中的使用。 平衡鼓勵創(chuàng)新與維護(hù)倫理標(biāo)準(zhǔn)的方法對于LLMs負(fù)責(zé)任地整合到醫(yī)療實(shí)踐中至關(guān)重要。隨著技術(shù)的不斷進(jìn)步和完善,相信LLMs將為醫(yī)療領(lǐng)域帶來更多的突破和進(jìn)步,最終造福全球患者。 更多細(xì)節(jié)與數(shù)據(jù)請查看原文: https://doi.org/10.1002/jim4.70015
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。
Copyright ? 2022 上海科雷會展服務(wù)有限公司 旗下「智慧醫(yī)療網(wǎng)」版權(quán)所有 ICP備案號:滬ICP備17004559號-5