2026年4月23日,OpenAI正式推出面向醫(yī)生的AI工具ChatGPT for Clinicians,向所有經(jīng)過身份驗(yàn)證的美國執(zhí)業(yè)醫(yī)師、執(zhí)業(yè)護(hù)士、醫(yī)師助理和藥劑師免費(fèi)開放。該工具基于GPT-5.4大模型構(gòu)建,專注于循證醫(yī)學(xué)賽道,在全新發(fā)布的醫(yī)療評(píng)測(cè)基準(zhǔn)HealthBench Professional上,以59.0分的總分全面超越人類醫(yī)生的43.7分——即便后者擁有無限時(shí)間和聯(lián)網(wǎng)權(quán)限。通用大模型巨頭正用“免費(fèi)+更優(yōu)性能”的打法,向已估值120億美元的垂直賽道領(lǐng)軍者發(fā)起正面沖擊。
精準(zhǔn)復(fù)刻循證醫(yī)學(xué)賽道:ChatGPT for Clinicians的五大核心功能
當(dāng)業(yè)內(nèi)人士看到ChatGPT for Clinicians的功能清單時(shí),感覺似曾相識(shí)。
這款免費(fèi)醫(yī)生版ChatGPT的核心能力與OpenEvidence高度重合。第一,免費(fèi)開放先進(jìn)醫(yī)療AI模型,幫助醫(yī)生處理日常文書工作和醫(yī)學(xué)研究,無需額外付費(fèi)。第二,依托循證醫(yī)學(xué)能力,AI能夠從權(quán)威審核的醫(yī)學(xué)資料中快速分析臨床病例,提供診斷判斷建議。第三,將重復(fù)性醫(yī)療工作封裝為固定模板,醫(yī)生可一鍵生成轉(zhuǎn)診單、診療授權(quán)書、患者須知等文檔。第四,高效完成醫(yī)學(xué)期刊文獻(xiàn)檢索與匯總,AI自動(dòng)篩選權(quán)威資料,數(shù)分鐘內(nèi)生成標(biāo)注完整引用的專業(yè)報(bào)告。第五,臨床學(xué)習(xí)積分同步——醫(yī)生日常使用AI查詢、解答臨床問題時(shí),合規(guī)的專業(yè)內(nèi)容查閱記錄可自動(dòng)折算為繼續(xù)醫(yī)學(xué)教育學(xué)分,無需單獨(dú)整理材料或額外上課。在數(shù)據(jù)安全方面,OpenAI承諾對(duì)話內(nèi)容不用于模型訓(xùn)練,符合條件的賬戶還可通過業(yè)務(wù)伙伴協(xié)議獲得HIPAA合規(guī)支持。

不過,在同類功能之上,GPT-5.4帶來了更強(qiáng)的底層模型能力與安全驗(yàn)證。據(jù)美國醫(yī)學(xué)會(huì)最新調(diào)查,已有72%的醫(yī)生將AI應(yīng)用于臨床實(shí)踐,較去年的48%大幅躍升。OpenAI發(fā)言人Karan Singhal透露,過去一年臨床醫(yī)生使用公共版ChatGPT的頻率已翻倍。ChatGPT for Clinicians正是對(duì)這一需求的結(jié)構(gòu)化回應(yīng)——將通用大模型的能力精準(zhǔn)封裝為醫(yī)療工作流工具。
性能碾壓人類醫(yī)生,OpenEvidence面臨“碾壓+免費(fèi)”雙重夾擊
ChatGPT for Clinicians一推出便引發(fā)熱議,不僅因?yàn)楣δ軓?fù)刻,更在于它已在醫(yī)生實(shí)測(cè)和基準(zhǔn)測(cè)試中碾壓人類。
安全性是醫(yī)療AI的第一道門。OpenAI組建了數(shù)百名醫(yī)生顧問團(tuán)隊(duì),持續(xù)審核AI的每一條醫(yī)療相關(guān)回復(fù)。正式上線前,醫(yī)生顧問累計(jì)實(shí)測(cè)6924次真實(shí)對(duì)話,覆蓋臨床診療、文書撰寫、醫(yī)學(xué)研究等全場(chǎng)景。最終數(shù)據(jù)顯示,99.6%的模型回答被醫(yī)生判定為安全且準(zhǔn)確。
性能層面,OpenAI同步推出了HealthBench Professional全新醫(yī)療評(píng)測(cè)基準(zhǔn)。該基準(zhǔn)由60個(gè)國家的262名醫(yī)生構(gòu)建,包含5000組高仿真多輪醫(yī)療對(duì)話,融合了262位醫(yī)生制定的48,562項(xiàng)評(píng)分標(biāo)準(zhǔn)。其中約三分之一內(nèi)容為專業(yè)“反向測(cè)試”,模擬最難紅隊(duì)對(duì)話,場(chǎng)景復(fù)雜度是普通對(duì)話的3.5倍,專門用于排查模型漏洞。

在HealthBench Professional上,采用GPT-5.4的醫(yī)生專用工作空間綜合得分達(dá)到59.0。作為對(duì)比,人類醫(yī)生得分為43.7(不設(shè)答題時(shí)間限制,允許聯(lián)網(wǎng)查閱)?;A(chǔ)版GPT-5.4得分為48.1,Anthropic Claude Opus 4.7為47.0,谷歌Gemini 3.1 Pro為43.8,xAI Grok 4.2為36.1。也就是說,專為臨床優(yōu)化后的GPT-5.4比通用版本高出近11分,比人類醫(yī)生高出15.3分。在真實(shí)來源引用測(cè)試中,ChatGPT for Clinicians引用正確醫(yī)學(xué)來源的頻率甚至高于人類醫(yī)生。
這個(gè)定價(jià)策略對(duì)OpenEvidence構(gòu)成了結(jié)構(gòu)性沖擊。OpenEvidence過去幾年以“對(duì)醫(yī)生免費(fèi)”的模式積累了約74萬名注冊(cè)醫(yī)師(占全美執(zhí)業(yè)醫(yī)師約45%),2025年年化收入突破1.5億美元,估值達(dá)到120億美元,其商業(yè)模式本質(zhì)是向制藥公司和醫(yī)療器械公司收取B端營銷費(fèi)用。OpenAI以“免費(fèi)+更強(qiáng)性能”入場(chǎng),且自帶GPT-5.4的品牌效應(yīng)和用戶基礎(chǔ),很可能在未來數(shù)月內(nèi)迅速分流用戶,對(duì)OpenEvidence的用戶增長和廣告收入空間形成壓制。OpenEvidence的優(yōu)勢(shì)在于先發(fā)積累、高頻使用習(xí)慣和廣告變現(xiàn)閉環(huán),但通用AI巨頭憑借底層模型優(yōu)勢(shì)和品牌號(hào)召力正面切入垂直賽道的現(xiàn)象,正在更多行業(yè)上演。對(duì)專注于單一賽道的垂直AI公司而言,建立防守壁壘的窗口正在快速收窄。
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請(qǐng)聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。
Copyright ? 2022 上??评讜?huì)展服務(wù)有限公司 旗下「智慧醫(yī)療網(wǎng)」版權(quán)所有 ICP備案號(hào):滬ICP備17004559號(hào)-5