人工智能,尤其是深度學(xué)習(xí),已經(jīng)通過給大數(shù)據(jù)打標(biāo)簽,以及計(jì)算能力的顯著增強(qiáng)和云存儲而得以在各領(lǐng)域應(yīng)用。在醫(yī)學(xué)領(lǐng)域,人工智能已經(jīng)開始在三個層面產(chǎn)生影響:臨床醫(yī)生(主要是通過快速、準(zhǔn)確的圖像解讀)、健康系統(tǒng)(通過改善工作流程和降低醫(yī)療錯誤的潛力)、病人(讓他們能處理自己的數(shù)據(jù),從而改善健康狀況)。當(dāng)前,“人工智能+醫(yī)學(xué)”有哪些局限性(包括偏差/偏見、隱私和安全、缺乏透明)?二者的融合將來會怎樣?隨著時間的推移,準(zhǔn)確度、生產(chǎn)力和工作流程方面很可能實(shí)現(xiàn)顯著的提升,但這會被用于改善醫(yī)患關(guān)系還是導(dǎo)致其惡化,這一點(diǎn)還有待觀察。
醫(yī)學(xué)正處在兩大趨勢的十字路口。第一種是失敗的商業(yè)模式,增加了醫(yī)療支出,增加了醫(yī)療衛(wèi)生工作崗位,但主要結(jié)果卻在惡化,比如美國,他們的預(yù)期壽命縮短,嬰兒、兒童和產(chǎn)婦死亡率高。這證明了一個悖論,這個悖論并不局限于美國醫(yī)學(xué)界:投入更多的人力成本,卻會導(dǎo)致更糟糕的人類健康結(jié)果。第二種是產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)來自高分辨率醫(yī)學(xué)成像、生物傳感器和連續(xù)輸出的生理指標(biāo)、基因組測序和電子醫(yī)療記錄。僅靠人類分析此類數(shù)據(jù)顯然不行,因此有必要增加對機(jī)器的依賴。因此,在提供醫(yī)療保健方面,人們比以往任何時候都更迫切地需要算法的幫助。然而,在醫(yī)學(xué)領(lǐng)域,人類與人工智能(artificial intelligence,AI)的融合才剛剛開始。
從更深層次看,醫(yī)療保健行業(yè)存在著一些值得注意的、長期存在的缺陷,其中包括大量嚴(yán)重的診斷錯誤、治療中的錯誤、大量的資源浪費(fèi)、工作流程的低效、不公平以及患者與臨床醫(yī)生之間溝通的時間不足。渴望改進(jìn)的醫(yī)療行業(yè)領(lǐng)袖和計(jì)算機(jī)科學(xué)家斷言,人工智能在解決所有這些問題方面可能將發(fā)揮作用。這最終可能會成為現(xiàn)實(shí),但研究人員在使用神經(jīng)網(wǎng)絡(luò)來改善醫(yī)學(xué)實(shí)踐的弊病方面尚處于起步階段?!叭斯ぶ悄?醫(yī)藥”領(lǐng)域有哪些機(jī)會和陷阱呢?下面將一一詳述。
谷歌的一個團(tuán)隊(duì)使用了一種算法,分析了與上述研究相同的圖像集,做出了14種不同的診斷,得出AUC的分?jǐn)?shù)范圍從0.63(肺炎)到0.87(心臟增大或肺萎陷)不等。最近,在另一項(xiàng)相關(guān)研究中,研究表明,目前在印度醫(yī)院使用的一種DNN對四種不同的胸片主要特征進(jìn)行解釋,其準(zhǔn)確性至少與四名放射科醫(yī)生相同。對于胸部x光檢查中肺癌結(jié)節(jié)的檢測,DNN回顧性評估了3.4萬多名患者的掃描結(jié)果,與18位放射學(xué)家相比,DNN的準(zhǔn)確度超過了他們中的17位。急診室醫(yī)生很難準(zhǔn)確診斷手腕骨折,但是DNN帶來了顯著的改善,敏感性從81%提高到92%,誤診率降低了47%。
同樣,DNNs也被廣泛應(yīng)用于各種醫(yī)學(xué)掃描中,包括骨折的骨片、年齡評估、結(jié)核病的分類和椎體壓縮性骨折;CT掃描肺結(jié)節(jié)、肝臟腫塊、胰腺癌和冠狀動脈鈣化分?jǐn)?shù);腦部掃描是否有出血、顱腦外傷和急性轉(zhuǎn)診的跡象;磁共振成像;超聲心動圖;乳腺鉬靶檢查。一項(xiàng)前瞻、雙盲、隨機(jī)對照試驗(yàn)使用了真實(shí)病例,結(jié)果表明,深度學(xué)習(xí)算法解釋掃描結(jié)果的速度比放射科醫(yī)生快150倍(1.2秒 vs 177秒),但得出的結(jié)論是,該算法的診斷準(zhǔn)確性低于人類的表現(xiàn),這令人清醒,表明還有很多工作要做。
對于每一項(xiàng)研究,研究者都使用了大量的標(biāo)記掃描來進(jìn)行訓(xùn)練和隨后的評估,AUC的范圍從髖部骨折的0.99,到顱內(nèi)出血和肝包塊的0.84,再到急性神經(jīng)系統(tǒng)病例篩選的0.56。但由于研究方法的顯著差異,無法比較不同研究之間DNN的準(zhǔn)確性。此外,ROC和AUC指標(biāo)不一定代表臨床效用,甚至也不一定是表現(xiàn)模型準(zhǔn)確性的最佳方式。就算法的準(zhǔn)確性而言,驗(yàn)證其性能并不等同于證明其臨床療效。這就是研究者所說的“人工智能鴻溝”,也就是說,一個AUC為0.99的算法如果沒有被證明可以改善臨床結(jié)果,那么它就沒有多大價值。在經(jīng)過同行評議的研究中(表1中進(jìn)行了總結(jié)),唯一的前瞻性驗(yàn)證研究在真實(shí)世界已經(jīng)對糖尿病性視網(wǎng)膜病變、手腕骨折、乳腺癌轉(zhuǎn)移、結(jié)腸息肉、先天性白內(nèi)障進(jìn)行了驗(yàn)證,很明顯,這一領(lǐng)域還遠(yuǎn)遠(yuǎn)沒有顯示出非常高的精度,更不用說臨床應(yīng)用。
在利用圖像分析對皮膚癌進(jìn)行分類的算法中,將深度學(xué)習(xí)網(wǎng)絡(luò)的診斷精度與皮膚科醫(yī)生的診斷精度進(jìn)行了比較研究。在一項(xiàng)使用了近13萬張攝影和皮膚鏡數(shù)字化圖像的大型訓(xùn)練數(shù)據(jù)集的研究中,21名美國委員會認(rèn)證的皮膚科醫(yī)生的表現(xiàn)至少與一種算法相匹配,該算法對惡性腫瘤的AUC為0.96,對黑色素瘤的AUC為0.94。隨后,58名國際皮膚科醫(yī)生對黑色素瘤皮膚癌診斷的準(zhǔn)確性與卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了比較;平均的ROCs分別是0.79和0.86,這反映了與大多數(shù)醫(yī)生相比,該算法的性能更好。第三項(xiàng)研究對12種皮膚病進(jìn)行了算法評估,包括基底細(xì)胞癌、鱗狀細(xì)胞癌和黑色素瘤,并與16名皮膚科醫(yī)生進(jìn)行了比較,算法對黑色素瘤的AUC為0.96。這些研究都不是在臨床情景中進(jìn)行的,在臨床,醫(yī)生會進(jìn)行身體檢查,并承擔(dān)做出準(zhǔn)確診斷的責(zé)任。如果人工智能能夠可靠地模擬有經(jīng)驗(yàn)的皮膚科醫(yī)生,那將是一個巨大進(jìn)步。
已有許多研究比較算法和眼科醫(yī)生在診斷不同眼病方面的性能。在一項(xiàng)使用視網(wǎng)膜眼底圖片診斷年齡相關(guān)黃斑變性(age-related macular degeneration,AMD)的研究中,DNN算法的準(zhǔn)確率在88%到92%之間,幾乎與眼科專家的準(zhǔn)確率一樣高。研究人員將一種用于解釋視網(wǎng)膜光學(xué)相干斷層掃描(optical coherence tomography,OCT)的深度學(xué)習(xí)算法的性能與眼科醫(yī)生進(jìn)行比較,以診斷兩種最常見的視力喪失原因:糖尿病視網(wǎng)膜病變或AMD。在超過10萬張OCT圖像的數(shù)據(jù)集上對算法進(jìn)行訓(xùn)練后,對其中的1000張圖像進(jìn)行驗(yàn)證,并與6名眼科醫(yī)生的性能進(jìn)行比較,算法的AUC為0.999。
雖然目前對視網(wǎng)膜OCT和眼底圖像的研究主要集中在眼病上,但最近的研究表明,這些圖像還可以為大腦提供一個早期診斷癡呆(包括阿爾茨海默病)的窗口。
視網(wǎng)膜照片的潛在用途似乎也已超越了眼疾本身。DNN對28多萬名患者的圖像進(jìn)行了心血管危險因素的評估,包括年齡、性別、收縮壓、吸煙情況、糖化血紅蛋白和發(fā)生重大心臟不良事件的可能性,并在兩個獨(dú)立的數(shù)據(jù)集進(jìn)行了驗(yàn)證。AUC為0.97表明該算法能準(zhǔn)確識別。
其他經(jīng)神經(jīng)網(wǎng)絡(luò)用于不太常見的眼病包括新生兒先天性白內(nèi)障和早產(chǎn)兒視網(wǎng)膜病變的評估表明,算法的準(zhǔn)確性可與眼科專家相媲美。
心臟病學(xué)
心臟病學(xué)家使用的主要圖像是心電圖(electrocardiograms,ECG)和超聲心動圖,這兩種圖像都用DNNs進(jìn)行了評估。使用機(jī)器讀ECGs已有近40年的歷史,但其準(zhǔn)確性非常低。當(dāng)使用深度學(xué)習(xí)在含549個心電圖的數(shù)據(jù)集里診斷心臟病時,報告的敏感性為93%,特異性為90%,與心臟病學(xué)家相當(dāng)。對于超聲心動圖,一組267例患者的83萬多張靜態(tài)圖像被DNN和心臟病學(xué)家分成15個標(biāo)準(zhǔn)視圖(如心尖4腔或肋下)。對于單張靜止圖像,算法的整體準(zhǔn)確率為92%,4名超聲心動圖專業(yè)醫(yī)師的準(zhǔn)確率為79%,但這并不能反映真實(shí)世界的結(jié)果。一項(xiàng)囊括超過8000例超聲心動圖的更大的回顧性研究顯示:算法對肥厚性心肌病(AUC, 0.93)、心臟淀粉樣變(AUC, 0.87)和肺動脈高壓(AUC, 0.85)的分類準(zhǔn)確率很高。
在結(jié)腸鏡檢查中發(fā)現(xiàn)小于5毫米的腺瘤性息肉或無蒂息肉對胃腸病學(xué)家來說是非常困難的。對325例微小息肉患者進(jìn)行的首個人工智能前瞻性臨床試驗(yàn)證實(shí),常規(guī)結(jié)腸鏡檢查的準(zhǔn)確率為94%,陰性預(yù)測值為96%;人工智能診斷的速度是35秒,而且該算法對新手和胃腸病學(xué)專家都同樣有效,不需要注射染料。在另一項(xiàng)獨(dú)立研究中也證實(shí)了這一結(jié)果。這樣的結(jié)果表明:機(jī)器視覺,在高倍放大下,可以準(zhǔn)確和快速地解釋特定的醫(yī)學(xué)圖像,優(yōu)于人類。
全世界有3.5億人在與抑郁作斗爭,精神健康的巨大負(fù)擔(dān)值得注意,而人工智能有能力為患者和數(shù)量遠(yuǎn)遠(yuǎn)不足的臨床醫(yī)生提供支持。正在開發(fā)的各種工具包括通過語音、面部識別、傳感器和交互式聊天機(jī)器人的使用,對抑郁和情緒進(jìn)行數(shù)字跟蹤。臉書上的帖子已經(jīng)被證明可以預(yù)測抑郁癥的診斷,這些診斷后來被記錄在電子醫(yī)療記錄中。
機(jī)器學(xué)習(xí)已被探索用于預(yù)測哪種抗抑郁藥物可能成功、抑郁的特征、預(yù)測自殺的發(fā)生,以及預(yù)測精神分裂癥患者的精神病發(fā)作。
人工智能算法在許多其他臨床科室也得到了廣泛使用,如促進(jìn)腦卒中、自閉癥、心臟病的診斷,幫助麻醉醫(yī)師在手術(shù)過程中避免低氧合等。圖2展示了人工智能在醫(yī)學(xué)中應(yīng)用的廣度。許多初創(chuàng)公司和老牌科技公司都在努力開發(fā)自然語言處理技術(shù),以取代診所就診時對鍵盤和抄寫人員的需求?;钴S在這個領(lǐng)域的公司包括微軟、谷歌等。
從理論上講,能夠預(yù)測關(guān)鍵結(jié)果可以使醫(yī)院姑息治療資源的使用更加有效和精確。例如,如果可以使用一種算法來估計(jì)病人重新入院的風(fēng)險,那么就可以采取步驟來避免出院,并將資源調(diào)撥到潛在的問題上。而根據(jù)常規(guī)的臨床出院標(biāo)準(zhǔn),這種風(fēng)險是無法檢測到的。對于危重病人,對生存期的預(yù)測極有可能會幫助這個病人及其家人和醫(yī)生做出關(guān)于復(fù)蘇、氣管插管、機(jī)械通氣,和其他侵入性措施的決定。同樣,人工智能預(yù)測工具也可以判斷哪些患者可能受益于姑息治療,以及判斷誰有發(fā)展為敗血癥或感染性休克的風(fēng)險。使用電子健康記錄數(shù)據(jù),機(jī)器和深度學(xué)習(xí)算法已經(jīng)能夠預(yù)測從阿爾茨海默病到死亡的許多重要臨床參數(shù) (表2)。例如,在最近的一項(xiàng)研究中,深度學(xué)習(xí)在為膿毒癥患者選擇治療方案時,比如升壓、靜脈輸液、藥物和劑量的選擇,由“人工智能醫(yī)生”選擇的治療方法比由人類醫(yī)生選擇的治療方法更有效。但這一結(jié)果還沒有在真實(shí)的臨床情景下得到驗(yàn)證。盡管如此,仍有許多公司已經(jīng)在推廣這類算法,比如Careskore,它為衛(wèi)生系統(tǒng)提供基于EHR數(shù)據(jù)的再入院風(fēng)險和死亡率評估。
目前,還不清楚人工智能在醫(yī)療情景中預(yù)測關(guān)鍵結(jié)果的能力有多強(qiáng),這要等到未來在真實(shí)臨床環(huán)境下通過嚴(yán)格的統(tǒng)計(jì)方法和分析得到強(qiáng)有力的驗(yàn)證后才能確定。
機(jī)器視覺
機(jī)器視覺(也稱為計(jì)算機(jī)視覺),它使用來自環(huán)境傳感器的數(shù)據(jù),通過監(jiān)測諸如臨床醫(yī)生正確洗手、重癥監(jiān)護(hù)病房的危重病人和病人跌倒的風(fēng)險等活動來促進(jìn)安全,在衛(wèi)生系統(tǒng)中引起了相當(dāng)大的關(guān)注。重癥監(jiān)護(hù)病房的病人使用機(jī)械通氣往往是偶然和低效的;在這方面,一種使用機(jī)器視覺的強(qiáng)化學(xué)習(xí)算法顯示出了相當(dāng)大的潛力。還有正在進(jìn)行的數(shù)字化手術(shù),包括機(jī)器視覺觀察、手術(shù)室的設(shè)備和外科醫(yī)生的表現(xiàn);實(shí)時、高分辨率、AI處理的患者相關(guān)解剖圖像;整合病人術(shù)前的所有數(shù)據(jù),包括完整的病史、實(shí)驗(yàn)室檢查和掃描。極其精細(xì)的顯微外科手術(shù),比如眼睛內(nèi)部的手術(shù),現(xiàn)在已經(jīng)在人工智能的幫助下進(jìn)行了。通過使用圖像重建的深度學(xué)習(xí)算法和生成的對抗網(wǎng)絡(luò)來提高醫(yī)學(xué)掃描的質(zhì)量,可以顯著減少在準(zhǔn)備放射治療時的圖像采集和分析所需時間、減少輻射暴露。這些改進(jìn)如果得到廣泛實(shí)施,將讓醫(yī)療更安全、便利,成本也得到降低。
可穿戴傳感器可以持續(xù)監(jiān)測機(jī)體所有重要信號——包括血壓、心率和心律、血氧飽和度、呼吸頻率和體溫——未來有可能搶占先機(jī),被大量住院患者所采用。目前還沒有針對遠(yuǎn)程監(jiān)控的算法開發(fā)和預(yù)期測試,但這值得大力研究,因?yàn)樗梢栽诓粻奚颊吆图胰吮憷褪孢m的情況下降低護(hù)理成本。
據(jù)估計(jì),人工智能每天要處理2.5億多張圖像,而成本僅約為1000美元,這意味著可以節(jié)省數(shù)十億美元。除了可以從人工智能輔助的圖像解釋和臨床支持中提升生產(chǎn)力和改進(jìn)工作流之外,還有可能減少許多后勤、行政工作的勞動力,如編碼和計(jì)費(fèi)、手術(shù)室和診所預(yù)約的調(diào)度以及人員配備。在賓夕法尼亞州的蓋辛格健康中心,超過10萬名患者接受了外顯子組測序,結(jié)果是通過人工智能聊天機(jī)器人(Clear Genetics)提供的,它受到大多數(shù)患者的歡迎,減少了對遺傳顧問的需求。這證明了衛(wèi)生系統(tǒng)如何能夠利用人工智能工具提供復(fù)雜的信息,而不必依賴于訓(xùn)練有素的人員的擴(kuò)充。
2017年底,一種智能手表算法通過了FDA的檢測,能檢測出心房纖顫,隨后在2018年,蘋果公司的算法獲得了FDA的批準(zhǔn),將該算法用于Apple Watch系列4。光學(xué)體積學(xué)描述和加速計(jì)傳感器能夠獲知用戶在休息和體育活動時的心率,當(dāng)偏離參考范圍,就會觸發(fā)警報,這種算法的廣泛使用,尤其是在低風(fēng)險的年輕人群中——他們戴著蘋果手表——將導(dǎo)致大量的假陽性心房纖顫診斷,并引發(fā)不必要的醫(yī)療檢查。相比之下,智能手表上的深度學(xué)習(xí),可以準(zhǔn)確地檢測血液中是否有高鉀,可能對腎病患者特別有用。通過智能手表算法讀取血鉀水平(表3)的概念,體現(xiàn)了一種算法的前景,這種算法能夠提供在沒有該技術(shù)的情況下無法獲得或識別的信息。
人工智能手機(jī)監(jiān)測到的數(shù)據(jù)正被用于多種醫(yī)學(xué)診斷目的,包括皮損和皮疹、耳部感染、偏頭痛,以及糖尿病視網(wǎng)膜病變和老年黃斑變性等視網(wǎng)膜疾病。一些智能手機(jī)應(yīng)用程序正在使用人工智能來監(jiān)控醫(yī)療依從性,比如AiCure (NCT02243670),它讓患者在吞下處方藥的同時拍下自拍照。其他應(yīng)用程序使用圖像識別食物的熱量和營養(yǎng)含量。最近的一項(xiàng)研究實(shí)現(xiàn)了連續(xù)兩周的血糖檢測,同時還評估了腸道微生物群、體力活動、睡眠、藥物、所有食物和飲料的攝入量,以及各種實(shí)驗(yàn)室檢查的監(jiān)測,這種多模式的數(shù)據(jù)收集和分析已經(jīng)能夠預(yù)測一個人對特定食物的血糖反應(yīng),這種生理模式在人群中非常不均勻,并受到腸道微生物群的驅(qū)動。連續(xù)血糖傳感器的使用表明,餐后血糖峰值通常會出現(xiàn),即使在沒有糖尿病的健康人身上也是如此。目前還不確定葡萄糖峰值是否意味著患糖尿病的風(fēng)險更高,但有數(shù)據(jù)表明,在實(shí)驗(yàn)?zāi)P椭校@種可能性與胃腸屏障功能障礙存在聯(lián)系。盡管如此,人工智能和多模態(tài)數(shù)據(jù)的應(yīng)用來指導(dǎo)個性化的飲食仍是未來虛擬醫(yī)療的一個方向。目前,簡單的算法已被用于糖尿病患者的血糖管理,雖然這有助于避免低血糖發(fā)作,但整合個人綜合數(shù)據(jù)的智能算法可能會提供更多的信息和幫助。通過這種方式,大多數(shù)常見的慢性疾病,如高血壓、抑郁癥和哮喘,理論上可以通過虛擬醫(yī)生得到更好的管理。隨著人工智能語音識別準(zhǔn)確性的顯著提高和智能音箱的日益普及,很容易想象通過語音平臺來實(shí)現(xiàn)疾病管理。最終,當(dāng)一個人的所有數(shù)據(jù)和醫(yī)學(xué)文獻(xiàn)的資料庫可以結(jié)合,將得到一個整體的預(yù)防方案。
利用人工智能,Christiansen等人開發(fā)了硅標(biāo)記,用計(jì)算機(jī)直接識別未被標(biāo)記的圖像中細(xì)胞的特征。與常規(guī)的熒光染色顯微成像不同,這種機(jī)器學(xué)習(xí)算法能預(yù)測熒光標(biāo)簽,從而引入了“無圖像”顯微技術(shù),不再像熒光染色那樣會傷害和殺死細(xì)胞,也不需要復(fù)雜的準(zhǔn)備工作。此后不久,Ota等人報道了另一種無圖像流人工智能分析方法,他們稱之為“幽靈細(xì)胞檢測”,以準(zhǔn)確識別罕見細(xì)胞。機(jī)器學(xué)習(xí)的這種應(yīng)用解決了一個棘手的問題,即通過快速、高通量和精確的細(xì)胞形態(tài)分類來識別和分離稀有細(xì)胞,而不需要使用生物標(biāo)記。除此之外,計(jì)算機(jī)視覺技術(shù)已經(jīng)使單細(xì)胞內(nèi)40-對蛋白質(zhì)和細(xì)胞器的高通量評估成為可能。
機(jī)器和深度學(xué)習(xí)面臨的另一個挑戰(zhàn)是對基因組和其他組學(xué)生物數(shù)據(jù)集的分析。開源代碼的算法已被開發(fā)用于分類或分析全基因組序列的致病性變異、體細(xì)胞癌突變、基因-基因相互作用、RNA測序數(shù)據(jù)、甲基化、蛋白質(zhì)結(jié)構(gòu)和蛋白質(zhì)-蛋白質(zhì)相互作用的預(yù)測、微生物組和單細(xì)胞。雖然這些報告通常只針對單一組學(xué),但現(xiàn)在正在開發(fā)集成數(shù)據(jù)集的多組算法。CRISPR引導(dǎo)RNA活性和脫靶活性的算法預(yù)測也促進(jìn)了基因組編輯的應(yīng)用。
值得注意的是,通過將轉(zhuǎn)移學(xué)習(xí)算法應(yīng)用于多區(qū)域腫瘤測序數(shù)據(jù),以及通過微流體分離以單細(xì)胞分辨率分析癌細(xì)胞的機(jī)器視覺,人工智能的使用增強(qiáng)了對癌癥演變的理解。這兩種新的方法可能最終有助于患者的風(fēng)險分層和指導(dǎo)治療。
可以說,生物神經(jīng)科學(xué)影響著人工智能,反之亦然。果蠅中的幾個例子是值得注意的。Robie等人拍攝了4萬只果蠅的視頻,并使用機(jī)器學(xué)習(xí)和機(jī)器視覺來繪制表型與基因表達(dá)和神經(jīng)解剖學(xué)的關(guān)系圖。繪制了活動、雌性攻擊性,以及其他很多特征的全腦圖圖譜。在另一項(xiàng)研究中,使用最近鄰算法來了解蒼蠅是如何感知?dú)馕兜?,也就是它們的嗅覺算法
人工智能帶來的最令人印象深刻的進(jìn)步之一,是在理解人類大腦的網(wǎng)格細(xì)胞方面——網(wǎng)格細(xì)胞能夠感知人體運(yùn)動的速度和方向,例如機(jī)體在空間中的位置。神經(jīng)形態(tài)計(jì)算,或者說是通過對大腦進(jìn)行逆向工程來制造計(jì)算機(jī)芯片,不僅能提高計(jì)算效率,還能幫助研究人員理解大腦回路,構(gòu)建腦機(jī)接口。機(jī)器視覺用遷移學(xué)習(xí)算法追蹤人類和動物的行為也是另一個例子。
藥物發(fā)現(xiàn)正在因多層面地使用人工智能而在被改進(jìn),包括用先進(jìn)的自然語言處理技術(shù)搜索生物醫(yī)學(xué)文獻(xiàn)、用數(shù)據(jù)挖掘得到數(shù)以百萬計(jì)的分子結(jié)構(gòu)、設(shè)計(jì)和制造新分子、預(yù)測脫靶效果和毒性、預(yù)測試驗(yàn)藥物的劑量,開發(fā)大規(guī)模細(xì)胞檢測。通過機(jī)器學(xué)習(xí)預(yù)測毒性來減少臨床前動物試驗(yàn)是有希望的。人工智能密碼學(xué)已被用于整合大型制藥公司的數(shù)據(jù)集,并發(fā)現(xiàn)以前未知的藥物相互作用。劍橋大學(xué)和曼徹斯特大學(xué)的機(jī)器人“伊芙”(eve)的故事,以及它如何自主發(fā)現(xiàn)了一種牙膏成分中含有的抗瘧藥物,激發(fā)了人們利用人工智能加速這一過程的興趣。
盡管人工智能技術(shù)前景光明,但也存在巨大的障礙和陷阱。人工智能的炒作程度已經(jīng)遠(yuǎn)遠(yuǎn)超過了人工智能的科學(xué)水平,特別是當(dāng)它涉及到病人的護(hù)理時。最近的一個例子是IBM Watson Health的癌癥AI算法(在腫瘤學(xué)中稱為Watson)。該算法被全球數(shù)百家醫(yī)院用于給癌癥患者推薦治療方法,但它只是基于少量的非真實(shí)病例誕生的,來自腫瘤學(xué)家輸入的真實(shí)數(shù)據(jù)非常有限。許多Watson所建議的治療被證明是錯誤的,比如建議給嚴(yán)重出血的病人使用貝伐珠單抗,而這是該藥明確的禁忌癥,已被標(biāo)為“黑框”警告。這個例子還凸顯了一個有缺陷的算法可能對病人造成重大傷害,從而導(dǎo)致醫(yī)療事故。機(jī)器算法誘發(fā)醫(yī)源性風(fēng)險的潛力是巨大的。因此,當(dāng)人工智能算法在臨床實(shí)踐中得到應(yīng)用時,就需要進(jìn)行系統(tǒng)的調(diào)試、審核、大量的模擬、驗(yàn)證和前瞻性的審查。
不平等是當(dāng)今醫(yī)療保健中最重要的問題之一,尤其是在美國,它沒有為所有公民提供醫(yī)療保障。由于社會經(jīng)濟(jì)地位低是早亡的主要風(fēng)險因素,在“富人”而不是“窮人”中過多地使用人工智能可能會擴(kuò)大目前在健康結(jié)局方面的差距。與這一問題交織在一起的是,由于數(shù)據(jù)集中沒有包含少數(shù)群體,許多算法中都存在固有的偏見,加劇了本就存在的不公平現(xiàn)象。例如,皮膚科診斷黑色素瘤的算法,由于缺乏某些膚色和基因組數(shù)據(jù),以至很難代表少數(shù)族裔。
人工智能在醫(yī)學(xué)領(lǐng)域的未來,一個壓倒一切的問題在于如何保障數(shù)據(jù)的隱私和安全??紤]到黑客攻擊和數(shù)據(jù)泄露的普遍問題,人們不太愿意使用可能泄露病人病史細(xì)節(jié)的算法。此外,還存在蓄意入侵算法以大規(guī)模傷害人類的風(fēng)險,比如糖尿病患者服用過量的胰島素或刺激除顫器工作。個人身份越來越有可能通過面部識別或基因組序列信息來確定,這進(jìn)一步妨礙了隱私保護(hù)。需要建立個人健康數(shù)據(jù)所有權(quán)、使用高度安全的數(shù)據(jù)平臺,以應(yīng)對若隱若現(xiàn)的安全問題,否則這些問題將阻礙或毀掉人工智能在醫(yī)學(xué)領(lǐng)域發(fā)展的機(jī)會。
將人工智能引入醫(yī)學(xué)的過程才剛剛開始,這個領(lǐng)域的前景廣闊,但數(shù)據(jù)和證據(jù)相對較少。錯誤算法的風(fēng)險比單個醫(yī)患交互的風(fēng)險要高得多,但是好的算法回報是巨大的——減少錯誤、低效和成本。因此,人工智能在醫(yī)學(xué)上無一例外需要嚴(yán)格的研究,在同行評議的期刊上發(fā)表結(jié)果,在真實(shí)世界中進(jìn)行臨床驗(yàn)證,然后才能在病人診治中推出和實(shí)施(圖4)。
如今,人們普遍認(rèn)為醫(yī)生將被機(jī)器取代,這一觀點(diǎn)說穿了與自動駕駛汽車模型類似。大多數(shù)人會同意,自動駕駛汽車代表了人工智能迄今為止的最高技術(shù)成就,但“自動駕駛”這個詞有誤導(dǎo)性。汽車工程師協(xié)會(SAE)定義了5個級別的自主權(quán),5級表示汽車完全自主控制,沒有任何可能被人類控制 (圖5)。現(xiàn)在認(rèn)識到,這種充分的自治可能永遠(yuǎn)不會實(shí)現(xiàn)。出于同樣的原因,醫(yī)學(xué)不太可能超過3級,3級是一種有條件的自動化,人類確實(shí)需要對圖像和數(shù)據(jù)的算法解釋進(jìn)行監(jiān)督。人類健康太寶貴了,把它交給機(jī)器,除了那些風(fēng)險極小的日常事務(wù),似乎特別牽強(qiáng)。
令人興奮的是,軟件已經(jīng)能夠快速、準(zhǔn)確、低成本地消化和處理大量數(shù)據(jù),而機(jī)器能夠看到并做一些人類不可能做的事情。這種能力最終將為高性能醫(yī)學(xué)奠定基礎(chǔ),這是真正的數(shù)據(jù)驅(qū)動,減輕我們對人力資源的依賴。
Copyright ? 2022 上??评讜狗?wù)有限公司 旗下「智慧醫(yī)療網(wǎng)」版權(quán)所有 ICP備案號:滬ICP備17004559號-5