醫(yī)療行業(yè)的健康醫(yī)療數(shù)據(jù)一方面為智慧醫(yī)院建設(shè)提供重要支撐,蘊(yùn)含著巨大價(jià)值,另一方面也包含了大量的個(gè)人隱私,隱藏著巨大的數(shù)據(jù)安全風(fēng)險(xiǎn)。如何在充分釋放健康醫(yī)療數(shù)據(jù)價(jià)值的同時(shí),開展數(shù)據(jù)安全治理工作,防范健康醫(yī)療數(shù)據(jù)泄露、保護(hù)患者個(gè)人隱私,是健康醫(yī)療大數(shù)據(jù)時(shí)代的重中之重。
醫(yī)療機(jī)構(gòu)在進(jìn)行數(shù)據(jù)安全治理工作時(shí),首先需要梳理現(xiàn)有數(shù)據(jù)資產(chǎn)、對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行分類分級(jí)工作,按照國(guó)家、行業(yè)、地方的政策、標(biāo)準(zhǔn)、要求等進(jìn)行歸類、確定等級(jí),基于數(shù)據(jù)的分類分級(jí)給予數(shù)據(jù)不同的安全保護(hù)措施,以實(shí)現(xiàn)數(shù)據(jù)的開放利用和數(shù)據(jù)安全之間的平衡,切實(shí)提高數(shù)據(jù)安全保護(hù)的效率和效果。
安華金和數(shù)據(jù)安全評(píng)估系統(tǒng)(簡(jiǎn)稱:DSAS)針對(duì)醫(yī)療數(shù)據(jù)應(yīng)用場(chǎng)景、實(shí)現(xiàn)電子病歷數(shù)據(jù)分類分級(jí)推出全新版本,助力醫(yī)療行業(yè)數(shù)據(jù)安全治理第一步——醫(yī)療數(shù)據(jù)分類分級(jí)工作的有序開展。
\ | /
第一步:預(yù)置規(guī)則
HIPPA《健康保險(xiǎn)可攜性和責(zé)任法案》、《中華人民共和國(guó)個(gè)人信息保護(hù)法》、《信息安全技術(shù) 個(gè)人信息安全規(guī)范》(GB/T 35273-2020)都提出了個(gè)人信息保護(hù)要求,特別是保護(hù)個(gè)人可識(shí)別信息。因此在龐雜的醫(yī)療數(shù)據(jù)中,同樣需將“個(gè)人可識(shí)別信息”作為敏感數(shù)據(jù)類別之一,并對(duì)患者和醫(yī)護(hù)的個(gè)人信息加以分別。其中“患者個(gè)人信息”根據(jù)標(biāo)識(shí)性強(qiáng)弱分為以下四類:
01 個(gè)人身份標(biāo)識(shí)性信息(A4數(shù)據(jù)) 屬于個(gè)人信息的強(qiáng)標(biāo)識(shí)數(shù)據(jù),能夠唯一關(guān)聯(lián)到個(gè)人,包括:證件號(hào)碼、電話號(hào)碼、健康卡號(hào)、城鄉(xiāng)居民健康檔案編號(hào)、地址 ( 詳細(xì)到門牌號(hào) )、電子郵件地址等。 02 個(gè)人間接標(biāo)識(shí)性信息(A3數(shù)據(jù)) 屬于個(gè)人信息的標(biāo)識(shí)數(shù)據(jù),能夠間接關(guān)聯(lián)到個(gè)人,包括:姓名、生物標(biāo)識(shí)(如基因)、(個(gè)人手機(jī) / 設(shè)備)設(shè)備標(biāo)識(shí)符和序列號(hào)、IP 地址(個(gè)人設(shè)備地址)、全臉攝影圖像和任何類似的圖像等。 03 個(gè)人弱標(biāo)識(shí)性信息(A2數(shù)據(jù)) 能夠確定較小范圍的個(gè)人弱標(biāo)識(shí)數(shù)據(jù),包括:出生日期、所屬行政區(qū)域、郵政編碼、單位電話號(hào)碼、單位名稱等。 04 個(gè)人特征性(統(tǒng)計(jì))信息(A1數(shù)據(jù)) 包括:年齡、血型、性別、學(xué)歷、籍貫等,以及相應(yīng)的代碼。
“醫(yī)護(hù)個(gè)人信息”同樣根據(jù)個(gè)人信息的標(biāo)識(shí)性強(qiáng)弱分為:B4數(shù)據(jù)、B3數(shù)據(jù)、B2數(shù)據(jù)、B1數(shù)據(jù)四類。
“電子病歷診療數(shù)據(jù)”是體現(xiàn)患者就醫(yī)過(guò)程的完整數(shù)據(jù),可以結(jié)合診療過(guò)程對(duì)收集、產(chǎn)生、處理的數(shù)據(jù)進(jìn)行分類,包括:掛號(hào)、處方、用藥、健康狀況(病史、過(guò)敏史等)、醫(yī)囑信息、檢查檢驗(yàn)信息、手術(shù)麻醉信息、助產(chǎn)信息、護(hù)理信息、出入院記錄信息等,覆蓋完整的電子病歷診療過(guò)程,并根據(jù)患者電子病歷診療數(shù)據(jù)的隱私程度進(jìn)行分級(jí)。
(1)C4數(shù)據(jù) 門診號(hào)、處方號(hào)、住院號(hào)等可以檢索到患者的整個(gè)診療記錄的強(qiáng)標(biāo)識(shí)數(shù)據(jù)。 (2)C3數(shù)據(jù) 病癥、用藥、醫(yī)囑、檢驗(yàn)等反映患者的病情和身體特征的隱私數(shù)據(jù)、臨床數(shù)據(jù)等。 (3)C2數(shù)據(jù) 麻醉、測(cè)量、護(hù)理、耗材等診療的過(guò)程產(chǎn)生的數(shù)據(jù),不體現(xiàn)患者診療隱私信息等。 (4)C1數(shù)據(jù) 醫(yī)院的設(shè)備、藥品等診療無(wú)關(guān)的醫(yī)院基礎(chǔ)資源和管理信息數(shù)據(jù)等。
安華金和數(shù)據(jù)安全評(píng)估系統(tǒng)(簡(jiǎn)稱:DSAS)新版本中預(yù)置電子病歷分類分級(jí)落地指南,定義了“患者個(gè)人信息”、“醫(yī)護(hù)個(gè)人信息”、“電子病歷診療數(shù)據(jù)”等類別和級(jí)別,并預(yù)置500余自動(dòng)分類分級(jí)規(guī)則。
第二步:資產(chǎn)梳理
基于網(wǎng)絡(luò)嗅探技術(shù),自動(dòng)發(fā)現(xiàn)指定網(wǎng)段范圍下活躍或靜默的數(shù)據(jù)庫(kù)資產(chǎn);支持國(guó)內(nèi)外主流數(shù)據(jù)庫(kù)、大數(shù)據(jù)生態(tài)系統(tǒng)的數(shù)據(jù)掃描,梳理醫(yī)療數(shù)據(jù)資產(chǎn)清單,為分類分級(jí)、精細(xì)化管控奠定數(shù)據(jù)基礎(chǔ)。
第三步:分類分級(jí)
通過(guò)DSAS預(yù)置的500余醫(yī)療數(shù)據(jù)自動(dòng)分類分級(jí)規(guī)則進(jìn)行自動(dòng)分類分級(jí),標(biāo)識(shí)“患者個(gè)人信息”、“醫(yī)護(hù)個(gè)人信息”、“電子病歷診療數(shù)據(jù)”等類別和級(jí)別。
同時(shí)也支持通過(guò)關(guān)鍵字智能分析技術(shù),將電子病歷元數(shù)據(jù)中的表名、字段名進(jìn)行自動(dòng)拆解和自然語(yǔ)言分詞,提取其中有業(yè)務(wù)含義的關(guān)鍵字,并通過(guò)關(guān)鍵字的統(tǒng)計(jì)、聯(lián)動(dòng),形成電子病歷數(shù)據(jù)圖譜,快速獲得和關(guān)鍵字有關(guān)的所有字段,輔助人工核實(shí)分類分級(jí)。
數(shù)據(jù)不斷的產(chǎn)生、加工轉(zhuǎn)換、流轉(zhuǎn),因此數(shù)據(jù)分類分級(jí)不是“一次性”的工作,而是需要建立策略化、自動(dòng)化、流程化的分類分級(jí)系統(tǒng)實(shí)現(xiàn)“持續(xù)”的數(shù)據(jù)分類分級(jí)。DSAS基于長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM,Long Short-Term Memory)時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)算法,助力大規(guī)模、可持續(xù)分類分級(jí)。對(duì)已經(jīng)完成的“分類分級(jí)”數(shù)據(jù)作為樣本進(jìn)行自動(dòng)學(xué)習(xí),建立醫(yī)院電子病歷分類分級(jí)模型。再對(duì)新的數(shù)據(jù)通過(guò)模型完成自動(dòng)分類分級(jí)工作,形成可滿足大規(guī)模數(shù)據(jù)分類分級(jí)和持續(xù)變化數(shù)據(jù)分類分級(jí)的能力,實(shí)現(xiàn)數(shù)據(jù)分類分級(jí)自動(dòng)化、可持續(xù)。

第四步:場(chǎng)景化數(shù)據(jù)集合分級(jí)
對(duì)電子病歷中“個(gè)人信息”和“診療數(shù)據(jù)”的字段進(jìn)行分類分級(jí)是數(shù)據(jù)安全治理的第一步。在實(shí)際業(yè)務(wù)場(chǎng)景中,所有對(duì)數(shù)據(jù)的存儲(chǔ)和數(shù)據(jù)的訪問(wèn)都將以數(shù)據(jù)集合的形式存在,單一字段的數(shù)據(jù)通常不會(huì)泄露患者的隱私數(shù)據(jù)。因此,對(duì)數(shù)據(jù)集合的定級(jí)是促進(jìn)數(shù)據(jù)的開放利用和數(shù)據(jù)安全之間平衡的重要措施。
L4級(jí)數(shù)據(jù)集合 L4級(jí)屬于高敏感數(shù)據(jù)集合,會(huì)直接泄露患者的個(gè)人隱私數(shù)據(jù)(A3 及以上數(shù)據(jù))和個(gè)人診療敏感數(shù)據(jù)(C3 數(shù)據(jù));例如:電話號(hào)碼+姓名、電話號(hào)碼+現(xiàn)病史等。 L3級(jí)數(shù)據(jù)集合 L3級(jí)屬于敏感數(shù)據(jù)集合,會(huì)對(duì)個(gè)人隱私數(shù)據(jù)(A3 及以上)和個(gè)人診療敏感數(shù)據(jù)(C3 數(shù)據(jù))提供較為直接的引導(dǎo);例如:IP+生物標(biāo)識(shí)、姓名+門診號(hào)等。 L2級(jí)數(shù)據(jù)集合 L2級(jí)屬于弱敏感數(shù)據(jù)集合,直接或間接地泄露患者的就診過(guò)程數(shù)據(jù)(C2 數(shù)據(jù))或者個(gè)人一般數(shù)據(jù) (A2 及以下 ),會(huì)引起對(duì)患者某方面病癥的猜測(cè);或者會(huì)對(duì)發(fā)現(xiàn)個(gè)人高度隱私數(shù)據(jù)(A3 及以上)和個(gè)人診療敏感數(shù)據(jù)(C3 數(shù)據(jù))提供較為間接的引導(dǎo);例如:姓名+出生日期、姓名+護(hù)理記錄。 L1級(jí)數(shù)據(jù)集合 L1級(jí)屬于非敏感數(shù)據(jù)集合,不會(huì)泄露個(gè)人隱私和患者隱私;例如:出生日期+性別、年齡+病癥。
基于業(yè)務(wù)場(chǎng)景所需的字段進(jìn)行場(chǎng)景化數(shù)據(jù)集合分級(jí),不僅能夠?qū)⑨t(yī)療數(shù)據(jù)的分類分級(jí)結(jié)果切實(shí)地應(yīng)用到實(shí)際業(yè)務(wù)場(chǎng)景當(dāng)中;同時(shí)也是對(duì)每一個(gè)業(yè)務(wù)場(chǎng)景的數(shù)據(jù)集合交易,明確標(biāo)識(shí)其敏感級(jí)別,為數(shù)據(jù)、數(shù)據(jù)集合的應(yīng)用提供安全管控依據(jù);是“讓安全‘懂’業(yè)務(wù)、讓業(yè)務(wù)‘知’安全”的關(guān)鍵。
\ | /
Copyright ? 2022 上??评讜?huì)展服務(wù)有限公司 旗下「智慧醫(yī)療網(wǎng)」版權(quán)所有 ICP備案號(hào):滬ICP備17004559號(hào)-5