五月婷婷在线观看|国产成人精品3p人妻网站|日本老熟妇maturebbw|日韩 欧美 综合

新聞資訊

醫院病人緊急呼叫系統 AI如何更懂醫?看騰訊天衍實驗室智能醫療診斷技術創新

2023-10-18 11:41

近年來,在互聯網技術和政策、疫情等大環境的推動下,在線問診需求正高速增長,自然語言處理(NLP)技術在該領域的研究成果和應用落地也越來越多。雖然,智能問診已經能夠實現預診斷,但很多時候系統給出的診斷結果與現實情況大相徑庭。舉例來說,當我們能準確地給出“體溫38.5度、有點發熱、四肢無力”等癥狀時,系統會比較容易根據提供的信息進行詢問,給出如感冒、病毒感染等相對精準基礎診斷;但如果給出諸如“疲勞”,甚至“累”“沒勁”“胸痛”等含糊不清的主訴,智能診斷系統可能就無能為力了。

這是因為,目前計算機在文本理解的精度和深度上和人類仍然有很大的差距,特別是在醫學領域,不僅要求計算機學會龐大的專業術語,形成知識圖譜;更要能讀懂沒有專業知識的患者對于癥狀的模糊主訴,并將其與專業術語做關聯。

在此過程中,研究人員除了要給算法“投喂”龐大的專業語料和日常知識,提升算法能力,加強AI對真實世界的理解,還需要用更好的策略,選擇合適的模型,優化醫療NLP領域目前面臨的問題,而這也是第二十屆中國計算語言學大會(下稱)智能醫療對話診療評測——“智能化醫療診斷賽道”要解決的主要難點。

在此賽道中,騰訊天衍實驗室團隊提交的方案憑借較高的疾病預測準確率和癥狀召回率,成功獲得該賽道第一名,下面我們來看看這套方案是如何進行算法思考和模型選擇的。

任務難點:讓算法迅速讀懂“患者”

“智能化醫療診斷”賽道的任務是:需要選手開發一個模擬實際問診過程的可交互程序,用程序與擁有超過2000組醫患對話樣本的病人模擬器“過招”:首先,要與主辦方提供的模型交手,判斷出“患者”的初始癥狀;然后ai預問診,還要根據這些信息,輸出能夠進一步獲取有效信息的問題,對“患者”?進行接下來的癥狀詢問;最終,在不超過11次的交互過程中,識別出“患者”的疾病和癥狀。比賽結果也是以診斷準確率和癥狀召回率來確定。

其中的難點是,2000組的對話樣本,每個都包含著大量數據信息:疾病類別、病人自訴文本、直接信息(病人自訴中明確提及的實體信息、癥狀),甚至隱藏信息(需要結合整段醫患對話得到實體及標簽,判斷患者是否已經有該癥狀)。并且,與現實世界病人一樣,機器“患者”不會一次性把癥狀表述清楚,比如出現一種癥狀多種描述等主訴表達。

選手開發的算法和對應算法選擇的模型,不僅要能“讀懂”被“模糊描述”的癥狀,并迅速將癥狀分類;還要根據當前詢問到的病人信息,準確判斷出“患者”還可能具備什么癥狀,以便在有限的問診交互環節中ai預問診,增加“患者”有效信息輸出,從而最大可能提升疾病診斷準確率以及癥狀召回率。

因此,該任務不僅考驗算法能力,更同時考驗算法和模型的搭配策略,以提升程序問診的準確性和效率。

方案對策:更高效的算法+更合適的模型?提升推理速度

為了讓AI更加理解“患者”信息,騰訊天衍實驗室利用搜索、問答、預訓練、分類等多項NLP、機器學習技術,進行程序開發,整體方案分為癥狀問詢、疾病預測兩大版塊,每個版塊都采用相同模型預測方案,同時,每個版塊細分為三個部分:基于檢索查詢歷史病例、基于自然語言的癥狀/疾病預測、基于癥狀的癥狀/疾病預測(如圖所示)。這三個部分在同一個交互周期內會同時運行,并通過加權算法進行“校準”,來得到需要繼續問詢的癥狀或者輸出診斷的疾病。

癥狀問詢預測框架圖

基于檢索查詢歷史病例部分,利用了精準搜索、模糊搜索,以及貝葉斯推理等技術,用來查找算法數據庫中的相似病例,這樣做的好處是,不僅能將主訴癥狀的模糊表述和精準表述相結合,以拓寬對于主訴癥狀和疾病的檢索范圍,還能更高效地對癥狀進行預測。

基于自然語言的疾病預測,是將癥狀列表轉化為自然語言后,利用預訓練語言模型預測查詢癥狀概率分布。值得注意的是,此部分選手們采用的模型是天衍實驗室自有的大規模醫療預訓練語言模型,它是基于大規模的醫療在線文本由繼續訓練得到的,不僅能更好適配醫療領域內的語言學習,還在多項醫療標準數據集上取得了SOTA。相比通用預訓練模型來說,更能勝任醫療相關的任務執行。

上一篇:醫院無線呼叫系統 科大訊飛推出智慧地產解決方案,助力行業數字化升級
返回
下一篇:ICU重癥系統 Ⅳ營銷云在醫療行業中的應用探索-場景