新研究發現|ChatGPT勝過實習醫生 診斷兒童呼吸疾病揭示AI潛力
【編譯黃惠瑜/綜合外電】英國一項新研究發現,OpenAI研發的聊天機器人ChatGPT在診斷複雜的兒童呼吸系統疾病方面,如囊狀纖維化、氣喘等,表現得比實習醫生更好,突顯人工智慧(AI)在醫療診斷中的潛力。
這份研究由英國研究員那拉亞南(Manjith Narayanan,音譯)主導,他是愛丁堡皇家兒童與青少年醫院(Royal Hospital for Children and Young People)的兒童肺科專家。那拉亞南表示,像ChatGPT這類的大型語言模型(large language model,LLM)具有多種潛在的應用,這項研究的目的為評估LLM在現實生活中協助臨床醫師的能力。此研究於週一(9日)發表在2024年歐洲呼吸道學會年會(European Respiratory Society Congress)上。
那拉亞南使用了由另外6名兒科呼吸醫學專家提供的臨床情境,包括囊狀纖維化、氣喘、睡眠呼吸障礙等,這些都沒有明顯的診斷方式,沒有相關發表的證據、指南或專家共識。
在研究中,10名參與的實習醫生擁有不到4個月的兒科臨床經驗,他們被給予1小時的時間,針對每種情境,以200字到400字的描述提供解決的建議,可以查詢網路,但不能使用AI聊天機器人。每個情境也同樣提供給3個聊天機器人,分別是ChatGPT、谷歌(Google)的Bard以及微軟(Microsoft)的Bing。
醫生的回答被評分,並與聊天機器人的回答進行比較。
結果,ChatGPT的得分最高,而且它的回答被認為比另外兩個聊天機器人更具人性化。谷歌的Bard在某些方面的表現也比實習醫生好,微軟的Bing則跟實習醫生表現一樣好。
那拉亞南表示,此項研究結果顯示,將LLM應用在日常臨床應用的時間點越來越近。
此外,研究人員在3個聊天機器人中並未發現所謂的「幻覺」現象(hallucinations),即虛構訊息的情況。然而,那拉亞南也提醒,發生的可能性仍存在,因此未來仍需要採取緩解措施。