美國研究：AI 聊天機器人回應醫學問題，準確度高但缺乏額外資訊

一項最新發布於學術預印本伺服器 medRxiv 的研究報告指出，五款主流生成式 AI 聊天機器人（包括 ChatGPT、Gemini、Copilot、DeepSeek 與 Grok-3）在回答臨床問題時，其答案與醫學資訊科學家提供的證據摘要高度一致。該研究分析了總計 225 則 AI 回應，結果顯示 20.9% 的答案與專家摘要「完全相符」，而高達 78.7% 則為「部分相符」。研究並未發現這五款聊天機器人在回答的相符性評分上有顯著差異。然而，在「部分相符」的答案中，醫學資訊科學家所提供的額外資訊量，卻顯著多於聊天機器人。這份研究為未經同儕審查的預印本報告，但已初步顯示 AI 在醫學資訊領域的潛力與侷限。

本文由AI協助編輯，詳細內容來自：medRxiv

https://doi.org/10.1101/2025.09.24.25336199

#全球觀測

美國研究：AI 聊天機器人回應醫學問題，準確度高但缺乏額外資訊

Post a Comment

張貼留言

聯絡表單