一項最新發布於學術預印本伺服器 medRxiv 的研究報告指出,五款主流生成式 AI 聊天機器人(包括 ChatGPT、Gemini、Copilot、DeepSeek 與 Grok-3)在回答臨床問題時,其答案與醫學資訊科學家提供的證據摘要高度一致。該研究分析了總計 225 則 AI 回應,結果顯示 20.9% 的答案與專家摘要「完全相符」,而高達 78.7% 則為「部分相符」。研究並未發現這五款聊天機器人在回答的相符性評分上有顯著差異。然而,在「部分相符」的答案中,醫學資訊科學家所提供的額外資訊量,卻顯著多於聊天機器人。這份研究為未經同儕審查的預印本報告,但已初步顯示 AI 在醫學資訊領域的潛力與侷限。
本文由AI協助編輯,詳細內容來自:medRxiv
本文由AI協助編輯,詳細內容來自:medRxiv
https://doi.org/10.1101/2025.09.24.25336199
#全球觀測
張貼留言