利用GPT-4o生成網路檔案元數據:挑戰與洞見

新加坡國家圖書館管理局的研究人員探討使用GPT-4o生成網路檔案元數據的可行性,以提升效率和降低成本。研究處理了112個WARC檔案,透過數據縮減技術將元數據生成成本降低了99.9%。研究人員利用提示工程生成標題和摘要,並使用Levenshtein距離、BERTScore和McNemar’s檢定進行評估。結果顯示,儘管該方法能大幅節省成本和提高效率,但人工策劃的元數據在質量上仍具優勢。研究也指出了一些挑戰,例如內容不準確、幻覺和翻譯問題,建議大型語言模型應作為人工編目員的補充而非替代品。

本文由AI協助編輯,詳細內容來自:arxiv.org
https://arxiv.org/html/2411.05409v3
#全球觀測

Post a Comment

較新的 較舊