研究揭AI助手亂講新聞　近半答案有明顯錯誤 ChatGPT等四大AI全中槍

By Shiney Xu on 28 Oct 2025

在資訊洪流中，我們越來越依賴人工智能（AI）助手來快速篩選和總結新聞。然而，一項由德國之聲（DW）在內的全球22間公共媒體機構進行的研究發現，四款常用AI助手在處理新聞內容時，近半數回應出現明顯錯誤。這項涵蓋多語言、多地區的測試，針對ChatGPT、微軟Copilot、谷歌Gemini及Perplexity AI的四款主流AI工具進行評估，發現45%的答案存在重大缺陷，其中31%缺乏可靠來源引用，20%出現嚴重事實錯誤。

AI助手經常曲解新聞內容

這項由22家公共媒體（PSM）主導的大規模國際研究，在EBU那不勒斯新聞大會發布。來自18國、使用14種語言的專業記者，依據準確性、來源標註等標準，評估了ChatGPT、Copilot、Gemini和Perplexity生成的3000多條回答。

結果顯示，近一半回答存在至少一項重大問題，其中31%有嚴重來源引用問題，20%存在嚴重事實錯誤。德國之聲（DW）的專項測試更發現，53%的回答有重大缺陷，29%存在準確性問題。在就德國之聲（DW）提問的回應出現事實誤差：一是將肖爾茨（Olaf Scholz）稱為現任德國總理，實際上梅爾茨（Friedrich Merz）已於月前接任；二是錯誤指認斯托爾滕貝格（Jens Stoltenberg）仍擔任北約秘書長，然該職務現已由呂特（Mark Rutte）接掌。

這項研究與BBC今年2月的研究結果相比，整體結果略有改善，但錯誤率依舊居高不下。在四款聊天機器人中，Gemini表現最差：72%的回答在來源引用方面存在重大問題。BBC的研究也指出，微軟Copilot與Gemini表現最差。不過，兩項研究皆顯示，所有四款AI助手都存在問題。

AI在新聞領域應用問題日益嚴重

人工智能助手正逐步取代傳統搜索引擎，成為不少用戶獲取資訊的首選渠道。路透社新聞研究所發布的《2025年數字新聞報告》顯示，全球有7%的網絡新聞消費者透過AI助手接收新聞，而在25歲以下的年輕群體中，這一比例更高達15%。

歐洲廣播聯盟（EBU）副總幹事德滕德（Jean Philip De Tender）指出，這些錯誤並非偶然，而是「系統性的、跨國界的、多語言的」。這不單影響公眾對媒體的信任，若民眾無法辨別資訊真偽，最終可能對所有內容失去信心，動搖民主社會的參與基礎。

英國廣播公司生成式人工智能項目總監彼得・阿徹（Peter Archer）則表示，雖然對AI技術抱有期待，相信它能為受眾創造更大價值，但前提是必須確保內容可信度。他坦言現時AI助手仍存在明顯缺陷，並強調願與科技企業合作，共同推動技術發展，為社會帶來積極影響。

新聞媒體的應對措施

參與研究的廣播公司與媒體組織呼籲各國政府採取行動。歐洲廣播聯盟（EBU）表示，其成員將向歐盟及各國監管機構施壓，要求其執行現行有關信息誠信、數字服務和媒體多元化的法律規定。

他們也強調，鑑於AI模型快速發展，未來須優先對AI助手進行獨立監控。同時，EBU與其他國際媒體團體共同發起「事實輸入：事實輸出」（Facts In: Facts Out）聯合倡議，要求人工智能公司對其產品處理與再傳播新聞的方式承擔更多責任。

該倡議者在一份聲明中指出：「若這些系統歪曲、錯誤歸類或去除可信新聞的上下文，它們就在破壞了公眾信任。」因此訴求很明確：「輸入的是事實，輸出的也必須是事實。AI工具不得損害它們所使用的新聞的完整性。」

Text by BusinessFocus Editorial

免責聲明：本網頁一切言論並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦，讀者務請運用個人獨立思考能力自行作出投資決定，如因相關言論招致損失，概與本公司無涉。投資涉及風險，證券價格可升可跌。

【了解更多最快最新的財經、商業及創科資訊】

👉🏻 追蹤 WhatsApp 頻道 BusinessFocus

👉🏻 下載 BusinessFocus APP

👉🏻 立即Follow Instagram businessfocus.io

最新金融投資熱話專頁 MarketFocus

研究揭AI助手亂講新聞 近半答案有明顯錯誤 ChatGPT等四大AI全中槍

研究揭AI助手亂講新聞　近半答案有明顯錯誤 ChatGPT等四大AI全中槍