download BusinessFocus app
研究揭AI助手亂講新聞 近半答案有明顯錯誤  ChatGPT等四大AI全中槍

研究揭AI助手亂講新聞 近半答案有明顯錯誤 ChatGPT等四大AI全中槍

Business News
By Shiney Xu on 28 Oct 2025

在資訊洪流中,我們越來越依賴人工智能(AI)助手來快速篩選和總結新聞。然而,一項由德國之聲(DW)在內的全球22間公共媒體機構進行的研究發現,四款常用AI助手在處理新聞內容時,近半數回應出現明顯錯誤。這項涵蓋多語言、多地區的測試,針對ChatGPT、微軟Copilot、谷歌Gemini及Perplexity AI的四款主流AI工具進行評估,發現45%的答案存在重大缺陷,其中31%缺乏可靠來源引用,20%出現嚴重事實錯誤。

 AI助手經常曲解新聞內容

 這項由22家公共媒體(PSM)主導的大規模國際研究,在EBU那不勒斯新聞大會發布。來自18國、使用14種語言的專業記者,依據準確性、來源標註等標準,評估了ChatGPT、Copilot、Gemini和Perplexity生成的3000多條回答。

 結果顯示,近一半回答存在至少一項重大問題,其中31%有嚴重來源引用問題,20%存在嚴重事實錯誤。德國之聲(DW)的專項測試更發現,53%的回答有重大缺陷,29%存在準確性問題。在就德國之聲(DW)提問的回應出現事實誤差:一是將肖爾茨(Olaf Scholz)稱為現任德國總理,實際上梅爾茨(Friedrich Merz)已於月前接任;二是錯誤指認斯托爾滕貝格(Jens Stoltenberg)仍擔任北約秘書長,然該職務現已由呂特(Mark Rutte)接掌。

 這項研究與BBC今年2月的研究結果相比,整體結果略有改善,但錯誤率依舊居高不下。在四款聊天機器人中,Gemini表現最差:72%的回答在來源引用方面存在重大問題。BBC的研究也指出,微軟Copilot與Gemini表現最差。不過,兩項研究皆顯示,所有四款AI助手都存在問題。

 AI在新聞領域應用問題日益嚴重

 人工智能助手正逐步取代傳統搜索引擎,成為不少用戶獲取資訊的首選渠道。路透社新聞研究所發布的《2025年數字新聞報告》顯示,全球有7%的網絡新聞消費者透過AI助手接收新聞,而在25歲以下的年輕群體中,這一比例更高達15%。

 歐洲廣播聯盟(EBU)副總幹事德滕德(Jean Philip De Tender)指出,這些錯誤並非偶然,而是「系統性的、跨國界的、多語言的」。這不單影響公眾對媒體的信任,若民眾無法辨別資訊真偽,最終可能對所有內容失去信心,動搖民主社會的參與基礎。

 英國廣播公司生成式人工智能項目總監彼得・阿徹(Peter Archer)則表示,雖然對AI技術抱有期待,相信它能為受眾創造更大價值,但前提是必須確保內容可信度。他坦言現時AI助手仍存在明顯缺陷,並強調願與科技企業合作,共同推動技術發展,為社會帶來積極影響。

 新聞媒體的應對措施

 參與研究的廣播公司與媒體組織呼籲各國政府採取行動。歐洲廣播聯盟(EBU)表示,其成員將向歐盟及各國監管機構施壓,要求其執行現行有關信息誠信、數字服務和媒體多元化的法律規定。

 他們也強調,鑑於AI模型快速發展,未來須優先對AI助手進行獨立監控。同時,EBU與其他國際媒體團體共同發起「事實輸入:事實輸出」(Facts In: Facts Out)聯合倡議,要求人工智能公司對其產品處理與再傳播新聞的方式承擔更多責任。

 該倡議者在一份聲明中指出:「若這些系統歪曲、錯誤歸類或去除可信新聞的上下文,它們就在破壞了公眾信任。」因此訴求很明確:「輸入的是事實,輸出的也必須是事實。AI工具不得損害它們所使用的新聞的完整性。」

 

Text by BusinessFocus Editorial

免責聲明:本網頁一切言論並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力自行作出投資決定,如因相關言論招致損失,概與本公司無涉。投資涉及風險,證券價格可升可跌。

【了解更多最快最新的財經、商業及創科資訊】

👉🏻 追蹤 WhatsApp 頻道 BusinessFocus

👉🏻 下載 BusinessFocus APP

👉🏻 立即Follow Instagram businessfocus.io

最新 金融投資熱話專頁 MarketFocus