客運雪崩危機/班次腰斬43% 客運是沒人坐還是沒人開?
根據歐洲廣播聯盟(European Broadcasting Union)今天(22日)公布的研究報告,當在詢問有關新聞事件時, ChatGPT等人工智慧(AI)助理有半數的情況下會出錯,這包括把模倣作品和新聞搞混、弄錯日期或是乾脆捏造事件。
這項報告研究了4種廣被使用的AI助理:OpenAI的ChatGPT、微軟(Microsoft)的Copilot、谷歌(Google)的Gemini、以及Perplexity。
總體而言,在所有的AI答覆中有45%「至少會有一個重大問題」,不論使用的語言或國家。而每5個答案中就有1個「含有重大的準確性問題」,包括產生幻覺(hallucinated)的細節和過時資訊。
在這4個AI助理中,Gemini的表現最差,在76%的回答中出現重大問題,是其他助理的2倍多。這主要是因為它的來源不佳。
以歐洲為主的18個國家的22個公共媒體,在5月底到6月初對AI助理提出了相同的提問。在3千份回覆中,資料過時是最常見的問題之一。
當被問到「教宗是誰?」,ChatGPT對芬蘭國家廣播公司(Yle)、以及Copilot和Gemini對荷蘭廣播聯盟(NOS)與荷蘭公共廣播(NPO)的答案都是「方濟各」(Francis),即使當時方濟各早已辭世由良十四世(Leo XIV)接替。
當法國國家廣播電台(Radio France)詢問馬斯克(Elon Musk)被控在美國總統川普(Donald Trump)1月的就職儀式上做出納粹敬禮手勢時,Gemini回答說這位億萬富豪的「右臂勃起」,這顯然是對一個喜劇演員的諷刺專欄信以為真。
歐洲廣播聯盟的AI副總監德譚得(Jean Philip De Tender)和英國廣播公司(BBC)的AI負責人阿契爾(Pete Archer)認為,AI助理仍非取得並消化新聞的一個可信賴的方式。
儘管如此,越來越多人習慣從AI助理獲取資訊,特別是年輕人。根據路透研究所(Reuters Institute)6月發布的一項全球報告,25歲以下青年有15%每週從AI助理獲取新聞摘要。 (編輯:柳向華)