《華爾街日報》援引知情人士消息指出,由於工程師無法大幅提升效能,Meta將延後發布計畫在6月發布的一款旗艦AI模型「Behemoth」,同時此一狀況也引發公司內部對耗費數十億美元打造AI產品這個投資方向的疑慮。
知情人士表示,由於Meta的工程師難以大幅提升「Behemoth」旗艦語言模型的能力,導致員工質疑,相較先前版本,這次的改進程度是否足以支持公開發布。
社群網路服務公司Meta曾憑藉投入巨資開發技術來驅動WhatsApp、Instagram和Facebook上的聊天機器人,使其在AI競賽中快速追逐對手而受到讚賞,今年更計畫投入高達720億美元資本來實現執行長祖克伯(Mark Zuckerberg)在AI領域遠大目標。
曾誇口新模型能力優於OpenAI
Meta 原本計劃在四月推出Behemoth模型,以配合其首次面對開發者的AI大會。Meta曾在該活動前發布Llama AI模型家族中的兩個較小模型,但之後將 Behemoth較大型版本的內部發布目標推遲到六月。如今,這一時程又將被延後至秋季或更晚。
祖克柏及其他Meta高層至今尚未對Behemoth的發布時間表作出公開承諾。據了解,Meta最終可能會選擇提前發布Behemoth,包括推出功能較為有限的版本。然而,Meta的工程師和研究人員擔心,該模型的實際表現可能無法符合公司先前對其能力的公開說法。
據知情人士透露,Meta高層對構建Llama 4模型的團隊感到失望,且將未能推動Behemoth模型獲得進展的責任歸咎於該團隊,因此,Meta正考慮對AI產品部門進行重大管理階層調整。
Meta曾公開宣揚Behemoth的能力,稱這款模型在某些測試中優於OpenAI、Google和Anthropic的類似技術,但知情人士表示,Behemoth在內部實際面對訓練挑戰時的表現不盡人意。
未來砸重金恐不代表AI模型進步能力
除Meta之外,其他試圖發布下一代重磅先進模型的頂尖AI公司也紛紛遭受挫折或延遲。像是OpenAI準備以GPT-5做為技術上的突破,但《華爾街日報》先前曾報導,這款模型原擬在2024年年中左右推出,不過去年12月傳出GPT-5的開發進度落後於計劃。
直到今年2月,OpenAI執行長阿特曼(Sam Altman)表示,該模型將以GPT-4.5的形式發布,並透露期望更大技術突破的GPT-5模型仍需數月時間才能問世。目前ChatGPT運用的是GPT-4o的幾個版本,同時OpenAI對GPT-5的發布時間不予置評。
報導引述一些研究人員看法認為,上述例子表明,未來AI模型的進展速度可能遠不如過去,而且成本會很高昂。