跳到主要內容區塊
::: 回首頁| 網站導覽| YouTube| Podcasts|
|
推播熱門報導

繞道星、馬用輝達晶片練功 中國科技業加速將AI模型訓練移至海外

2025-11-28 11:41(11-28 11:57更新)
新聞引據:金融時報
撰稿編輯:陳文蔚
由於訓練大型語言模型需要處理海量資料,因此大多數中國企業仍偏好使用輝達的AI晶片,為繞過美國禁令,近期紛紛借助新加坡或馬來西亞的資料中心。示意圖。(Freepik圖庫)
圖片來源:其他
由於訓練大型語言模型需要處理海量資料,因此大多數中國企業仍偏好使用輝達的AI晶片,為繞過美國禁令,近期紛紛借助新加坡或馬來西亞的資料中心。示意圖。(Freepik圖庫)

為了能夠使用性能較佳的輝達(Nvidia)AI晶片,《金融時報》報導,中國包括阿里巴巴與字節跳動等多家大型科技中心正加速將大型AI語言模型訓練轉移到海外,藉此繞過美國對中國的晶片禁令。知情人士透露,這些科技公司已經將最新的訓練基地部署到東南亞的新加坡、馬來西亞等地,而相關操作仍符合美國現行管制規定。

據兩位直接了解此事的人士透露,阿里巴巴和字節跳動等科技集團正在東南亞各地的資料中心訓練其最新的大型語言模型(LLM)。知情人士還說,自美國在4月限制輝達僅在中國銷售的降規版H20晶片之後,中國科技公司轉移到海外訓練的數量一直在穩步增加。

報導指出。近年新加坡與馬來西亞的資料中心群急速擴張,主要正是受中國需求帶動,當地許多資料中心多配備與美國大型科技公司用於訓練 LLM 相同級別的輝達高端產品。

川普親自解開拜登時期所堵的漏洞

一名位於新加坡的資料中心營運商表示:「來這裡是顯而易見的選擇。你需要最頂級的晶片來訓練最尖端的模型,而這一切都完全合法合規。」

過去一年,阿里巴巴的「通義千問(Qwen)」與字節跳動的「豆包(Doubao)」模型已躍升為全球最具表現的大型語言模型之一。通義千問更因其為免費開放的「開源」模型,而在中國以外的開發者間獲得廣泛採用。

熟悉此做法的人士表示,中國企業通常會與海外、由非中資企業擁有並營運的資料中心簽署租約,這一做法符合美國出口管制規定,因為拜登政府時期為堵上這個漏洞所設置的「擴散規則(diffusion rule)」,已經在今年稍早被川普總統取消。

不過也有一些企業例外,像是DeepSeek因是在美國禁令生效前大量購入輝達(Nvidia)晶片,因此仍能在中國境內訓練模型。在此同時,公司也正與以華為等中國晶片製造商密切合作,以優化並開發下一代本土AI晶片,甚至華為還派駐一個工程師團隊進駐DeepSeek杭州總部,希望聯手推動半導體與軟體系統發展的戰略行動。

推理階段才改用本土晶片

訓練大型語言模型需要大量運算能力處理海量資料,因此大多數中國企業仍偏好使用輝達的先進產品進行訓練。

然而,中國企業愈來愈多在「推理(inference)」階段使用本土晶片。推理指的是 AI系統回應使用者請求的過程,其運算量在AI整體工作負載中所占比重正持續上升。

除了訓練之外,報導指出,中國科技公司也利用東南亞的資料中心來服務其海外客戶,因為阿里巴巴與字節跳動均力求擴大其在全球雲端運算市場中的佔有率,同時,中國企業也在中東等其他地區加速布局資料中心設施。

不過,中國官方規定中國科技企業不得將個人資料移出境外。多名業界人士表示,若需使用中國客戶提供的特定資料來客製化AI模型,那麼這些相關訓練就必須在中國境內進行。

延伸閱讀
AI晶片 晶片管制 阿里巴巴 輝達NVIDIA 字節跳動 美國晶片禁令
為提供您更好的網站服務,本網站使用cookies。
若您繼續瀏覽網頁即表示您同意我們的cookies政策,進一步了解隱私權政策。 
我了解