日本麻疹疫情快速升溫 疾管署籲赴日旅遊先接種疫苗
中國人工智慧新創公司DeepSeek(深度求索)最新一代AI模型,最快將於下週發布,但就在發表前夕,《路透社》引述川普政府高層官員消息表示,DeepSeek的新模型是使用集中部署在內蒙古的資料中心的輝達(Nvidia)最先進AI晶片「Blackwell」進行訓練,指相關作法恐已違反美國出口管制規定。
報導指出,美方研判DeepSeeK可能移除可辨識其使用美國晶片的技術指標。該官員拒絕說明美國政府如何取得相關情報,也未透露DeepSeek是透過何種管道取得晶片,但強調美方政策立場明確,「我們並未向中國出口Blackwell晶片。」
直指Blackwell晶片就在內蒙古資料中心
對此,輝達拒絕回應,美國商務部與DeepSeek亦未回應媒體查詢。而中國駐美大使館則表示,北京反對「劃設意識形態界線、泛化國家安全概念、濫用出口管制措施,以及將經貿與科技問題政治化」。
報導表示,此事件恐進一步加劇華府對中國取得美國先進AI半導體技術的政策分歧。外界稱「AI 沙皇」的白宮AI事務主管塞克斯(David Sacks)與輝達執行長黃仁勳均主張,有限度對中出口高階AI晶片,有助抑制中國企業加速自主研發;但華府內的對中強硬派憂心,相關晶片可能轉為軍事用途,削弱美國在AI領域的戰略優勢。
川普去年8月曾鬆口允許輝達對中銷售Blackwell降規版本,後來改變立場,強調最先進晶片應優先供應美國企業。去年12月決定允許中國企業購買輝達H200晶片,也引發對中強硬派批評,但因核准程序中有附加安全防護機制,目前出貨也處於停滯狀態。
訓練過程還採用美國「蒸餾」技術
該名美國官員並指出,DeepSeek用於訓練新模型的過程,很可能運用了來自美國頂尖 AI 公司的模型「蒸餾」(distillation)技術,包括Anthropic、谷哥(Google)、OpenAI與xAI等公司產品。此說法呼應了OpenAI與Anthropic先前提出的相關指控。
所謂「蒸餾」技術,是指由較成熟、性能更強大的舊模型,評估新模型生成答案的品質,並將舊模型的學習成果轉移至新模型,藉此提升其表現。
總部位於中國杭州的DeepSeek去年初推出多款AI模型,效能直逼部分美國領先產品,當時即引發華府憂慮中國可能在出口限制下仍加速追趕。此外,科技媒體《The Information》先前報導,DeepSeek曾走私晶片入境中國;路透則首度引述美國政府確認,相關晶片確實用於其內蒙古設施的模型訓練。