打開 App

  • 會員中心
  • 訂閱管理
  • 常見問題
  • 登出
bell icon

DeepSeek AI模型震撼矽谷 Meta應戰設四組戰情室

據傳Meta生成式AI團隊的主管和工程師成立四個「戰情室」,專門研究DeepSeek-R1的運作方式。(路透)
據傳Meta生成式AI團隊的主管和工程師成立四個「戰情室」,專門研究DeepSeek-R1的運作方式。(路透)

本文共1056字

經濟日報 編譯葉亭均、記者謝守真/綜合報導

中國大陸人工智慧(AI)新創公司DeepSeek(深度求索)以低成本推出高性能AI模型DeepSeek-R1震撼矽谷,讓臉書母公司Meta的AI研究人員陷入恐慌。據傳Meta生成式AI團隊的主管和工程師成立四個「戰情室」,專門研究DeepSeek-R1的運作方式。

DeepSeek掀起的大模型旋風愈演愈烈,在蘋果App Store大陸區和美國區免費榜均站上冠軍位置,超越ChatGPT及Meta旗下Threads,以及谷歌的Gemini、微軟的Copilot等知名應用。

DeepSeek受到廣泛關注,引起美國科技巨頭的警覺,開始啟動因應舉措。科技新聞網站The Information報導,Meta的AI團隊主管近日對DeepSeek推出的新模型公開表達擔憂,擔心Meta在AI競賽中落後。員工透露,包括AI基礎設施總監歐德漢等主管擔心,自家旗艦AI模型Llama的新版本表現可能無法與DeepSeek匹敵。

DeepSeek去年底推出大型語言模型「DeepSeek V3」,根據多份美國公司發表的評估和使用者評價,這款模型在完成多種任務上,符合或甚至超越三大AI公司Meta、OpenAI和Anthropic的模型;本月20日推出「DeepSeek-R1」,媲美OpenAI的o1推理模型,引發外界質疑美國部分AI公司是否運作效率低,或耗費太多資金,成果卻較差。

開發商能夠自由下載DeepSeek的開源模型,或是透過雲端購買使用權。一些規模較小的App開發商表示已改用DeepSeek的模型,原因是成本遠低於OpenAI或Anthropic模型。

The Information報導指出,OpenAI、Meta和其他頂尖開發商的研究人員正仔細分析DeepSeek模型,尋找可借鏡之處,包括如何以更低成本、更具效率的方式運作。

Meta已為此籌組四個「戰情室」。一名員工透露,兩個小組聚焦如何降低訓練和運作DeepSeek的成本。雖然Meta的模型是免費的,運作成本卻比OpenAI的模型更高,因OpenAI能夠透過批次處理數百萬次的查詢降低價格。第三個研究小組試圖釐清DeepSeek使用哪些數據訓練模型;第四個戰情室則是基於DeepSeek模型歸納出的特質,重新建構Meta的模型。

據稱,Meta正考慮推出一個類似DeepSeek的Llama版本,包含多個AI模型,各自訓練處理不同任務。


延伸閱讀

天才少女助攻「AI界拼多多」 羅福莉躍熱門人物

DeepSeek 震撼引 AI 股恐慌 美學者: AI 爭霸中美打成平手

※ 歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容

猜你喜歡

上一篇
德國挺台要員包瑞翰:歐洲與台灣關係正根本性轉變
下一篇
OpenAI 執行長奧特曼呼籲川普政府:讓 AI 資料中心享有晶片法抵稅優惠

相關

熱門

看更多

看更多

留言

完成

成功收藏,前往會員中心查看!