打開 App

  • 會員中心
  • 訂閱管理
  • 常見問題
  • 登出
bell icon

徹底擺脫輝達?傳 DeepSeek R2於5月發布 全部用華為晶片

市場傳出陸企「深度求索」更強的新版本「DeepSeek R2」大模型將於5月面世,將徹底擺脫輝達晶片,全部基於華為昇騰910B(Ascend 910B)晶片。路透
市場傳出陸企「深度求索」更強的新版本「DeepSeek R2」大模型將於5月面世,將徹底擺脫輝達晶片,全部基於華為昇騰910B(Ascend 910B)晶片。路透

本文共746字

聯合報 記者林宸誼/即時報導

年初陸企深度求索的DeepSeek R1大模型的問世撼動美國AI圈,甚至引發輝達的股價暴跌。在大陸與全球AI競爭對手的高度關注下,市場傳出更強的新版本DeepSeek R2即將在5月面世,將徹底擺脫輝達晶片,全部基於華為昇騰910B(Ascend 910B)晶片。

快科技報導,市場最新爆料,R2大模型將採用更先進的混合專家模型(MoE),總參數量較前代R1提升約1倍,預計達1.2兆(R1總參數量為6710億),單位推理成本較GPT-4大減97.4%。

當下,中國大陸與美國科技戰、貿易戰愈演愈烈,輝達H20晶片面臨新一波出口管制。在DeepSeek R2預期發布時間臨近的情況下,各界高度關注大陸指標性的大模型,在缺乏美國晶片資源下的發展動向。

據傳,R2規模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當,還將結合更智慧的門控網路層(Gating Network),進而優化高負載推理任務的性能。

消息指出,R2將徹底擺脫輝達晶片,訓練全程均未使用輝達顯卡,全部基於華為的昇騰910B(Ascend 910B)晶片集群平台,在FP16精度下,計算性能達到512 PetaFLOPS,晶片利用率高達82%,整體性能約為NVIDIA上一代A100集群的91%。

市場預期,這將降低大陸對海外高端AI晶片的依賴,且華為全新的昇騰910C晶片,也開始進入大規模量產階段。

成本方面,DeepSeek-R2的單位推理成本,較OpenAI旗下的GPT-4大減97.4%。其中,R2輸入每百萬個字元僅需0.07美元,而輸出每百萬個字元僅0.27美元。

分析認為,R2若如傳聞般強勢,可能再次引發市場對AI基礎設施需求的質疑,加上使用華為AI晶片的國產替代,將對輝達帶來更大影響。

※ 歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容

延伸閱讀

上一篇
50多歲日籍男子被控間諜 遭上海法院判刑12年
下一篇
英國認了與美貿易協議針對中國!北京回應了 專家指1原因不會立即報復

相關

熱門

看更多

看更多

留言

完成

成功收藏,前往會員中心查看!