打開 App

  • 會員中心
  • 訂閱管理
  • 常見問題
  • 登出
bell icon

阿里最強開源模型 上秀

阿里巴巴。路透
阿里巴巴。路透

本文共502字

經濟日報 記者謝守真/綜合報導

阿里巴巴昨(29)日發布新一代通義千問Qwen3(千問3)系列人工智慧(AI)模型,新版模型參數量僅DeepSeek-R1的三分之一,成本大幅下降。

在LiveCodeBench大語言模型評測榜單中,千問3模型性能全面超越DeepSeek-R1、OpenAI-o1等全球頂尖模型,登頂全球最強開源模型。

千問3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強,創下所有大陸國產模型及全球開源模型的性能新高。

據中國證券報,千問3是大陸國內首個「混合推理模型」,「快思考」與「慢思考」集成進同一個模型,對簡單需求可低算力「秒回」答案,適用於對速度要求高於深度的簡單問題。而對複雜問題可多步驟「深度思考」,節省算力消耗。

至於性能方面,千問3預訓練數據量達36T ,並在後訓練階段進行多輪強化學習,在推理、指令遵循、工具調用、多語言能力等方面均有增強。

在效能提升的同時,Qwen3部署成本下降,僅需四張H20即可部署Qwen3滿血版,顯示卡記憶體占用僅為性能相近模型的三分之一。

阿里通義已開源200餘個模型,全球下載量超三億次,千問衍生模型數超10萬個,衍生模型數量已超越美國Llama,成為全球第一開源模型。

※ 歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容

延伸閱讀

上一篇
聯想秀超級智能體
下一篇
陸股受資金面波動衝擊 短期震盪

相關

熱門

看更多

看更多

留言

完成

成功收藏,前往會員中心查看!