打開 App

  • 會員中心
  • 訂閱管理
  • 常見問題
  • 登出

超車 Google 頂尖對手 騰訊文生圖模型功能稱冠

國際大模型競技場LMArena最新顯示,騰訊旗下混元圖像3.0(hunyuanimage 3.0)在全球26款模型位居第一。(圖取自央廣網)
國際大模型競技場LMArena最新顯示,騰訊旗下混元圖像3.0(hunyuanimage 3.0)在全球26款模型位居第一。(圖取自央廣網)

本文共611字

經濟日報 記者黃雅慧/綜合報導

國際大模型競技場LMArena最新評測顯示,騰訊旗下混元圖像3.0(hunyuanimage 3.0)在全球26款模型「盲測」中位居第一,被評為最佳綜合文生圖模型,贏過Google推出的「Nano-banana」(奈米香蕉)等頂尖閉源模型。

LMArena為美國加州大學伯克利分校推出的創新AI模型評估平台,評測核心方法是基於人類真實偏好的「盲測」機制,讓用戶對不同AI模型的回答進行匿名投票,衡量模型的表現。

騰訊於9月28日發布混元圖像3.0,聲稱是全球首個工業級原生多模態生圖模型。更是目前效果最強、參數量最大的開源生圖模型,且效果能夠對標業界領先的閉源模型。

據了解,該模型不僅能生成複雜文本、複雜漫畫、表情包,還能生成生動有趣的科普插畫。這些能力將大幅提高插畫師、設計師等視覺創作者的效率,原來需要畫幾個小時的漫畫,現在可能只需要幾分鐘就能實現。

舉例而言,用戶只需要輸入提示詞:「生成一個月全食的四格科普漫畫」,模型就可以自主生成完整的月全食科普,無需使用者逐格描述內容。

混元團隊透露,混元圖像3.0目前版本已開放文生圖能力,圖生圖、圖像編輯、多輪交互等版本將於後陸續發布。

Nano-banana即Gemini 2.5 Flash Image,原本在LMArena廣受好評,其除了文字生成圖片的基本功能,最大的亮點在於圖像進階操作。只要提供一張圖片,就能用簡單指令進行替換、修改或重新構圖,且能維持角色與風格的一致性。

※ 歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容

猜你喜歡

上一篇
預防被美卡脖子 陸大基金三期加碼光罩材料
下一篇
京東建物流機器人超級工廠 近期正式落地無錫

相關

熱門

看更多

看更多

留言

完成

成功收藏,前往會員中心查看!