經濟日報 App
  • 會員中心
  • 訂閱管理
  • 常見問題
  • 登出

華為版Chat GPT取名盤古Chat將在7月發表

本文共1227字

聯合報 記者林茂仁/即時報導

鈦媒體從華為內部獨家獲悉,華為公司將發布一款直接對標ChatGPT的千億級大模型產品,取名為「盤古Chat」,將於今年7月7日舉行的華為雲開發者大會 (HDC.Cloud 2023) 上對外發表以及內測,產品主要面向企業及政府用戶。

在大陸國產大模型軍備競賽中,繼阿里、百度之後,又一重要科技巨頭入局。基於華為的技術能力,盤古Chat有望成為大陸國內技術能力最強的ChatGPT產品,同時華為生態產業鏈企業也將因此受益。

盤古大模型於2020年11月在華為雲內部成立,華為內部團隊確立三項最關鍵的核心設計原則:一是模型要大,可以吸收海量資料;二是網路結構要強,能夠真正發揮出模型的性能;三是要具有優秀的泛化能力,可以真正落地到各行各業的工作場景。

2021年4月,盤古大模型正式對外發布。其中,盤古NLP大模型是首個千億參數中文預訓練大模型,CV大模型則首次達到30億參數。2022年4月,華為盤古升級到2.0,發布層次化開發方案 (LO, L1,L2) ,打造工業級盤古大模型。

根據華為雲高管的演講PPT資訊,目前華為「盤古系列 AI 大模型」基礎層主要包括NLP大模型、CV大模型、以及科學計算大模型等,上層則是與合作夥伴開發的華為行業大模型。

華為雲人工智慧領域首席科學家田奇今年4月稱,盤古NLP大模型覆蓋的智慧文檔檢索、智慧 ERP、小語種大模型等落地領域,2022年華為剛交付了一個阿拉伯語的千億參數大模型。在應用方面,盤古大模型可以應用於智慧客服、機器翻譯、語音識別等多個領域,提供AI技術支持。

去年華為將盤古大模型在垂直產業領域落地應用。一個例子是,基於盤古 AI 大模型,華為在礦山領域打造了首個基於大模型的人工智慧訓練中心,實現 Al 應用工業化 開發,不僅降低成本—比人工核查節省80%+、每噸成本降低人民幣8元 (年產能260萬噸),而且增加效益—防沖禦壓比人工核查節省80%+,提升效率—智能客戶效率提升30%。

與其他廠商相比,華為的優勢或在於擁有完整的產業鏈和較強的算力調配能力。據浙商證券此前披露,在訓練千億參數的盤古大模型時,華為團隊調用了超過2,000片的昇騰910晶片,進行了超2個月的資料訓練能力。華為內部稱,每年大模型訓練調用GPU/TPU卡超過4,000片,3年的大模型算力成本高達人民幣9.6億元。

根據華為公布的一份論文資料顯示,華為盤古PanGu-Σ大模型參數最多為1.085兆,基於華為自研的MindSpore框架開發。整體來看,PanGu-Σ大模型在對話方面可能已接近GPT-3.5的水平。

值得注意的是,由於盤古大模型擁有超大規模的參數,因此訓練成本較高。儘管盤古大模型在中文語言的處理方面具有很高的準確度和質量,但在語義理解方面仍存在一定的局限性,尤其是在處理複雜的語言結構和語義推理方面。同時,盤古Chat大模型也將面臨著行業激烈的競爭壓力,需要不斷優化和提高模型的性能和質量,才能以保持在市場中的領先地位。

華為版Chat GPT取名盤古Chat將在7月發表。(網路照片)
華為版Chat GPT取名盤古Chat將在7月發表。(網路照片)

※ 歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容

上一篇
阿里巴巴正在落後 蔡崇信、馬雲怎麼出招急救?
下一篇
陸智慧機市占 榮耀、華為稱冠 蘋果從去年Q4的第一名 滑落到第三

相關

熱門

看更多

看更多

留言

完成

成功收藏,前往會員中心查看!