整理包／2024 AI 大趨勢！GPT Store來了、科技巨擘 AI 語言模型大車拚誰會笑到最後？

本文共5233字

2024/01/11 15:00:00

經濟日報新聞部新媒體中心／編輯范熒恬整理

科技媒體TechCrunch於2023年底時預測：OpenAI 2024年會成為一家產品公司。而OpenAI 1月10日也正式推出GPT版App商店：GPT Store，並為小團隊提供ChatGPT新的訂閱方案。GPT Store可讓開發商和用戶分享自己的客製化ChatGPT版本並從中獲利。（延伸閱讀：增闢財源！OpenAI 正式推出 GPT Store 和企業新訂閱服務）

除了推出ChatGPT的OpenAI之外，各家科技大廠微軟、Google、Meta、AWS 等業者在AI大模型研發競爭激烈，所謂大型語言模型（LLM）是什麼呢？微軟近期推出的小型語言模型（SLM）Phi-2的評測報告，聲稱大贏對手，Google、微軟、Meta 分別推出了 Gemini、Phi-2、Llama 2 ，他們之間有什麼不同？今天《經濟日報》帶你一起了解，2024年AI趨勢有哪些，以及這些AI語言模型有何不同。

2024 AI趨勢有哪些？AI 大預測一次看

根據科技媒體TechCrunch預測，2024年AI將出現以下8大趨勢：

1.OpenAI 成為一家產品公司

2.代理、生成影音和生成音樂「大眾化」

3.混合小模型可能更有優勢

4.很多公司會放棄大規模應用AI

5.蘋果將加入戰局

6.人工智慧濫用致法律案件發生

7.新的AI合規行業將誕生

8.2024年美國選舉是一場混戰 AI火上添油

（資料來源：8 predictions for AI in 2024）

大語言模型戰國時代

NVIDIA（輝達）於12月發布對於2024年的預測，提到AI將成為新的太空競賽。而近來在大語言模型產業領域，呈現私有模型與開源模型陣營之爭。

私有模型：如OpenAI的ChatGPT商用版，提供企業端以串接API（應用程式介面）方式使用，企業需將自身數據上傳，並按照用量付費。

開源模型：基於免費取用、可修改程式原始碼原則，企業端可自由用於開發使用，代表性的開源模型包括臉書母公司Meta推出的Llmma 2、新創Hugging Face的BLOOM等。

大型語言模型（LLM，Large Language Model）：基於大量資料進行預訓練的超大型深度學習模型。基礎轉換器是一組神經網路，這些神經網路由具有自我專注功能的編碼器和解碼器組成。
文字導向 LLM 適用於各種自然語言處理工作，包括生成文字、機器翻譯、生成文字摘要、回答問題，以及建立可與真人對話的聊天機器人。LLM 也可以使用其他類型的資料進行訓練，包括程式碼、圖片、音訊、影片等。

大型語言模型有哪些優點？LLM 是透過大量資料預先訓練而成，可訓練來執行各種工作（諸如：文字生成、摘要和翻譯），因此相當靈活有彈性。由於這類模型可針對特定工作進行微調，如此一來可能提高效能，因此擴充性也非常高。

科技巨擘AI語言模型大比拚

微軟（Phi-2）

微軟執行長納德拉在2023年11月Microsoft Ignite活動上，發表P... — 微軟執行長納德拉在2023年11月Microsoft Ignite活動上，發表Phi-2模型。（網路圖片／微軟官網提供）

微軟（Microsoft）2023年11月發表效能優於Google Gemini Nano 2的Phi-2語言模型，公司表示「Phi-2只有27億個參數，在多個總合基準上，表現比70億參數的 Mistral 和130億參數的 Llama-2 都還要好。」（Mistral 是法國新創AI公司的產品，Llama-2是臉書母公司 Meta 的模型。）

11月21日年度發布會，微軟以Copilot為核心提出眾多服務，Microsoft 365 Copilot企業版開始推出，並將推出AI助手Microsoft 365 Chat。微軟使用者可以直接在瀏覽器中直接使用GPT4、DALL E 3，而不用訂閱GPT Plus。

微軟研究部門12月中發表的小型語言模型（SLM）Phi-2 評測報告，以「小語言模型的驚人力量」為題，指出 Phi-2在各類測試中展現良好理解與聽懂語言的能力，表現勝過是它25倍大的其他對手模型。GPT、或是 Google 的 Gemini 等人工智慧（AI）系統，是使用大型語言模型（LLM）。SLM 跟他們不同，是以較少的參數、較少的電腦運算來運作。這樣的小型AI模型，雖然不能生成 LLM 那麼多的人工智慧，對於特定的任務，卻是很有效率。

Phi-2的訓練素材和Phi-1同樣基於「教科書等級」的概念，包含了特別創建的合成數據集，包括科學、日常活動、心靈理論等，並進一步篩選具有教育價值和內容質量的網絡數據擴充訓練語料庫。並將參數量從13億擴大至27億。（延伸閱讀：微軟發表 Phi-2 小語言模型評測報告聲稱完勝對手）

模型參數： Phi-2擁有27億參數，展現了在基礎語言模型中卓越的推理和語言理解能力。

性能優越性：在複雜基準測試中，Phi-2優於多達25倍大的模型，這歸功於新的模型擴展和訓練數據編輯的創新。

理想實驗場：規模小巧的Phi-2是研究人員的理想試驗場所，可用來探索機械式的可解釋性（mechanistic interpretability）、安全性的改善，或針對各種任務進行微調實驗。

Google（Gemini）

谷歌（Google）12月6日推出自家的生成式AI模型「Gemini」，迎戰問世... — 谷歌（Google）12月6日推出自家的生成式AI模型「Gemini」，迎戰問世一年多的ChatGPT，然而發布才過一天，外界已經開始質疑谷歌展示的性能有「粉飾、造假」之嫌。歐新社

Google 2023年12月6日推出新的生成式AI模型「Gemini」，將首度可直接在手機上運作，據金融時報報導，Google將Gemini形容為該公司「最大、最有能力、最通用」的AI系統，可分析影像和聲音資訊，並且具有複雜的推理和「規劃」能力。它從12月6日開始驅動Google的Bard聊天機器人，從明年起更廣泛地整合入Google的搜尋引擎中。

Gemini的其中一個版本「nano」，是專為在行動裝置上運作而設計的，而且將整合到Google最新的Pixel手機中。Google表示，這會在手機上「原生運作」，而nano模型是針對手機而優化的，因此Android開發人員能夠輕鬆地打造離線使用的AI應用程式（App）與功能，或者把個人資訊更加良好地儲存在私人手機中。」

Gemini號稱多項測試超越OpenAI的GPT4模型，而Gemini Nano 2是 Google 押注多模型 LLM，所發表的最新一款可在本地運作的AI系統，預計要取代 Google大部分服務中的 PaLM-2。（延伸閱讀：谷歌Gemini完勝ChatGPT？專家曝展示影片經「特殊剪輯」）

Bard Advanced

「Gemini 」正式上線時，Google 也同步說明將以Gemini Pro形式整合至人工智慧服務「Bard 」等Google產品，但初期僅對應英語互動，未來也會陸續支援更多語種。另外，Google後續會進一步推出整合Gemini Ultra、更進階的「Bard Advanced」，但是否會另外以計費形式提供使用，目前還無法確定。

模型參數：Google並未公開Gemini的訓練參數量，而Gemini在用來評估所謂的大型語言模型的產業標準基準測試中得分超過90%，有30項都勝過OpenAI的GPT-4模型。

手機運作： Gemini是一個生成式AI模型，首次可以直接在手機上運作，尤其是在Google最新的Pixel手機上。Gemini Nano版本特別為在行動裝置上優化，實現原生運作。

Gemini Nano 2： Google押注多模型LLM的最新版本，預計要取代Google大部分服務中的PaLM-2。Gemini Nano 2於12月提供給一些開發人員與企業客戶，隨後在明年更廣泛推出。

Meta（Llama 2）

臉書母公司Meta執行長祖克柏在開發者大會上發表一系列人工智慧（AI）新產品，和... — 臉書母公司Meta執行長祖克柏在開發者大會上發表一系列人工智慧（AI）新產品，和其他科技公司一樣與時間賽跑，爭先恐後想找到能讓AI打入主流消費市場的致勝公式。圖／路透

Llama 2是由Meta在2023年7月釋出的開源可免費商用大型語言模型，幾個月內 Llama 2在開源LLM模型競賽中快速竄起，在Huggingface公布許多模型幾乎都是基於Llama 2衍生的模型。

Meta指出，自Llama2推出後，2023年9月的下載量已達3千萬次，顯示Llama 2對全球開發者社群的重要性，Meta期待運用自身研究成果及企業資源，幫助全球對於科技應用及社會公益懷抱熱情的有志之士，為整體社會創造益處。

臉書母公司Meta執行長祖克柏在2023年9月27日的Meta Connect大會中宣布串接Meta各應用程式與裝置的AI助理「Meta AI」將上線，是接近與真人互動的全新AI助理，支援WhatsApp、Messenger、Instagram，能在文字聊天即時獲取最新資訊，並提供圖像生成工具。Meta強攻AI，也帶動其資料中心AI伺服器代工業者廣達、緯穎的出貨。（延伸閱讀：Meta強攻AI 誰受惠？）

有人工智慧（AI）教父之譽的李開復接受彭博訪問時說：「Llama 2已經成為黃金標準，對開源社群貢獻很大。我們希望提供一個出色的選擇，不僅為中國，也為全球市場。」

台灣企業也以此推出商用模型服務，如台智雲開發了繁體中文版本的優化Llama 2模型，提供了70億、130億和700億參數的三種商用版本，以滿足企業客戶的需求。

模型參數：提供三種模型大小，分別為70億、130億和700億個參數。模型架構基本保持不變，但基礎模型的訓練數據增加了40%。

開源模型： Meta免費發布Llama 2的代碼和數據，鼓勵全球研究人員利用和改進這一技術，強調開源軟體對於促進創新的重要性。

開源爭議：據維基百科資料，Llama 2的開源描述引起了爭議，部分因為一些限制，受到了開源倡議組織的批評。

Meta AI：由客製化模型所驅動，結合大語言模型 Llama 2技術，例如在文字聊天中，Meta AI將透過搜尋引擎Bing即時獲取最新資訊，並提供圖像生成工具EMU，生成個人AI貼圖。

OpenAI於11月6日召開首屆開發者大會，推出讓用戶自行構建專用版ChatGP... — OpenAI於11月6日召開首屆開發者大會，推出讓用戶自行構建專用版ChatGPT。路透

最後，讓我們來回顧一下Open AI於11月開發者大會發布的GPT-4更新。

Open AI（GPT-4）

OpenAI於2023年3月14日正式推出 GPT-4 大型語言模型。OpenAI 也提供描述 GPT-4 功能的論文，以及詳述其侷限性的系統模型 Card。

而OpenAI於2023年11月6日首次的開發者大會也帶來眾多的亮點，包括GPT-4能跟上時事到2023年4月、文本輸入限制放寬到128K、GPTs讓所有人都能依其需求打造GPT，而GPT版App商店也將展開服務。（延伸閱讀：功能更強大的GPT-4現身！完勝GPT-3.5但仍然有缺點）

模型參數： GPT-4是OpenAI擴展深度學習的最新里程碑，是一個大型多模態模型，可接受圖像和文本輸入，生成文本輸出。我們知道GPT-3.5模型的參數量為2000億，GPT-3的參數量為1750億，但OpenAI沒有再揭露GPT-4模型的大小、參數。

和GPT-3.5相比：在複雜任務中，GPT-4展現出更高的可靠性、創造力，能夠處理比GPT-3.5更微妙的指令。

人類水平性能：在各種專業和學術基準測試中，GPT-4展現出人類水平的性能，例如在模擬律師考試中得分約為前10%。

開源AI模型評估框架： OpenAI Evals，一個用於評估 AI 模型的開源軟件框架，使用開源代碼，開發人員還可以編寫和添加自定義評估以及幾個模板可以適應不同的基準。

11月底，OpenAI高潮迭起的換將風暴終於平息下來，CNBC報導，軟體新創公司Log10執行長Arjun Bansal接到許多客戶來電，要求協助他們減少使用OpenAI的GPT，原因是不穩定性。

Bansal說：「大家在詢問如何微調不同的模型或嘗試不同的服務供應商，儘量不影響到原本的代碼設置。」他提及這是前所未有的情況，OpenAI規模極大、治理結構卻極其罕見，幾天間經歷重大動盪。

而有創投公司合夥人對這波動盪表明，我們還處於市場的早期階段，這也表示還有更大空間，可供更多新創企業一展身手。

據外媒報導，前美國財長桑默斯（Larry Summers）以經濟學者之姿成為OpenAI新董事會成員，這個消息可能令人訝異。但桑默斯長久來跟華爾街和華府人脈關係既深且廣，而且篤信AI將影響白領工作。有他坐鎮監督OpenAI，既可降低監管疑慮，也有助鞏固OpenAI與華爾街的關係。