微軟小語言模型威力大完勝比它大25倍的對手

提要

評測Phi-2 理解與聽懂的「力量驚人」

本文共736字

2023/12/14 00:30:39

經濟日報編譯黃淑玲／綜合外電

微軟研究部門12日發表小型語言模型（SLM）Phi-2的評測報告，報告以「小語言模型的驚人力量」為題，指出Phi-2在各類測試中展現良好理解與聽懂語言的能力，表現勝過是它25倍大的對手模型。

微軟在上個月的Microsoft Ignite活動中，首次發表Phi-2模型，執行長納德拉當時特別強調，它以一小部分的訓練資料，就能達最高水準表現。

GPT、或是Google的Gemini等人工智慧（AI）系統，使用的是大型語言模型（LLM），而SLM是以較少的參數和較少的電腦運算來運作。這樣的小型AI模型，雖然無法像LLM生成那麼多的人工智慧，對特定的任務，卻是很有效率。

微軟說：「Phi-2只有27億個參數，在多個總合基準上，表現比有70億個參數的Mistral和130億個參數的Llama-2 都還要好。」Mistral是法國新創Mistral AI公司的產品，Llama-2是臉書母公司Meta的模型。微軟也用Phi-2把Google新發表的AI模型Gemini Nano 2比下去；微軟表示，Phi-2雖然小，但表現與Gemini Nano 2相當甚至更好。

Gemini Nano 2是Google押注多模型LLM，所發表的最新一款可在本地運作的AI系統，預計要取代Google大部分服務中的PaLM-2。

微軟的AI策略不只在開發模型，也為AI特別設計了Maia、Cobalt晶片，這顯示微軟想要全面整合AI與雲端運算。特製的晶片要將AI任務做最佳發揮，支持微軟調和軟硬體能力的願景，準備與Google的Tensor，以及蘋果的M系列晶片，直接競爭。

Phi-2這類小型語言模型可在本地運作，所需的設備等級不必太高，甚至有可能在智慧手機就能運行，一旦成真，新的應用就會更廣。

※ 歡迎用「轉貼」或「分享」的方式轉傳文章連結；未經授權，請勿複製轉貼文章內容