打開 App

  • 會員中心
  • 訂閱管理
  • 常見問題
  • 登出

整理包/Google 新演算法 TurboQuant 會大幅降低 AI 模型的記憶體需求?技術原理與市場衝擊 一文看懂

Google新演算法TurboQuant對記憶體市場的影響,還很難說。 法新社
Google新演算法TurboQuant對記憶體市場的影響,還很難說。 法新社

本文共2638字

經濟日報 新聞部新媒體中心/編輯徐捷整理

※本文首刊於2026年3月27日,文中提及之個股股價僅為當日行情

還記得去年二月春節時,大陸新創公司深度求索「突襲式」推出的全新AI模型「DeepSeek」是怎麼震撼整個AI產業的嗎?現在,下一個被認為具有同樣影響力的新技術終於出現,也就是Google在3月24日發布的全新演算法「TurboQuant」。

這個演算法據說能夠讓記憶體的使用效率成長六倍之多,消息一出便震撼整個市場,重挫原本就已經處於股價高位的記憶體族群。究竟 TurboQuant 有何本領,能夠對記憶體產業造成這麼大的衝擊?經濟日報帶您認識這個全新技術。

TurboQuant是什麼?

3月24日晚間,Google 推出了一套專為大型語言模型(LLM)設計的高效能量化壓縮演算法「TurboQuant」,表示其不僅提升 AI 模型速度和效率,也能大幅減少記憶體使用量。

這項演算法針對的是「向量」(vectors),其功能是協助 AI 模型理解並處理從簡單到複雜的資訊。Google 解釋說,高維度向量會消耗大量記憶體,進而在「鍵值快取」(KV cache)產生瓶頸;而此快取技術正是讓 AI 模型能「記住」已處理過的資料,進而加快回應詢問速度的關鍵。

雖然高維度向量可透過「向量量化」技術來壓縮,但 Google 說,這技術本身也會產生記憶體問題,因為需要計算和儲存額外數據,「這在某種程度上違背了向量量化的初衷」。Google 去年 4 月發表研究論文所提出的 TurboQuant,正是為了解決這個問題。

記憶體晶片示意圖。 路透
記憶體晶片示意圖。 路透

它為何能大幅提高記憶體使用效率?

TurboQuant透過結合兩種技術來克服傳統壓縮方法產生的額外記憶體開銷,分別是PolarQuant(極座標量化)Quantized Johnson-Lindenstrauss(QJL)

極座標量化,指的是透過將傳統的笛卡爾座標系統(如 X, Y, Z軸)轉換為極座標(Polar Coordinates),來消除原本大量的額外記憶體開銷。原本的作法像是在一個「方形網格」上標註數據點,但由於數據點的分布範圍會不斷變化,模型會需要進行大量的計算和儲存;但是在轉換為極座標後,數據點只會剩下「半徑」與「角度」,而這些角度都是已知且可預測的,因此便能夠捨棄掉大量額外的記憶體開銷。

QJL,則是一種透過僅僅1位元(Bit)這個最小單位的運算資源,去對極座標量化過程中可能發生的極少量殘留誤差進行校正的機制。由於這種表示法足夠簡單,不需要儲存額外的資訊,因此能夠達到大幅提高記憶體使用效率、又能夠保持零準確度損失的結果。

在這雙重技術的結合之下,TurboQuant在測試 AI 模型是否能在大量文本中找到特定、微小資訊的長文本基準測試「大海撈針(Needle in the haystack)」當中得到了完美的結果,甚至記憶體的占用空間也節省了六倍。

這個技術對市場有什麼影響?

有消息指出,TurboQuant 震撼業界,主因該演算法採「量化壓縮」,讓原本只有頂級電腦才能跑的 AI,進化成手機或一般筆電都能跑出推論成果。這就像原本影片都輸出 4K 等級,現在換成 HD 高畫質輸出即可,如此一來 LLM 所需空間少了75%,運作速度卻快了兩、三倍,對記憶體、GPU 的負擔都相對減輕。且因為TurboQuant有效挪出記憶空間,AI可以「記住」更長的上下對話內容而不容易出錯。

記憶體和儲存裝置製造商先前因零組件短缺,能大幅調漲價格。如今,有投資人可能認為 AI 指標企業未來不再需要這麼多記憶體,削弱供應商強大的定價權。

美國記憶體龍頭美光(Micron)。 路透
美國記憶體龍頭美光(Micron)。 路透

美股記憶體龍頭美光(Micron)股價原已連日下跌,在 TurboQuant 推出後更是26、27日兩日下跌,晟碟(SanDisk)也同步大跌;儲存裝置大廠希捷(Seagate)和威騰電子(Western Digital)同樣也被影響。

韓國記憶體晶片大廠SK海力士(SK Hynix)。 路透
韓國記憶體晶片大廠SK海力士(SK Hynix)。 路透

南韓記憶體雙雄三星(Samsung)、SK海力士(SK Hynix)26日分別大跌4.7%、逾6%;在日本掛牌的鎧俠(Kioxia)也下挫超過5.7%。

南亞科技。 聯合報系資料照
南亞科技。 聯合報系資料照

南亞科(2408)雖然因為引進四大國際大廠認購私募普通股,26日開盤跳空漲停,卻也因為受到這波衝擊而在不久後便打開,收盤甚至轉為小跌。群聯(8299)、華邦電(2344)、旺宏(2337)、威剛(3260)、十銓(4967)、晶豪科(3006)等記憶體族群也都收黑,27日多數仍持續下挫。

什麼是傑文斯悖論?

但也有人認為,因為當技術進步降低了資源成本時,反而會因為資源變得更容易取得,進而推升了需求。Google 表示,TurboQuant 能將 AI 模型的鍵值快取記憶體用量減少至少六倍,並將速度提升高達八倍,這實質上降低了「推論」(即執行 AI 模型)的成本。

有分析師拿傑文斯悖論(Jevons Paradox)解釋,這將帶動 AI 模型的普及,進而導致對記憶體更多的需求。

一度造成全球市場轟動的「黑天鵝」,中國大陸生成式AI模型DeepSeek。 路透
一度造成全球市場轟動的「黑天鵝」,中國大陸生成式AI模型DeepSeek。 路透

至於什麼是傑文斯悖論?這個概念由十九世紀英國經濟學家傑文斯提出,他觀察到在蒸汽機發明後,燃煤的使用明明更有效率,相同產出所需的投入變少了;但是技術進步後,總需求、用量卻是不減反增。先前在DeepSeek推出時,分析師也曾表示過同樣的看法,AI 模型訓練成本的降低最終只會使得晶片的需求量提高。

記憶體後市會是什麼走向?

國內記憶體業者直言,此類技術不僅不會衝擊記憶體業,反而有助擴大整體市場規模,相關疑慮多屬市場誤讀,甚至批評「部分分析師與媒體不懂技術,過度渲染」。

不具名的本土指標記憶體相關廠商高層分析,TurboQuant 主要針對AI推理過程中的「鍵值快取」(KV Cache)進行壓縮,並未觸及模型訓練與權重儲存所需的高頻寬記憶體(HBM)與長期存儲需求,對整體記憶體產業結構影響有限;反觀其降低運算成本的特性,將有助AI應用加速普及,帶動更多終端裝置與邊緣運算需求。

也有分析師指出,TurboQuant 問世將大幅降低單次查詢的服務成本,讓部分原本只能在雲端集群上運行的模型遷移至本地,有效降低AI規模化部署的門檻,這可能反而能進一步提振整體需求。

摩根大通(小摩)交易團隊便認為,近期的記憶體使用量不受威脅,TurboQuant 短期對運算與記憶體的影響為中性,卻是長多,但可能讓投資人獲利了結。摩根士丹利證券(大摩)也認為,TurboQuant 有利超大型運端業者和大型語言模型(LLM),因為能提高投資報酬率。

(資料來源:記者彭慧明、李孟珊、秦鈺翔,編譯劉忠勇;Google官方文件

上一篇
整理包/4月連假怎麼玩?兒童節不想出國也能玩得好!活動懶人包一次看
下一篇
整理包/外籍幫傭申請條件放寬 如何申請?會帶來什麼影響?一文看懂

相關

熱門

看更多

看更多

留言

前往頁面