[新聞] MU、WDC、SNDK下跌:為何Google的TurboQua

作者baddaddy (壞爸爸)

看板Stock

標題[新聞] MU、WDC、SNDK下跌:為何Google的TurboQua

時間Wed Mar 25 22:39:30 2026

原文標題： MU、WDC、SNDK下跌:為何Google的TurboQuant令記憶體股震盪來源： https://myppt.cc/FlidrY 內文： 2026.03.25 Investing.com - 儘管科技板塊整體表現強勁,記憶體股週三仍然下跌。在Google推出Tur boQuant這項可能降低AI系統記憶體需求的新壓縮演算法後,相關股價應聲下挫。 SanDisk Corporation(NASDAQ:SNDK)下跌5.7%,美光科技(NASDAQ:MU)下跌3%,西部數據(NA SDAQ:WDC)下跌4.7%,希捷科技(NASDAQ:STX)下跌4%。這些跌幅出現在納斯達克100指數上漲之際。 Google推出了TurboQuant,這是一項旨在降低大型語言模型和向量搜尋引擎記憶體消耗的壓縮技術。該演算法解決了鍵值快取的瓶頸問題,鍵值快取用於儲存AI系統中經常存取的資訊。根據Google的公告,TurboQuant可以將鍵值快取壓縮至3位元,無需訓練或微調,同時保持模型準確性。在包括Gemma和Mistral在內的開源模型上進行的測試顯示,該技術實現了鍵值記憶體大小6倍的縮減。該演算法還在H100 GPU加速器上展現了比未量化鍵值高達8倍的效能提升。該技術透過兩個步驟運作:應用PolarQuant方法透過旋轉資料向量實現高品質壓縮,以及使用量化Johnson-Lindenstrauss演算法消除殘餘誤差。Google表示,傳統的向量量化方法在記憶體開銷中每個數字增加1至2個額外位元,部分抵消了壓縮優勢。 TurboQuant將在ICLR 2026上發表,而PolarQuant計劃在AISTATS 2026上發表。Google在包括LongBench、Needle In A Haystack、ZeroSCROLLS、RULER和L-Eval在內的基準測試中測試了這些演算法。該技術的應用範圍超越了AI模型,還包括為大規模搜尋引擎提供動力的向量搜尋功能。記憶體股今年迄今已大幅上漲,使其容易受到可能降低需求的發展影響。心得：雖然我不是專家但讓記憶體使用更有效率聽起來很不錯吧目前Google的測試成果斐然未來真的能這樣發展想必對邊緣AI有很大的助力至於會不會對記憶體需求下降倒也未必 Google研究底加窩看不懂 https://myppt.cc/UtVx89 ----- Sent from JPTT on my Google Pixel 7 Pro. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.153.90 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1774449572.A.5B4.html

推 OGoTTe : 抓到兇手了 03/25 22:40

推 chocoball : 以後每年都推出新演算法穩03/25 22:42

推 sdbb : 樓下waitrop03/25 22:42

推 turndown4wat: GOOG也一起下去了 03/25 22:42

→ tomdavis : 照抄deepseek的說法唉呦省資源硬體股要完蛋了03/25 22:42

→ sdbb : 樓下LDPC?03/25 22:43

噓 Marshalkobe2: 自己也下去厲害03/25 22:43

→ c928 : 谷狗，我活不了你們也給我下來03/25 22:43

推 TureCooler : SpaceX都要IPO了，台股上呀 03/25 22:44

推 handfoxx : GOOG 怎麼也下去了03/25 22:44

噓 heko77923 : 放屁 google自己也跌慘了03/25 22:46

推 alonzohorse : 看來只剩六分之一價格，牙套50，華崩20 03/25 22:46

→ heko77923 : 要是這麼神早就噴了03/25 22:46

推 Evenpan : 不是因為NVIDIA KVTC嗎?03/25 22:46

推 KS571 : 哭啊阿怎麼自己跟著下去03/25 22:47

推 chachabo : 狗狗式自殺=.=03/25 22:48

※ 編輯: baddaddy (36.231.153.90 臺灣), 03/25/2026 22:48:35

推 itwt : 亂講，是真的Google這樣要噴啊，一起下去耶 03/25 22:48

噓 matlab1106 : 這波能源危機會讓這些高耗能的被處理吧 03/25 22:51

→ bnn : 公開演算法的話不會噴啊別人看論文照抄 03/25 22:52

推 az0102 : 台積電利多 03/25 22:52

推 grayeric : 記憶體 is over 03/25 22:55

推 DWR : 只會用更多的參數模型越來越大而已記憶體實際上 03/25 22:56

→ DWR : 不會減少的 03/25 22:56

推 harpuia : 爽啦，狗狗不爽自己下去，也把其他人一起拉下去 03/25 23:00

推 PerfectWorld: 笑死論文都公開了要噴什麼？一堆沒念過研究所是不 03/25 23:01

→ PerfectWorld: 是？ 03/25 23:01

噓 EDFR : OVERBOOKING 03/25 23:02

→ strife : 那用原本的大小不就效能更高 sorry 我有美光干 03/25 23:02

推 dannpptt : 估狗傷敵一千自損八百 03/25 23:02

推 bs167512 : 一場AI大戲，繼續看它們怎麼演 03/25 23:03

推 dennis50253 : 救救南亞科 03/25 23:04

→ receivable : 我以為是SORA停止的消息，存圖/影音比文字存儲需求 03/25 23:04

→ receivable : 大多了 03/25 23:04

推 HarukaLM : google也跟著下去... 03/25 23:04

→ baka1412 : https://i.imgur.com/CenWqyJ.jpeg 03/25 23:06

推 Barefoot24 : GoogleAI吹那麼大，結果Gemini連個Excel都讀不出來 03/25 23:07

→ Barefoot24 : ，白癡 03/25 23:07

推 bcismylove : 都2026了EXCEL PAY還沒普及 03/25 23:09

推 spencer222 : 不可能是這個啦這篇論文2月5號就發了主要目的是要 03/25 23:11

→ spencer222 : 用不足的緩存跑大模型壓縮資料是要經過encode/deco 03/25 23:11

→ spencer222 : de的會影響運算速度 03/25 23:11

推 bs167512 : 真正會賺錢的東西沒人會告訴你，消息滿天飛的東西就 03/25 23:13

→ bs167512 : 是缺錢，叫大家趕快來投資 03/25 23:13

推 bala045 : 壓縮不就代表可以佈建更多那跟需求下降有什麼關係 03/25 23:14

推 pornpig32 : KVTC 是 NVIDIA 解決 AI 「記憶力太貴」問題的關鍵 03/25 23:16

→ pornpig32 : 技術 03/25 23:16

推 letyouselfgo: 估狗不是有自研AI晶片嗎怎麼還在用H100 (諷刺 03/25 23:16

→ rooo2012 : 下跌不是因為中東金主的數據中心無法蓋暫時需求沒 03/25 23:18

→ rooo2012 : 這麼多？ 03/25 23:18

推 yyyyaaaa44 : 明天空南亞科會贏嗎 03/25 23:19

推 Samurai : 這像是去年說deepseek算法進步，AI天花板已到一樣 03/25 23:20

→ Samurai : 蠢 03/25 23:20

推 pornpig32 : Google 做的實驗時測試硬體是 NVIDIA H100 GPU 03/25 23:22

→ gladopo : 那為什麼NV漲，老黃又可以COSTDOWN了嗎 03/25 23:25

推 cosmo7897 : 谷歌這次的突破好像是因為KV cache壓縮推理速度變 03/25 23:25

→ cosmo7897 : 快且記憶體需求降低 03/25 23:25

推 eno03 : 記憶卡娃逃難潮開始了 03/25 23:25

→ ksuenjjr : Google自己也在跌 03/25 23:27

→ bndan : 跟去年那個DEEPSEEK不同就先不說從已完成的水桶撈 03/25 23:27

推 NEX4036 : 順勢壓下去收籌碼 03/25 23:28

推 holysong : 下跌找理由，照歷史cpu cache跟主機板的記憶體只會 03/25 23:28

→ holysong : 越來越多 03/25 23:28

→ bndan : 答案這件事..就節省效能本身是讓整體能擴大使用能量 03/25 23:28

→ bndan : 所以當然不會改變NV 台G 等賣鏟子一條龍的情況 03/25 23:29

→ OxFFFFFFFF : 這什麼野雞算法 03/25 23:29

→ holysong : 然後下一代的模型又變更大了 03/25 23:29

→ bndan : 但記憶體不同本來假設 AI大基建瓶頸是記憶體好了 03/25 23:29

噓 NEX4036 : 現在不就V了 03/25 23:30

→ bndan : 現在可以用1/6的記憶體量能建AI基建這時瓶頸應該要 03/25 23:30

→ OxFFFFFFFF : 不管算法有多牛只要使用率越高就會越缺貨 03/25 23:30

推 jean0914 : 好好笑的鬼故事 03/25 23:31

→ bndan : 變成缺GPU了..應該說記憶體終究是配件主要的還是看 03/25 23:31

推 holysong : 我的感覺是只要1/6的cache，一樣的效率 03/25 23:32

→ bndan : GPU搭配...更不用說如果本來AI基建瓶頸就是GPU的情 03/25 23:32

→ OxFFFFFFFF : 會跌的原因就是前陣子股票漲太多會跌而已不用找什 03/25 23:32

→ OxFFFFFFFF : 麼爛理由 03/25 23:32

推 robinlee : 省愈多用更多啊，殺這個超怪 03/25 23:32

→ bndan : 況那再縮成1/6 記憶體跟本會變成供>>需了..除非GPU 03/25 23:33

推 otsuka123 : ds是蒸餾啊所以回來但谷狗大神就難講了 03/25 23:34

→ bndan : 製造速度"提升"的比記憶體快..但問題是GPU的生產難 03/25 23:34

推 holysong : 雲供應商一樣還是主機板的記憶體插滿 03/25 23:34

→ bndan : 度遠大於記憶體而且像這類頂端IC生產還是台G獨霸的 03/25 23:34

推 xm3u4vmp6 : 欸原本5090 32g算法六倍等效192g 很爽欸 03/25 23:35

→ bndan : 情況..記憶體再屌也是好幾家能產..在這情況記憶體怎 03/25 23:35

→ bndan : 可能擴產比GPU慢 = = 03/25 23:35

→ xm3u4vmp6 : DDR 記憶體會更賣爆因為一堆人想自組 03/25 23:35

推 waiting101 : 長期還是有需求…他們只是省不代表不繼續買ㄚㄅ 03/25 23:38

推 BlairWang : goog 把mu 搞下去後自已也下去了 03/25 23:40

噓 ice80712 : 欸不是谷歌自己先破底 03/25 23:40

→ bndan : 長期有需求 == 用PC來假設好了假設CPU生產量永遠是 03/25 23:41

→ bndan : 瓶頸那其他配件例如記憶體主機版機殼等等需求 03/25 23:41

→ bndan : 上限其實就被鎖住了..不管當地多缺PC拿去玩大資訊基 03/25 23:42

推 ppuuppu : qq狗狗霸脫 03/25 23:42

→ bndan : 建需求上限就是看CPU生產量阿= = 又不會忽然變成一 03/25 23:43

→ bndan : 台電腦1個CPU然後裝4張主機版+4個機殼之類的 =_= 03/25 23:43

推 wei683 : 演算法目前有辦法快到擋得了全世界的需求嗎 03/25 23:44

推 lnonai : 上下文需求幾乎是無窮盡的，只要還有KV 快取需求H 03/25 23:46

→ lnonai : BM就是多 03/25 23:46

→ lnonai : 這也會加速邊緣AI的發展 03/25 23:46

→ OxFFFFFFFF : 算力是越多越好跟PC還有手機需求是不一樣的 03/25 23:47

→ bndan : 算力當然是效率越高越好越多越好能做的事越堆越高 03/25 23:48

→ bndan : 但記憶體不是他是附件終究會有效能提升的邊際效應 03/25 23:50

→ bndan : 遞減而這個演算法更是這邊際再縮小6倍 03/25 23:50

推 bs167512 : 別再想記憶體的事了，油都沒了，還再記憶體 03/25 23:54

→ BoyceChu : 等於同樣規格下，可以做更多事 03/25 23:56

推 afacebook : 壓縮不是一直都有在做嗎 03/25 23:57

推 KY1998 : 看股價說故事，這跟洩金河有啥不同?? 03/26 00:00

→ OxFFFFFFFF : 記憶體是AI瓶頸之一，非附加品，影響效能關鍵演算 03/26 00:01

→ OxFFFFFFFF : 法可優化但需求同步成長，難以降低記憶但的需求 03/26 00:01

→ OxFFFFFFFF : 記憶體的需求 03/26 00:02

→ amd3dnow : cpu/gpu 就是要搭配記憶體...需求怎麼可能減少 03/26 00:02

推 bloodzzero : Zip問世有降低硬體需求？ 03/26 00:03

噓 Tatsuya72 : 只想炒作缺貨就下去吧zzz 03/26 00:07

推 k128345 : 別說需求降低，但需求放緩呢？然後對於低階記憶體的 03/26 00:08

→ k128345 : 需求是不是會放緩更多，想確認這點。 03/26 00:08

→ ezorttc : 塞滿好幾T 的片子能壓縮嗎？ 03/26 00:11

→ ezorttc : Google 還要解壓縮，效能不就落後一節 03/26 00:11

→ allenbret : 雜訊 03/26 00:12

推 HiuAnOP : 99狗狗99我！ 03/26 00:13

→ mtmmy : 開發者大概會覺得可以讀更多上下文太棒了 03/26 00:20

→ mtmmy : 而不是減少用量 03/26 00:20

噓 jay3u7218 : 就漲多了....扯那麼多幹嘛？ 03/26 00:23

→ liangnet : 節省記憶體，多出來的記憶體繼續壓榨做更多事。誰 03/26 00:26

→ liangnet : 會嫌記憶體太多的。 03/26 00:26

→ liangnet : 在軟體開發裡，有時會使用更多記憶體來換取最好效 03/26 00:33

→ liangnet : 能。有時會用壓縮犧牲效能換取節省記憶體。 03/26 00:33

→ amd3dnow : ai處理流程最佳化跟需求降低是兩回事.... 03/26 00:33

推 goodbad : 咕嚕咕嚕 03/26 00:33

→ liangnet : 無論如哪種，記憶體都是多多益善。 03/26 00:33

→ k798976869 : 學yo叔繞過記憶體就能跑AI 03/26 00:38

→ re365339 : 造福終端而已，基建端只會買更多 03/26 00:54

推 jumilin927 : 記憶體崩！ 03/26 00:56

推 j0987 : 推 03/26 01:00

推 Jaspercool : 不是阿狗哥你跟著跌欸 03/26 01:01

推 jason61105 : 相片至今儲存效能變好所需容量還是暴增 03/26 01:11

推 joygo : 現在有ai之後什麼都不要說的太死 03/26 01:16

推 ansinlee : 這個就像改車子的電腦讓馬力變大，但是對硬體的規 03/26 01:35

→ ansinlee : 格要求並不會因此減少，只是讓買不到或買不起最新 03/26 01:35

→ ansinlee : 的ai伺服器也能有不錯的馬力輸出 03/26 01:35

→ OxFFFFFFFF : 大家都有AI了去花個兩分鐘討論一下就知道到底記憶 03/26 01:40

→ OxFFFFFFFF : 體需求會變多還變少 03/26 01:40

推 randy890924 : Jevons Paradox了解一下 03/26 01:44

推 sunrise1748 : 結果谷歌自己也跌破均線 03/26 01:51

→ g9911761 : 這條演算法價值多少 03/26 01:53

→ lise1017 : 微軟最搞笑當年嗆谷哥說什麼要搶瀏覽器廣告市場 03/26 01:55

推 wettland5566: 就只是新的演算法可以把原來記憶體減低為6分之一的 03/26 01:55

→ wettland5566: 用量而已，媽的沒有寫過程式啊，因為AI中要用到大 03/26 01:55

→ wettland5566: 量的記憶體，節省記憶體是必然的，這根本就不影響 03/26 01:55

→ wettland5566: 記憶體股好不好 03/26 01:55

→ lise1017 : 結果自己的商業套裝軟體反而被抄家 03/26 01:55

推 wettland5566: 怎麼會有人把它解讀成因為這項技術出來記憶體的採 03/26 02:01

→ wettland5566: 購量就變六分之一好像不是這樣吧 03/26 02:01

→ weiman0702 : 省下來的資源就會被更大的模型補充上== 03/26 02:04

→ peterors : 明天能亮幾個燈讓我撿嗎~~ 03/26 02:15

推 sim3000 : 跌下來就是撿情緒反應 03/26 02:23

→ budaixi : 不是海力士ADR嗎 03/26 02:30

推 Belial1991 : gemini錯誤還是挺多的優點就免費 03/26 02:35

推 mutsutakato : 我的媽呀一堆文組人家是說鍵值記憶體縮為6分之一 03/26 03:25

→ mutsutakato : 不是整體記憶體縮為1/6 搞笑嗎? 03/26 03:25

→ mutsutakato : 這只是讓搜尋速度更快一點而已啦 03/26 03:26

→ mutsutakato : 鍵值快取就只佔了整體記億體的一小塊而已 03/26 03:35

→ mutsutakato : 怎麼會把他想成以後牙科出貨量變1/6? 笑死我也 03/26 03:36

推 ravelson : 之後上漲，就會發新聞說此技術不影響記憶體需求， 03/26 06:21

→ ravelson : 詐騙真的是永恆不死的產業，總有人喜歡被騙還幫數 03/26 06:21

→ ravelson : 錢。 03/26 06:21

推 Tenging : 那就更需要了不是嗎 03/26 07:06

→ Tenging : 1+1>2 03/26 07:06

推 richaad : https://i.mopix.cc/i2Ct2Z.jpg 03/26 07:13

→ richaad : 一年前就發表的技術，根本找理由殺多而已 03/26 07:13

→ fallinlove15: 別亂找理由耶不就開財報後被玩 03/26 07:22

→ dslite : 不就是pooling？ 03/26 07:55

→ angusyu : Google自己都在下跌是三小 03/26 08:30

噓 yiyi0916789 : 不是，google自己跟著跌是哪招 03/26 09:55

推 z83420123 : 就故意找理由啊 XD 03/26 10:10

推 joy2105feh : 放個產品在家股價也下去 03/26 12:16

→ fmp1234 : 重回以前想方設法降低記憶體使用量 03/26 13:26

推 eknbz : 這當利空我還真不信 03/26 13:52

→ tw19930419 : 唬爛演算法永遠都在更新有人因為這個跌爛喔 03/26 14:57

推 cfesun : 嚇唬人用的，每次大跌都說原因，然後又漲回來 03/26 20:41

💰 股票 Stock 版：熱門文章

💰 股票 Stock 版：更多文章