推 as3366700 : 看到關鍵字空了 下面可以開咬哩 06/26 15:17
噓 ok020402 : 所以看多還看空 直接說啦 06/26 15:18
記憶卡哇還能看多半年一年以上,
其中,
DRAM 卡哇會比HBM 卡哇漲更多漲更快,
因為補漲, 也因為量會比HBM 多很多
→ onit : 這不就上次老黃演講的觀點 06/26 15:19
推 flycarb : 確實,老黃也不是空穴來風的 06/26 15:19
推 devilsabre : 推 06/26 15:19
推 hen5566 : 重點, 空! 06/26 15:20
推 fhjqwefs : 2樓在拽啥 人家看多看空為啥一定要跟你講 笑死人 06/26 15:20
推 ms0443001 : 台積電相對股價也沒這麼爆衝 這也是原因 06/26 15:20
→ ms0443001 : 代工費都是逐步調漲 不會像記憶卡吃相難看 06/26 15:20
推 ok020402 : 對不起我太兇 補推 06/26 15:20
→ edison106 : CXL最強者是ALAB吧 06/26 15:21
推 herculus6502: 萬法皆空 06/26 15:21
推 devilsabre : 凡事太盡 緣份勢必早盡 06/26 15:23
→ devilsabre : 缺貨就狂漲價 做不久的 06/26 15:23
→ edison106 : 以前記憶體廠也是被搞很慘 這波謹慎擴廠也是剛好而 06/26 15:24
→ edison106 : 已吧 06/26 15:24
→ HiuAnOP : 推這篇 長期給60%毛利 EPS都會崩給你看 06/26 15:25
→ HiuAnOP : 86%毛利是什麼概念自己算看看… 06/26 15:26
因為有市場破壞者,
兩個一買一賣配合喊價,
你知道我說的是哪家公司,
你恨的牙癢癢的, 但是沒辦法,
重點是華爾街跟新聞媒體喜歡這樣造神惡搞
→ luche : 有跟小叮噹拿毛利率調整器 輸入適合的毛利率 機台 06/26 15:26
→ luche : 能告訴你對應的產品價格 06/26 15:26
※ 編輯: waitrop (76.103.225.6 美國), 06/26/2026 15:31:13
※ 編輯: waitrop (76.103.225.6 美國), 06/26/2026 15:35:01
推 wed1979 : AI就跟互聯網一樣會爆破,但你不知道在什麼時候,記 06/26 15:35
→ wed1979 : 憶體就跟當時的網路頻寬一樣,很缺但非必要 06/26 15:35
→ Heedictator : 善良的雞 最後會得到福報 06/26 15:36
→ edison106 : 記憶體非必要嗎?記憶體頻寬太低的話你的agent速度 06/26 15:37
→ edison106 : 變慢 甚至聊天幾分鐘才吐出字來 你等得了嗎?你覺 06/26 15:37
→ edison106 : 得非必要? 06/26 15:37
→ edison106 : 以後進展到機器人自駕車什麼的,記憶體頻寬不夠你 06/26 15:39
→ edison106 : 反應速度變慢早就出事了這樣記憶體還非必要嗎? 06/26 15:39
推 darkangel119: MRVL 的 team 幾乎被分拆整合到其他BU了吧 06/26 15:40
→ lokoo : 之前記憶體廠倒的時候也沒人同情 06/26 15:41
推 ben121196 : 囚徒困境是這樣的 巨頭說好一起不capex那記憶體價格 06/26 15:41
→ ben121196 : 自然會降 但是只要大家都怕有人砸錢砸出東西來屌打 06/26 15:41
→ ben121196 : 自己 不得不capex 那就是半導體繼續噴 06/26 15:41
這個囚徒困境就是有人刻意砸錢砸出來的呀!
過去這幾年,
就是有人在扮演價格破壞者,
還一直拿效能速度來壓迫所有其他的競爭者,
才搞到現在這個情況, 不是嗎
推 Samurai : 還在說記憶體非必要的真的有在用AI嗎 06/26 15:42
記憶體是必要的,
但是記憶體頻寬不是那麼必要,
用當年網路頻寬來比喻很好呀!
有沒有網路, 有沒有記憶體, 就是能不能的問題,
但是頻寬不是能不能的問題,
是快跟慢的問題,
這又跟耐心還有使用方式有關,
我從二十幾年前在學校用很小的頻寬開始,
就是用掛機的方式在處理事情,
同樣的,
我的AI API 也是用掛機的方式,
所以快跟慢 對我影響不大,
但是有些人就很在乎速度,
所以這跟人有關
當然,
還有跟信仰有關,
有信仰的可以慢慢等,
沒信仰的都是拿放大鏡在算AI反應速度
推 yeay : open醬亂搞,害得谷歌倒楣,然後大家現在不想被記憶 06/26 15:46
→ yeay : 體綁架,也壓寶MRVL/ALAB。這樣理解對嗎? 06/26 15:46
→ yeay : 不過這波AI的FOMO風潮還真的是從Chatgpt帶起來。 06/26 15:46
這是你說的, 不是我說的
推 cannedtuna : 還不能陪玩家即時玩遊戲 那就還早 06/26 15:46
※ 編輯: waitrop (76.103.225.6 美國), 06/26/2026 15:57:41
推 Zending : 這篇資訊量很多很肥美,成也韓,敗也韓,終有發展 06/26 15:56
推 peterliam : a 06/26 15:56
推 wsxza : 終端消費產品貴鬆鬆 06/26 15:58
※ 編輯: waitrop (76.103.225.6 美國), 06/26/2026 16:01:07
補上原本想說的部分,
不能免俗,
先上AI 示意圖,
Flux:
https://imgur.com/ZlLaLzW
https://imgur.com/zMgxAD4
Zimage:
https://imgur.com/ucteLUG
https://imgur.com/io0jBaR
買了gb10/gx10 當本地煉丹爐,
我用本地端AI 生成 開箱 AI 示意圖,
統一記憶體是128GB,
速度還可以, 跟CSP的AI API差不多,
反正都在可接受的範圍
所以回到LLM inference,
真的真的不需要HBM,
其實 CXL + DRAM + Compression 絕對夠用,
效能絕對比你想像得好,
真正的效能瓶頸不會在HBM,
就算差個幾秒, 真的是還好
我用現在LLM API/Token的設計圖來解釋,
我請Gemini 畫一張設計圖:
https://imgur.com/GmBmGwH
你可以想成CSP 伺服器端就是一大堆類似 gb10 這種機器,
每個客戶端的 API request 會發送到其中一台server處理,
所以如果gb10 速度夠,
那麼沒有HBM, 單純用DRAM+CXL, 絕對就夠用,
inference 跟 training 有很大很大的不同點,
training 是一個大模型大記憶體跑訓練幾個月甚至是一年兩年,
但是inference 就是一個小server for 一個client request,
一秒鐘到一分鐘就結束了,
HBM真的沒差那麼多
※ 編輯: waitrop (76.103.225.6 美國), 06/26/2026 16:19:12
推 marke18 : QQ 06/26 16:05
推 ALENDA : 推 06/26 16:12
推 afacebook : 頻寬還是需要的,如果頻寬不夠,資料傳不夠快,gpu 06/26 16:13
→ afacebook : 大量時間都在發呆 06/26 16:13
推 lightaurora : 感謝分享 06/26 16:14
推 afacebook : 頻寬不夠也不是只是慢的問題,有可能主機版整個設 06/26 16:16
→ afacebook : 計都會出問題 06/26 16:16
→ ert0700 : 其實就只是目前所謂的ai還太廢而已… 06/26 16:17
推 w60904max : 現在也有應用場景是睡前掛著 給agent跑一整晚 反正 06/26 16:23
→ w60904max : 早上產出是對的就好 06/26 16:23
推 DONmilK : Inference 都可以接受非HBM的速度了,那training 06/26 16:24
→ DONmilK : 是不是更適合用CXL方案來降低成本呢 06/26 16:24
目前training 沒有任何一間模型廠跟CSP敢用CXL方案,
因為training 一跑就是幾個月到一年,
頻寬速度的問題會被放大,
inference 每個request 一秒到一分鐘,
頻寬速度的問題被無限縮小
當然,
另一個原因是inference 可以省成本,
客戶可以接受也感覺不出差別,
便宜治百病
但是training 你比對手晚發布,
效能報告差一些,
股價會崩盤,
甚至華爾街禿鷹都在等著要放空割肉
推 ck326 : 聽說某家考慮推遲 ipo 繼續蓋牌,是不是有什麼貓膩 06/26 16:27
→ ck326 : ?嘻嘻 06/26 16:27
推 ssarc : 至少現在這一波台積電沒有漲價太多,反而一直建廠 06/26 16:30
→ ssarc : 滿足需求 06/26 16:30
※ 編輯: waitrop (76.103.225.6 美國), 06/26/2026 16:36:22
→ AndyMAX : 台積也是差一點要被對岸跟三星搞死啊 台積有報復性 06/26 16:37
→ AndyMAX : 漲價嗎 沒有啊 06/26 16:37
推 A22813079 : xconn 06/26 16:37
推 macrohard : 99MVLL, 成本80,沒買幾週,現在只剩48 QQ 06/26 16:46
推 strlen : 說一句 你業內有專業 確實 但你的意識型態太重 會 06/26 17:13
→ strlen : 影響投資績效der 商場上講什麼道德?唉 算了 06/26 17:13
→ strlen : 看到自己想想 覺得我放屁也沒差 我沒有意識形態沒有 06/26 17:13
→ strlen : 節操不站隊 但我覺得這樣投資比較不會有怨氣啦 哈 06/26 17:14
→ strlen : 美國混幾十年了 誰當家誰大聲誰收智商稅 趁火打劫 06/26 17:15
→ strlen : 這不是天經地義 06/26 17:15