🔥 PTT.BEST 批踢踢爆文 💬 八卦 Gossiping 😊 希洽 C_Chat 💰 股票 Stock 🏠 房屋 home-sale 🏀 美國職籃 NBA ⚾ 棒球 Baseball 👛 省錢 Lifeismoney 🚗 汽車 car 😡 政黑 HatePolitics 💻 電蝦 PC_Shopping 🥰 韓星 KoreaStar ✨ 英雄聯盟 LoL 🍿 電影 movie 🪖 軍事 Military 📡 通訊 MobileComm 🏀 台籃 basketballTW 🍼 寶媽 BabyMother 🇯🇵 日旅 Japan_Travel 🏭 科技 Tech_Job 👉 男女 Boy-Girl 👉 真香 CheerGirlsTW 👧 女孩 WomenTalk 👻 媽佛 marvel 💳 卡版 creditcard 👉 NS NSwitch 👉 PS5 PlayStation 👉 大氣 TY_Research 👉 婚姻 marriage 👉 台南 Tainan 👉 台中 TaichungBun 👉 Steam Steam 👉 高雄 Kaohsiung 👉 羽球 Badminton 👉 超商 CVS 👉 米哈遊 miHoYo 👉 iOS 👉 兄弟 Elephants 👉 日劇 Japandrama 👉 玄幻 CFantasy 👉 ES e-shopping 👉 WOW 👉 遊戲交易 Gamesale 👉 4X BaseballXXXX 👉 Lakers 👉 韓劇 KoreaDrama 👉 汽車買賣 CarShop 👉 機車 biker 👉 新竹 Hsinchu 👉 美保 BeautySalon 👉 串流 OTT 👉 歐美影集 EAseries 👉 手機交易 mobilesales 👉 健身 MuscleBeach 👉 MacShop 👉 Lions 👉 FGO FATE_GO 👉 中劇 China-Drama 👉 數位貨幣 DigiCurrency 👉 暗黑 DIABLO 👉 實習教師 studyteacher 👉 航空 Aviation 👉 藝文票券轉售 Drama-Ticket 👉 韓綜 KR_Entertain 👉 美妝 MakeUp 👉 速食 fastfood 👉 手錶 watch 👉 體適能 FITNESS 👉 攝影 DSLR 👉 Headphone 👉 嘻哈 Hip-Hop 👉 轉珠 PuzzleDragon 👉 美食 Food 👉 蔚藍 BlueArchive 👉 數位相機交易 DC_SALE 👉 筆電蝦 nb-shopping 👉 軟工 Soft_Job 👉 汪踢 Wanted 👉 台綜 TW_Entertain 👉 坂道閒聊 SakaTalk 👉 貓咪 cat 👉 日GO BabyProducts 👉 TypeMoon 👉 MLB 👉 職場 Salary 👉 臺劇 TaiwanDrama 👉 海賊王 ONE_PIECE 👉 PMGO PokemonGO 👉 國營 Gov_owned 👉 碧航 AzurLane 👉 家電 E-appliance 👉 布蘭德 Brand 👉 DMMG DMM_GAMES 👉 贈送 give 👉 神魔 ToS 👉 銀行服務板 Bank_Service 👉 原創 YuanChuang 👉 期權 Option 👉 重機 SuperBike
老黃這一生中有許多故事 但許多故事都跟抱緊台灣供應鏈有關 第一個故事 當年他還是小公司時候 他每天去San Jose據點定期天天蹲 到最後甚寄郵件信到台灣老張的住處 就是要求一個見面 說服了老張 當時老張為此破格 給了老黃一個長期下訂單的機會 第二個故事就是 當初顯卡大戰 3DFX腦殘吃下OEM STB Systems 3DFX決定自己跳下來做顯卡來搶市場 老黃反手抱團台灣所有顯卡OEM 技嘉 MSI 華碩 後來成功打爆3DFX 第三個故事(傳言 未證實) 2020 晶片大缺貨 台積整個訂單大塞車 老黃想插隊 台積說不行 老黃跑去找老張說 誒 你不讓我下單 我活不下去啊 你這樣子我只能去扶植三星囉 然後台積就讓老黃下單了 你自研晶片 有個瓶頸就是配套的產業鍊 所以Google或高通都喜歡雇用台灣有在台積電 上過班的人 然後作為以後去橋接產業鍊 老黃就是Tim Cook 最擅長玩供應鏈 蘿蔔棒子 在2020-2024玩得太專業 用這個卡蘇媽 甚至都願意付高昂訂單搶台積電產能卡別人 蘋概股思路在NVDA也通 基本上就是Nvidia First 如果不是Nvidia First 就會被大棒揍 參照https://reurl.cc/18lQm9 "Nvidia 还利用了 HGX 板或服务器所需的许多下游组件,例如重定时器、 DSP、光学器件等。拒绝英伟达要求的供应商通常会受到“胡萝卜加大棒”的对待。 兆元宴這些玩意 就是老黃的產業鍊壟斷手法 當初第一代HBM明明是蘇媽找海力士去弄 結果反手老黃照抄 放到P100 (後來搬者機器跑去OpenAI 簽名拍照打卡) 然後找三星HBM大量生產P100 只是三星不長進2020 被海力士HBM超車 於是老黃每天在2023-2024 每天就是PUA三星 用來壓價海力士 https://m.eccn.com/consultation/news/2026031520180380.html https://www.163.com/dy/article/KO0EA9960511B8LM.html 那這個好處是啥 就是順這脈絡 你可以找到很多x5 x10標地 像之前推的 法師(辛耘) 萬潤 海力士 三星 MU 都是這樣 產業鍊好處就是找標地 甚至散熱雙雄都是基於此原則去選股 現在工作太忙 不然同樣思路你可以用token這種上下游關係去找廠商 上游就是一億token俱樂部 或者1T token俱樂部 -> 去看會造就哪些機會(註1) 軟體是誰受益 硬體又是誰 以後agent call tool 進展到agent (cloud) call agent (on-device) 這些受益又是誰 從現在看起來 整個所有IT產業大概這波都會因為這受益 從之前記憶體 ->CPU 甚至網路路由器 交換器 儲存 大概都會要吃這波新的系統運作方式而大量進補 回到自用晶片跟老黃打晶片大戰 得先考慮鈔能力跟供應鏈壟斷性 老黃這個機車人你又不是不知道....... 拿鈔票揍人 老黃最喜歡幹這種事 最合理結局就是共存 垂直新創老黃陣營 大廠混合自研+老黃 以及蘇媽陣營 自研晶片最大的不利點就是 他們沒有辦法槓桿使用開放生態系(Open Source)社群力量 畢竟不是每個玩家都能拿到TPU去開發 基於此思路 我強烈 推薦個股捷安特 以後的時代人類就是電池 人類就是負責踩腳踏車 腳踏車的大量需求馬上就會到了!!!! -- 註1:有些房地產商也就是照這思路去這樣玩 目標資料計算中心旁邊的土地 馬來西牙就是萬國數據 美國加拿大就是黑石集團 這年頭連房地產炒法都可以跟AI一波 結果我照這思路去買鴻海 -_- 公公爛死了 ※ 引述《thinksilver (銀白色的沉思)》之銘言: : 原文標題: 請勿刪減或自創標題,違者4-1處分,此行請刪除 : AI投資7250億卻利空?輝達股價重挫、市場憂自研晶片威脅霸主地位 : 原文連結: 網址超過一行,請用縮網址,連結不能點擊者板規 1-2-2 處分。 : https://reurl.cc/M22qxX : 發布時間: 請勿張貼超過3天新聞 : 2026-05-01 17:10 : 記者署名: : 鉅亨網編譯 莊閔棻 : 原文內容: : 儘管 Meta(META-US) 、Alphabet(GOOGL-US) 、微軟 (MSFT-US) 、亞馬遜 (AMZN-US) 四 : 大超大規模雲端業者合計宣布 2026 年將斥資高達 7,250 億美元投入 AI 基礎建設,理 : 應是 AI 晶片霸主輝達 (NVDA-US) 的重大利多,市場卻給出截然相反的反應。 : 週四(30 日),輝達股價重挫 4.63%,跌破 200 美元關口,單日跌幅接近 10 美元。 : 分析指出,輝達目前在 AI 加速晶片市場握有約九成市占,照理來說這波 AI 投資熱潮應 : 會直接推升其業績表現。然而,市場隱憂,隨著其核心客戶紛紛投入自研晶片 : ,一旦規模化落地,輝達的領先優勢恐將受到動搖。 : 此前, Alphabet 就已表態將把自家開發的 TPU 晶片對外商業化銷售;另一方面,亞馬 : 遜也在最新財報電話會議中,多次強調其自研晶片業務正快速擴張,成長動能強勁。 : Alphabet 宣布,將向外部精選客戶銷售自研 TPU 晶片,允許客戶部署於自有資料中心基 : 礎設施,使 TPU 從過去幾乎完全服務 Google 內部生態,正式跨入商業競爭市場。 : 雖然 TPU 在通用靈活性上普遍被認為不及輝達的解決方案,但針對特定 AI 應用場景, : 其成本效益優勢相當突出。 : 分析認為,一旦全面商業化,TPU 將從輝達 GPU 的潛在競爭者,演變為具有實質威脅的 : 市場對手。 : 值得注意的是,Alphabet 第一季雲端營收年增 63%,達 200.3 億美元,訂單積壓量接近 : 翻倍,逾 4,600 億美元,其中相當部分已由內部 TPU 承接。 : 與此同時,亞馬遜執行長 Andy Jassy 在財報法說會上重點強調自研晶片業務的擴張態勢 : 。 : 根據《彭博》報導,亞馬遜自研 Trainium 晶片的年化營收已突破 200 億美元,年增率 : 達三位數成長。 : Meta 同樣在上調 2026 年資本支出指引至 1,250 億至 1,450 億美元的同時,持續推進 : MTIA 自研晶片項目,顯示科技巨頭在 AI 算力自主化的布局正全面加速。 : 華爾街分歧:輝達面臨顛覆風險還是持續受惠算力爆發? : 對此競爭態勢,華爾街已有分析師發出明確警示。Seaport Research 半導體分析師 Jay : Goldberg 直言:「這有可能從根本上顛覆輝達,我認為這是相當重大的 : 風險。」 : Goldberg 的邏輯基於超大規模雲端業者的體量與資本實力,這些公司既是輝達最大的客 : 戶,也在持續投入資源成為其競爭者。 : 不過,並非所有分析師均認同這一悲觀判斷。Bernstein Research 分析師 Stacy : Rasgon 提出反駁,認為「糾結於誰贏誰輸是錯誤的問題」。 : 他指出,AI 代理的崛起令算力需求呈爆發式增長,當前制約產業的關鍵因素是供給,而 : 非需求。在此背景下,所有具備可信產能的晶片製造商均能實現滿載出貨,輝達亦不例外 : 。 : 目前,輝達手握 952 億美元的供應承諾,合作客戶涵蓋 OpenAI、Anthropic、 : CoreWeave(CRWV-US) 及 Meta 等頭部機構。 : 心得/評論: : 昨天想說NVDA在崩啥 : 原來是"被"開法會了? : 四大CSP廠紛紛表示要自研晶片~ : 華爾街認為直接老黃伺服器可能會賣不好了 : 不過阿,這些TPU大多還是找TSM代工 : 果然最終贏家還是賣產子的! : 各位鏟子股神怎麼看呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 98.37.67.135 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1777692977.A.13B.html
aspirev3 : 難怪老馬也在台灣找半導體的人了嗎 05/02 11:39
firelemon : 寶可夢領先30年 05/02 11:39
uoho : 褲子都脫了,給我看捷安特XD 05/02 11:40
sdbb : 巨大9921,收到,謝謝 05/02 11:40
as6633208 : 倉鼠踩飛輪發電,人類也踩飛輪發電 05/02 11:42
luke0407123 : 收到 歐印電動腳踏車 巨大9921 05/02 11:45
Orenjifurai : 以後人類都乖乖去當電池就好 05/02 11:46
TaiwanSpirit: 那還不再畫一部類似飆速宅男的動畫 提高發電量 05/02 11:47
birdane32 : 要靠腳踏車,那你大UU神教是不是哭喔哭 05/02 11:47
akito555 : 最後一段最有道理 05/02 11:47
HiuAnOP : 本來就是共贏,老黃問題是本益比 05/02 11:48
HiuAnOP : 台灣供應鏈找台灣人很正常,台灣工程師一堆學長學 05/02 11:50
HiuAnOP : 弟,外人怎麼插手 05/02 11:50
HiuAnOP : 而且外語又爛、文化單一,不找台灣人很難搞 05/02 11:50
onekoni : 學長學帝雉 學弟踩飛輪 05/02 11:50
LINPINPARK : 可以,健身器材喬山股買一些,人類跑步機發電! 05/02 11:51
lltools : 台灣大媽趕快出來全部吞下阿 05/02 11:55
tikowm : 美利達表示不服氣 05/02 11:55
ur260 : 腳踏車發電效率太低 焚化爐燒屍體可能比較高 05/02 12:00
mamorui : 公公是渣男 ^ω^ 05/02 12:01
capcombio : ??? 05/02 12:02
breathair : 垂直新創老黃通吃沒毛病,毛病在老黃利潤全吃光了, 05/02 12:05
breathair : 下游吃不飽,跟別人無法競爭 05/02 12:05
breathair : 用CUDA就跟吸毒一樣,好用,貴,戒斷困難。但只要戒 05/02 12:06
breathair : 斷成功的如Anthropic 身體硬朗的狠 05/02 12:06
bin199308 : 地方上的怎麼讓外人插手 好歹別人叫聲黃董 05/02 12:07
Nitricacid : 推捷安特 05/02 12:08
elmer : 胡扯…. 05/02 12:09
Fujima : 99窩der 咖打掐 05/02 12:11
breathair : 而且GG也不笨,最下游到底誰賺錢,就給誰多做些,這 05/02 12:12
breathair : 樣才能長長久久。綁供應鏈只是一時,最後還是要最末 05/02 12:12
breathair : 端賺的到大錢,GG漲價才最有底氣 05/02 12:12
※ 編輯: LDPC (98.37.67.135 美國), 05/02/2026 12:14:46
s1001326 : 99老黃 快死了 05/02 12:14
breathair : 最末端賺不到錢就是泡沫,最終GG也受害。最末端賺大 05/02 12:14
breathair : 錢,就是正向循環的飛輪,GG負責印晶片,最末端負責 05/02 12:14
breathair : 印錢買晶片 05/02 12:14
truelove356 : 當年華為也是這樣練台積電的啊 05/02 12:15
truelove356 : 華為讓台積電更上一層樓 05/02 12:15
truelove356 : 打得蘋果趴在地上喘 05/02 12:16
※ 編輯: LDPC (98.37.67.135 美國), 05/02/2026 12:17:40
neobasara : 外太空放太陽能484屌打人類騎腳踏車,人類還有價值 05/02 12:18
neobasara : 嗎? 05/02 12:18
mystage : NVDA本益比也才40倍,考慮到毛利率跟成長性,目前 05/02 12:19
mystage : 是低估了 05/02 12:19
as6633208 : 老馬的的太陽計畫會毀了人類僅存的電池價值 05/02 12:20
mystage : NVDA終究是有個絕招,就是降毛利率打擊對手,什麼 05/02 12:20
mystage : 時候拿出來用而已 05/02 12:20
hydra7 : 99 NVDA 05/02 12:22
HiuAnOP : NV降毛利自己崩更多,NV是客戶搶生意… 05/02 12:22
orange1204 : 為什麼不是健身房?所有能量轉換都可以發電 05/02 12:22
ejnfu : NVDA FWD PE更是只有24 05/02 12:22
HiuAnOP : 你降價CSP業者發大財,那乾脆不降價就好了 05/02 12:23
HiuAnOP : NV問題是本益比太高,買你鏟子撈金的本益比剩多少? 05/02 12:23
breathair : NV自降毛利的確可以盤活整個NV生態,但這樣NV股價會 05/02 12:24
breathair : 崩 05/02 12:24
bnn : 人踩腳踏車發電也是電機那邊賺錢 不會是腳踏部位漲 05/02 12:24
breathair : 在ASIC還沒大量出來前,降毛利有用,現在就是自殺, 05/02 12:26
breathair : 沒有一家巨頭會因為你自降毛利就放棄自研,以後不就 05/02 12:26
breathair : 被你拿捏?回不去了 05/02 12:26
facio124 : 歐硬巨大 謝謝 05/02 12:27
josephpu : 讓腳踏車再次偉大 05/02 12:30
armorblocks : nv本益高 哈哈哈 05/02 12:32
qsc753 : 最後一段老遊戲rust正在演..踩踏發電 05/02 12:33
armorblocks : 一堆拿2028預估eps在那炒的 說nv 本益比貴 05/02 12:33
ejnfu : nv本益比高??? 05/02 12:34
as6633208 : ceo價值就在這,老黃,這個第一代從白手起家到市值 05/02 12:34
as6633208 : 第一企業的傳奇企業家,老妖魔等級的,會覺得買老黃 05/02 12:34
as6633208 : 跟買毒一樣但又沒辦法斷開只能繼續買,會覺得他很機 05/02 12:34
as6633208 : 車綁定供應鏈,很簡單就是他思考領先你一步提前布局 05/02 12:34
as6633208 : ,當你意識到的時候只能抱怨,我只能說我是信老黃布 05/02 12:34
as6633208 : 局的,馬斯克我也信 05/02 12:34
windblood : 可以 推巨大XD 05/02 12:35
rebel : nv現在是PE低的那群吧 看看intel amd的PE 05/02 12:36
as6633208 : 人家領先你一步提前布局完了,你只能跟在後面,當然 05/02 12:37
as6633208 : 只剩抱怨和組團看能不能扳回來一點的功能,只是搞不 05/02 12:37
as6633208 : 好,老黃連組團都不輸== 05/02 12:37
Jaspercool : 讓巨大腳踏車再次偉大 05/02 12:38
TokyoHard : 第三個虎爛的吧,車用跟老黃的有點距離 05/02 12:39
的確 車用晶片跟高階不太對 拿掉車用字眼 不過2020晶片大缺貨時 有這部分討論串 https://reurl.cc/zQOy9p "Rumors say they tried to force TSMC into a deal. TSMC already was at full capacity though Isn't the rumour that they went to TSMC and "balked" at the price - dangling how much cheaper Samsung would offer their fab capacity, demanded a discount and were told to go whistle since TSMC already has enough customers to run their foundries at 100%?
breathair : 老黃的機會就是像現在這樣瘋狂迭代,瘋狂降Token成 05/02 12:39
breathair : 本,只要做到末端TCO可以跟用ASIC的一樣便宜,讓最 05/02 12:39
breathair : 下游也吃得到肉,自己維持75%毛利沒問題。 05/02 12:39
breathair : 但,主要是這件事很困難,現在NV是賣整個機櫃,還要 05/02 12:39
breathair : 維持跟晶片一樣的毛利,最後Token成本還不能比ASIC 05/02 12:39
breathair : 貴。 05/02 12:39
breathair : 這真的就要黑科技了 05/02 12:39
Arkzeon : 最傳奇的還是SEGA那個。 雙方都是君子 05/02 12:39
josephpu : 老黃下游哪有吃不飽...每個都吃超飽好嗎,哪怕股價 05/02 12:40
josephpu : 最弱的odm每一間也是賺爛,只是股市資金都往產能瓶 05/02 12:40
josephpu : 頸或技術升級的環節去堆,散熱電源高速傳輸板子, 05/02 12:40
josephpu : 有確定打進nv的哪間不是噴爛,同時吃到tpu的更噴 05/02 12:40
josephpu : 不過根本原因在於伺服器疊代太快了,不像消費性電 05/02 12:42
josephpu : 子整天擠牙膏,持續有新技術進來就會有新機會 05/02 12:42
breathair : 下游是指OAI 這層,五層蛋糕最上層要能賺的到錢,這 05/02 12:42
breathair : 裡賺不到,整個供應鏈賺的盆滿鉢滿都假的,而Anthro 05/02 12:42
breathair : pic已經戒斷CUDA成功了 05/02 12:42
beavertail97: 抱緊就是了 持續買入 05/02 12:43
ProTrader : TPU的缺點是門檻太高 連大廠也只有少數有進場資格 05/02 12:44
a2080259 : 老黃 is over 05/02 12:44
HiuAnOP : 老黃這輩子就這樣了! 05/02 12:44
breathair : 而谷歌已經用財報告訴GG,我這裡是真的有金礦,缺你 05/02 12:44
ProTrader : 所以只要AI還在發展GPU不可能崩的 05/02 12:44
breathair : 的晶片鏟子 05/02 12:44
breathair : TPU門檻高確實,我才說CUDA就是毒品 05/02 12:45
dannywhat : 公公真的爛死了 05/02 12:45
james56733 : asic用越多ocs用越多,無腦歐印lite 05/02 12:46
iceyeman : 現在看起來 GPU裡面塞Agent 內部調控 比較可能打的 05/02 12:49
iceyeman : 過ASIC 不過這也要訓練期 出來ASIC已經大殺四方了 05/02 12:49
inet : 台積電負責突破物理極限,老黃負責壟斷商業分配 05/02 12:53
breathair : 老黃應該要負責讓最下游賺到錢,就是這點沒做好,他 05/02 12:55
breathair : 現在本益比才會那麼低 05/02 12:55
axr : 99老黃 05/02 12:56
as6633208 : 要談論推理成本和ASIC喔,咳咳,反正groq的LPU老黃 05/02 12:56
as6633208 : 也是布局了,NV不太怕ASIC, 最近還大推開源模型, 05/02 12:56
as6633208 : 開源趨勢推下去還怕沒金子,處處是創業處處是金子, 05/02 12:56
as6633208 : 至於GTC提到的物理AI,太空伺服器,我只能說就等等 05/02 12:56
as6633208 : 吧,甚至量子電腦老黃都布局了 05/02 12:56
aza0290 : 這一天終於快來了 05/02 12:56
apple123773 : 天網的時代.... 05/02 12:57
as6633208 : NV自己都帶頭開源模型了,讓中國自己開源搞起來,接 05/02 12:58
as6633208 : 著是歐洲 石油國 台灣 印度... 05/02 12:58
herculus6502: 結論不行XD 05/02 12:59
breathair : 老黃只要能做到維持75%毛利,又能讓token跟ASIC一樣 05/02 13:00
breathair : 便宜,股價會還他公道,主要是這真的很難 05/02 13:00
seemoon2000 : 現在主要是要讓A、O棄用NV的方案 才有機會 不然這陣 05/02 13:06
seemoon2000 : 子企業用戶焦慮到整天在付錢給A 深怕自己沒跟上 要 05/02 13:06
seemoon2000 : 這種狀態讓A去推ASIC方案真的是不太有邏輯 說實話 05/02 13:07
as6633208 : 這論點,感覺後續NV每推出新一代都會說不可能達到, 05/02 13:08
as6633208 : 然後NV繼續維持75%毛利,因為摩爾定律到極限後,老 05/02 13:08
homygodpppk : 捷安特可以轉型能源股,用機械人來發電作永動機 05/02 13:08
as6633208 : 黃自己的定律還在讓每一代產品token效率提升十倍xD 05/02 13:08
seemoon2000 : 只要A還能整天狂殺軟體股 那在那天的1年後 都不會推 05/02 13:09
seemoon2000 : ASIC方案 ASIC最後是要吃到高原後的降低成本邏輯 05/02 13:10
guanting886 : NV的高階伺服器沒有一個是一般民眾摸的到跟跑得起 05/02 13:12
你看一下vllm repo https://github.com/vllm-project/vllm 這個在inference throughput 主要是cuda開源 你租gpu時候 需要deploy model 你就是會在這社群共享 比方如下 https://github.com/sgl-project/sglang-omni/issues/364 tpu光是在HuggingFace 得到正式開源支持 都是2025時候事情 https://github.com/huggingface/optimum-tpu 你可以看看這社群也才138star 再對照上面vllm 你就可以看出社群差異
guanting886 : 的 有設備 你就沒那個機房跟大電 05/02 13:12
bala045 : GPU裡塞agent是什麼碗糕..? 05/02 13:13
guanting886 : TPU主要還是環繞在機器/深度學習的加速 05/02 13:14
iceyeman : 只是個老黃優化調度概念 05/02 13:14
guanting886 : 有沒有開源到其實沒有那麼重要 05/02 13:14
guanting886 : 本來都是給一群精英真的特定服務進行優化的 走到A 05/02 13:16
guanting886 : SIC就表示某個平台服務可以藉由自研晶片把成本跟耗 05/02 13:16
guanting886 : 能打下來 才願意去開案 05/02 13:16
不對 在infefrence就是要去擠出gpu效能 vllm這類型就是透過page attnetion 等設計 讓大量垂直ai廠商 能用最大效力化去跑gpu vLLM 包含一个推理服务器(用于管理网络流量)和一个推理引擎(用于最大限度地提高计算速度)。 它的工作原理是通过其 PagedAttention 算法更好地利用 GPU 内存, 从而加快生成式 AI 应用的输出速度。 https://www.redhat.com/zh-cn/topics/ai/what-is-vllm 功能。vLLM 可提供的其他性能优化包括: PyTorch 编译/CUDA Graph - 用于优化 GPU 内存。 vLLM 通过开放且可移植的部署方案,有效解决了高效利用 GPU 的核心难题, 显著降低了每词元成本,并在大规模场景下实现稳定延迟。 截至 2026 年初,其 GitHub 社区数据如下: 超过 50 万个已部署 GPU 全天候不间断运行。 超过 200 种不同类型的加速器。 支持的模型架构数量超过 500 种。 独立贡献者人数超过 2,200。 其他推理引擎也是大部分基於cuda生態圈 open source平台 少部分有開始嘗試AMD體系 https://reurl.cc/bde553 ※ 編輯: LDPC (98.37.67.135 美國), 05/02/2026 13:20:54
guanting886 : 省出來的地方要不要繼續加碼更多ASIC或NV的產品要 05/02 13:17
guanting886 : 看平台本身缺什麼 05/02 13:17
ezqq123 : 美利達 你把我放去哪了 05/02 13:19
※ 編輯: LDPC (98.37.67.135 美國), 05/02/2026 13:22:39
bnn : 那個 之後agent和agent自己討論 複製 社群有用嗎 05/02 13:21
breathair : A早就在用谷歌跟亞麻的ASIC了,CUDA戒斷成功了,這 05/02 13:22
breathair : 就是老黃不投A家的原因,太晚了,已經脫離NV CUDA生 05/02 13:22
breathair : 態了 05/02 13:22
ptta : 天下苦黃久矣 05/02 13:26
ll1117 : 先把姓黃的都抓起來踩腳踏車 05/02 13:27
iceyeman : 真的連訓練都省了 代表還真的可能靠ASIC可行 他們自 05/02 13:27
iceyeman : 己演算法超強 05/02 13:27
kyo1760 : 老黃這輩子就這樣了。99老黃qq 05/02 13:30
darkangel119: AVGO 笑死 我才是賺最大的那個 05/02 13:31
as6633208 : 我只能說啦,現在大家想得到賺爛和未來有競爭力的都 05/02 13:33
as6633208 : 在qqq和費半,兩個都買不用爭,我就說在那邊押注谷 05/02 13:34
as6633208 : 歌還是老黃還是tsm,結果漲最多的是閃迪 美光 和int 05/02 13:34
as6633208 : el爭什麼,不如買qqq和費半,搞不好下一波是特斯拉 05/02 13:34
as6633208 : 和太空呢 05/02 13:34
@@ 所以買產業鍊啊 我手上還有記憶體族群 我自己看了一下 手上大概是700% 老黃買法也是有策略性 (低於多少買 高於多少不能買這類策略) 買股可以分為 高風險高投資 + 大家都知道ai股(低風險 中報酬 但能贏大盤) 當你手上有一兩百萬美金 你可以選擇低風險中報酬 打贏qqq等大盤 就以2026 YTD來說 老黃跟狗家就是贏QQQ 比方說如果你使用質押借王拳 老黃狗家 是可以用來在合理價位區間進去 因為他們有保證五年以上光景 台積也是類似概念 畢竟大跌你比較能抱得住 當你只有10萬美金 你可以買產業鍊飆股 不一樣投資策略 所以我再次 強烈建議捷安特 他屬於高風險高投資!!!
qweaaazzz : 難怪老黃說 跑起來就對了 他預告以後人類只能當電池 05/02 13:38
qweaaazzz : 老老實實買腳踏車踩起來 跑步機 跑起來 就對了! 05/02 13:39
※ 編輯: LDPC (98.37.67.135 美國), 05/02/2026 13:52:29
guanting886 : 捷安特的杜姐姐退休了捏 05/02 13:53
gladopo : 羨慕LD大700%,比夏亞還厲害 05/02 13:55

💰 股票 Stock 版:熱門文章

💰 股票 Stock 版:更多文章