🔥 PTT.BEST 熱門專區 💬 八卦 Gossiping 😊 希洽 C_Chat 💰 股票 Stock 🏠 房屋 home-sale 🏀 美國職籃 NBA ⚾ 棒球 Baseball 👛 省錢 Lifeismoney 🚗 汽車 car 😡 政黑 HatePolitics 💻 電蝦 PC_Shopping 🥰 韓星 KoreaStar ✨ 英雄聯盟 LoL 🍿 電影 movie 🪖 軍事 Military 📡 通訊 MobileComm 🏀 台籃 basketballTW 🍼 寶媽 BabyMother 🇯🇵 日旅 Japan_Travel 🏭 科技 Tech_Job 👧 女孩 WomenTalk 👻 媽佛 marvel 💳 卡版 creditcard 👉 NS NSwitch 👉 PS5 PlayStation 👉 大氣 TY_Research 👉 婚姻 marriage 👉 台南 Tainan 👉 台中 TaichungBun 👉 Steam Steam 👉 高雄 Kaohsiung 👉 羽球 Badminton 👉 超商 CVS 👉 米哈遊 miHoYo 👉 iOS 👉 兄弟 Elephants 👉 日劇 Japandrama 👉 玄幻 CFantasy 👉 ES e-shopping 👉 WOW 👉 遊戲交易 Gamesale 👉 4X BaseballXXXX 👉 Lakers 👉 韓劇 KoreaDrama 👉 汽車買賣 CarShop 👉 機車 biker 👉 新竹 Hsinchu 👉 美保 BeautySalon 👉 串流 OTT 👉 歐美影集 EAseries 👉 手機交易 mobilesales 👉 健身 MuscleBeach 👉 MacShop 👉 Lions 👉 FGO FATE_GO 👉 中劇 China-Drama 👉 數位貨幣 DigiCurrency 👉 暗黑 DIABLO 👉 實習教師 studyteacher 👉 航空 Aviation 👉 藝文票券轉售 Drama-Ticket 👉 韓綜 KR_Entertain 👉 美妝 MakeUp 👉 速食 fastfood 👉 手錶 watch 👉 體適能 FITNESS 👉 攝影 DSLR 👉 Headphone 👉 嘻哈 Hip-Hop 👉 轉珠 PuzzleDragon 👉 美食 Food 👉 蔚藍 BlueArchive 👉 數位相機交易 DC_SALE 👉 筆電蝦 nb-shopping 👉 軟工 Soft_Job 👉 汪踢 Wanted 👉 台綜 TW_Entertain 👉 坂道閒聊 SakaTalk 👉 貓咪 cat 👉 日GO BabyProducts 👉 TypeMoon 👉 MLB 👉 職場 Salary 👉 臺劇 TaiwanDrama 👉 海賊王 ONE_PIECE 👉 PMGO PokemonGO 👉 國營 Gov_owned 👉 碧航 AzurLane 👉 家電 E-appliance 👉 布蘭德 Brand 👉 DMMG DMM_GAMES 👉 贈送 give 👉 神魔 ToS 👉 銀行服務板 Bank_Service 👉 原創 YuanChuang 👉 期權 Option 👉 重機 SuperBike
http://www.numberworld.org/blogs/2024_8_7_zen5_avx512_teardown/ 雖然 Zen5 初期測試報告有點不盡人意 不過剛剛看到這篇文章大力讚揚 Zen5 AVX512 設計, 和 Zen4 AVX512 相比, Zen5 IPC成長幾乎快了 100% 這是因為 Zen4 用 4 x 256-bit 的通道組合出來 連 Intel 只有 server 等級的 Sapphire Rapids 才給的起 2 x 512-bit 但這次 zen5 桌面版大核就很大方的給了 4 x 512-bit 因此反映在效能上就直接爆漲了 另外 Intel 常被詬病 AVX512 需要先花一些時間(約50000 cycle)低速跑, 等電上去,CPU降速才能全速跑。但 Zen5 可能靠設計和製程完全解決這問題, 不需降速也不用等,下指令後幾乎立即全速運作。 此外 Intel 在 Tiger Lake 加了 AVX512-VP2INTERSECT 指令, 但速度超級慢 (25 cycle),大家都用別的指令去模擬還比較快, 因此 Intel 在往後的 CPU 也移除他。 這次 Zen5 實作了這個指令,而且只花 1 cycle 就完成。 綜合這些分析,他認為Zen5可以說第一次讓大家看到完整版的 AVX-512。 反觀 Intel 設計了卻四處限制... 他還有提到 Cinebench, CPU-Z 都沒有很認真測試 AVX-512, 因此看不出Zen5在這方面的優勢。 不過有些 Zen4 可以在 1 cycle 做完的非 AVX-512 SIMD, 在 Zen5 反而不明原因退步到 2 cycle, 另外混合 AVX-256,512 指令的順序不對也會變慢 -- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.235.116 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1723081201.A.DFA.html
smallreader: 重返榮耀! 223.139.184.93 08/08 09:42
ltytw: i粉正在嘗試關心 : 既然以前i被說avx512 114.33.46.227 08/08 09:45
ltytw: 超熱超耗電又要讓U降頻跑 那這次的zen5呢 114.33.46.227 08/08 09:46
Fortis931: i吹討厭 36.238.95.84 08/08 09:58
Fortis931: 這篇 並試著無視 36.238.95.84 08/08 09:59
orze04: 不知道Linus 大神如何看待… 114.136.57.150 08/08 10:01
johnson0319: 新一代RPCS3神器 104.28.232.15 08/08 10:05
mayolane: 之前用7950X的AVX-512挖礦的還在嗎 114.136.146.11 08/08 10:19
qwe753951: 超缺頻寬 211.20.26.1 08/08 10:33
qwe753951: X3D快來 211.20.26.1 08/08 10:34
seiya2000: AVX-512做什麼用? 39.10.8.235 08/08 10:36
Gwaewluin: 這個之前好像看到能挖礦的樣子 114.137.153.82 08/08 10:44
arnold3: 遊戲好像用不到? 119.14.100.51 08/08 10:46
arrenwu: AVX2應用比較廣泛 AVX512不知道那些軟體 98.45.195.96 08/08 10:47
arrenwu: 現在有在用 98.45.195.96 08/08 10:47
mayolane: So sorry to disappoint the RPCS3 com 114.136.146.11 08/08 10:47
mayolane: munity here. As much as they love AV 114.136.146.11 08/08 10:47
mayolane: X512, they primarily only use 128-bi 114.136.146.11 08/08 10:47
mayolane: t AVX512 - which does not significan 114.136.146.11 08/08 10:47
mayolane: tly benefit from Zen5's improvements 114.136.146.11 08/08 10:47
mayolane: to the vector unit. 114.136.146.11 08/08 10:47
mayolane: RPCS3沒什麼用 114.136.146.11 08/08 10:47
DrGun: 8要再反觀惹!收盤只剩18.99 天下苦皇久矣 1.163.252.225 08/08 10:53
DrGun: !! 1.163.252.225 08/08 10:53
chiahong1227: AVX-512 普通消費者用不到也是事實 140.114.85.131 08/08 11:12
leviva: 普通遊戲用不到,PS3模擬器有用到的樣子 27.52.41.115 08/08 11:14
qwe753951: 一般人用不到是事實 211.20.26.1 08/08 11:19
yankeefat: i皇今年已經跌掉60%了 123.204.11.71 08/08 11:28
kamichu: 等X3D應該猛猛的 111.82.252.188 08/08 11:45
amos30627: G叔吹18A股價18塊 等他吹14A的時候會剩 101.9.133.227 08/08 11:50
amos30627: 14塊 101.9.133.227 08/08 11:50
amos30627: 看他是製程吹的快還是股價跌的快 101.9.133.227 08/08 11:51
wantsu: PS2模擬器好像會用到 125.228.171.79 08/08 12:12
mayolane: PS3模擬器有用 114.136.146.11 08/08 12:17
Arbin: 那PS3模擬器應該會跑更快了吧xd 223.140.213.77 08/08 12:21
mayolane: PS3模擬器就上面說的RPCS3,看起來Zen5 223.136.78.202 08/08 12:24
mayolane: 不會比較快 223.136.78.202 08/08 12:24
easyman: X3d加上avx512 ,跑llama小model,應該個 42.73.70.132 08/08 12:24
easyman: 人使用也不錯 42.73.70.132 08/08 12:24
tim108108: cpu跑大語言模型可以用avx512加速 42.73.75.255 08/08 12:27
Lansbury: 沒想到自己搞得專用指令 AMD才能好好發 49.217.128.171 08/08 12:36
Lansbury: 揮 可悲 49.217.128.171 08/08 12:36
wahaha99: 可是這超級耗電晶體耶 能照顧到的 118.169.27.203 08/08 12:43
wahaha99: 應用有限說... 118.169.27.203 08/08 12:43
ybite: 指令集的改善我覺得要等程式編譯執行時最佳 42.70.227.91 08/08 12:45
ybite: 化才能展現 42.70.227.91 08/08 12:45
wahaha99: 主要是應用太少 當年推出時幾乎沒什麼 118.169.27.203 08/08 12:48
wahaha99: 地方用的上 到現在有AI可以用上 118.169.27.203 08/08 12:48
wahaha99: 但GPU跟NPU他不香嗎... 為什麼要用CPU 118.169.27.203 08/08 12:49
mayolane: 但Zen5塞了AVX-512還沒有比Zen4核心大 140.112.55.67 08/08 12:53
mayolane: 顆 140.112.55.67 08/08 12:53
mayolane: 製程也沒用進步很多 140.112.55.67 08/08 12:54
ltytw: cpu還是比較通用 114.33.46.227 08/08 13:00
alvistan: 重點是這次看起來不佔空間 101.10.57.167 08/08 13:31
b325019: 原本以為塞avx512會很肥,結果塞了4路進 223.137.23.210 08/08 13:39
b325019: 去整體面積跟上代差不多真猛 223.137.23.210 08/08 13:39
mtc5566: 我猜AMD先上 過幾年Intel又會出來AXV51W 118.231.208.21 08/08 13:46
mtc5566: 無用論 118.231.208.21 08/08 13:46
kaj1983: 台積電就是猛 36.238.142.66 08/08 13:48
SHR4587: 伺服器資料中心那邊avx512有甚麼用嗎? 111.241.132.33 08/08 14:12
SHR4587: 畢竟AMD EPYC跟Ryzen用的料幾乎是一樣的 111.241.132.33 08/08 14:13
EXTECH: RPCS3全順砲 223.140.192.34 08/08 14:14
ltytw: 我很像有看過11代要跨12代那時候 114.33.46.227 08/08 14:21
ltytw: 不知道哪個I吹說512沒用了 114.33.46.227 08/08 14:21
aegis43210: 轉檔很有用223.140.155.246 08/08 14:39
as920909: NPU跟GPU不就是為了算浮點數的嗎 218.172.69.212 08/08 14:42
jhjhs33504: 跑大語言模型的回答比較不會出現幻覺 36.228.20.172 08/08 14:50
tonyian: 到底誰在用avx512?有這需求的不是都拿GP 39.9.231.251 08/08 15:54
tonyian: U或是TPU加速了? 39.9.231.251 08/08 15:54
b325019: 你問那些雲端吧,蘇媽會放這個東西進來大 223.137.23.210 08/08 16:02
b325019: 概是按DC客戶的回饋加的 223.137.23.210 08/08 16:02
aegis43210: i皇的server都有AVX512呀,蘇嬤在DT端175.181.175.150 08/08 16:21
aegis43210: 這樣純粹是debug加上佛心來著沒閹割175.181.175.150 08/08 16:21
enonrick: intel 市場行銷的東西先做出來再說,只 111.241.167.51 08/08 17:02
enonrick: 是要降頻降溫,code 都要重寫, port難 111.241.167.51 08/08 17:02
enonrick: 度高 伺服器端用在加密/hash 加速 ,一 111.241.167.51 08/08 17:02
enonrick: 般使用者不需要靠 gpu 做inference , 111.241.167.51 08/08 17:02
enonrick: 多媒體之類的何不用gpu 就好, 猜是想要 111.241.167.51 08/08 17:02
enonrick: 吹上面的 NVVI 吧,有實驗宣稱比 gpu 111.241.167.51 08/08 17:02
enonrick: 快好幾倍,總之~~讓子彈飛一會~ 111.241.167.51 08/08 17:02
enonrick: 啊對了 zluda 被 amd 正式發公文下架了 111.241.167.51 08/08 17:02
friedpig: 兩邊DT都馬是Server的白老鼠 需求都是118.163.149.125 08/08 17:28
friedpig: Server來的 只是牙膏DT大小核稿到AVX512118.163.149.125 08/08 17:28
friedpig: 不好Debug關掉而已118.163.149.125 08/08 17:28
friedpig: AMD不知道是比較保守還是客戶壓力沒那麼118.163.149.125 08/08 17:30
friedpig: 大 可以比較晚等AVX512成熟一點在實作優118.163.149.125 08/08 17:31
friedpig: 秀的硬體 牙膏就比較早硬上慢慢優化118.163.149.125 08/08 17:31
friedpig: 牙膏最新的E核看起來還是沒AVX512 DT應118.163.149.125 08/08 17:39
friedpig: 該87%又是閹割掉了118.163.149.125 08/08 17:39
yymeow: 建議i社把那些面積拿去做L3還比較實際一點 60.250.130.216 08/08 17:40
yymeow: 整天搞一些有的沒有的 60.250.130.216 08/08 17:40
friedpig: 做硬體的別想太多 食物鏈的下游 很多118.163.149.125 08/08 17:45
friedpig: 時候你以為是牙膏想做 客戶說了算118.163.149.125 08/08 17:45
friedpig: 不過我到蠻想看牙膏現在高階封裝也是有118.163.149.125 08/08 17:48
friedpig: 再碰 能乖乖拉下臉弄個X3D來看看嗎118.163.149.125 08/08 17:49
yymeow: i社現在NEX事業群倒是出了一些怪機絲 60.250.130.216 08/08 18:07
yymeow: 比如說1851腳位的[真。14代] 60.250.130.216 08/08 18:08
leung3740250: MSDT改用NINE L3第4年了還在堆L3,119.237.179.153 08/08 18:09
leung3740250: 能不能先查一下牙膏L3到底是怎麼運119.237.179.153 08/08 18:09
leung3740250: 作的?119.237.179.153 08/08 18:09
yymeow: core ultra 7 165HL之類的 60.250.130.216 08/08 18:09
yymeow: 還有什麼i7-14701e的怪東東 60.250.130.216 08/08 18:10
birdy590: 我覺得Linus的看法是對的 桌面/一般用途 119.14.42.10 08/08 21:11
birdy590: 根本用不上 佔用的空間可以有更好的利用 119.14.42.10 08/08 21:12
birdy590: 伺服器之類特殊用途如果需要可以另外出 119.14.42.10 08/08 21:12
mayolane: 另外出怎麼玩蘇媽最愛的膠水大法 1.161.79.156 08/08 21:32
kamichu: 這次avx512進步那麼多 111.82.129.169 08/08 23:06
kamichu: zen5這次可能真的卡在那顆舊的iod 111.82.129.169 08/08 23:08
pig: 不會影響到其他東西的avx512其實就沒啥好抱怨218.161.120.232 08/09 11:01
pig: 的,用不到的指令集多的是當初就這個被罵翻218.161.120.232 08/09 11:01
pig: 主要還是那時候avx512跑起來又熱又慢218.161.120.232 08/09 11:09
lwei781: LLM 用CPU 跑有用 36.230.99.117 08/09 17:24
lwei781: 這比 NPU 好啊,尤其需要精度的 Mo 36.230.99.117 08/09 17:26
lwei781: del 36.230.99.117 08/09 17:26
lwei781: NPU 幾乎都 Int, 頂多 BF16 36.230.99.117 08/09 17:27
lwei781: Xeon 5代,六代 都有 啊 36.230.99.117 08/09 17:27
Litfal: 有沒有一個可能是以前不好用所以沒人用, 27.53.224.2 08/09 19:06
Litfal: 不過512需求大多被GPU吃了就是 27.53.224.2 08/09 19:06

💻 電蝦 PC_Shopping 版:熱門文章

💻 電蝦 PC_Shopping 版:更多文章