🔥 PTT.BEST 批踢踢爆文 💬 八卦 Gossiping 😊 希洽 C_Chat 💰 股票 Stock 🏠 房屋 home-sale 🏀 美國職籃 NBA ⚾ 棒球 Baseball 👛 省錢 Lifeismoney 🚗 汽車 car 😡 政黑 HatePolitics 💻 電蝦 PC_Shopping 🥰 韓星 KoreaStar ✨ 英雄聯盟 LoL 🍿 電影 movie 🪖 軍事 Military 📡 通訊 MobileComm 🏀 台籃 basketballTW 🍼 寶媽 BabyMother 🇯🇵 日旅 Japan_Travel 🏭 科技 Tech_Job 👉 男女 Boy-Girl 👉 真香 CheerGirlsTW 👧 女孩 WomenTalk 👻 媽佛 marvel 💳 卡版 creditcard 👉 NS NSwitch 👉 PS5 PlayStation 👉 大氣 TY_Research 👉 婚姻 marriage 👉 台南 Tainan 👉 台中 TaichungBun 👉 Steam Steam 👉 高雄 Kaohsiung 👉 羽球 Badminton 👉 超商 CVS 👉 米哈遊 miHoYo 👉 iOS 👉 兄弟 Elephants 👉 日劇 Japandrama 👉 玄幻 CFantasy 👉 ES e-shopping 👉 WOW 👉 遊戲交易 Gamesale 👉 4X BaseballXXXX 👉 Lakers 👉 韓劇 KoreaDrama 👉 汽車買賣 CarShop 👉 機車 biker 👉 新竹 Hsinchu 👉 美保 BeautySalon 👉 串流 OTT 👉 歐美影集 EAseries 👉 手機交易 mobilesales 👉 健身 MuscleBeach 👉 MacShop 👉 Lions 👉 FGO FATE_GO 👉 中劇 China-Drama 👉 數位貨幣 DigiCurrency 👉 暗黑 DIABLO 👉 實習教師 studyteacher 👉 航空 Aviation 👉 藝文票券轉售 Drama-Ticket 👉 韓綜 KR_Entertain 👉 美妝 MakeUp 👉 速食 fastfood 👉 手錶 watch 👉 體適能 FITNESS 👉 攝影 DSLR 👉 Headphone 👉 嘻哈 Hip-Hop 👉 轉珠 PuzzleDragon 👉 美食 Food 👉 蔚藍 BlueArchive 👉 數位相機交易 DC_SALE 👉 筆電蝦 nb-shopping 👉 軟工 Soft_Job 👉 汪踢 Wanted 👉 台綜 TW_Entertain 👉 坂道閒聊 SakaTalk 👉 貓咪 cat 👉 日GO BabyProducts 👉 TypeMoon 👉 MLB 👉 職場 Salary 👉 臺劇 TaiwanDrama 👉 海賊王 ONE_PIECE 👉 PMGO PokemonGO 👉 國營 Gov_owned 👉 碧航 AzurLane 👉 家電 E-appliance 👉 布蘭德 Brand 👉 DMMG DMM_GAMES 👉 贈送 give 👉 神魔 ToS 👉 銀行服務板 Bank_Service 👉 原創 YuanChuang 👉 期權 Option 👉 重機 SuperBike
完整標題: Intel 與 AMD 聯手推進 APX 指令集!x86 架構迎來史上最大變革,效能提升不增功耗 原始連結: https://www.koc.com.tw/archives/641394 內文: Intel 與 AMD 這對數十年來在 CPU 市場上正面廝殺的競爭對手,正透過 x86 生態系統 顧問小組(EAG)持續深化合作。繼兩天前聯合發布 ACE(AI Compute Extensions)AI 矩陣加速指令集白皮書之後,EAG 再度揭露了 APX(Advanced Performance Extensions )的最新細節。這項被稱為「x86 自 64 位元以來最大演進」的指令集擴充,將通用暫存 器數量直接翻倍,並在不增加晶片面積與功耗的前提下顯著提升效能。 https://i.imgur.com/dDlr9lf.jpeg APX 是什麼?為什麼是 x86 的重大演進? APX(Advanced Performance Extensions)是 Intel 與 AMD 共同制定的新一代 x86 指 令集擴充標準。它的核心精神非常直接:讓 x86 指令集能夠存取更多的暫存器( Registers)。 暫存器是 CPU 內部容量極小但存取速度極快的儲存單元,負責存放正在運算的資料、指 令與記憶體位址。當指令集能存取更多暫存器時,處理器就能在更短的時間內完成更多工 作,因為大量資料可以直接在 CPU 內部處理,不需要頻繁到速度較慢的記憶體中讀寫。 https://i.imgur.com/6wsaewW.jpeg 這項規格早在 2024 年 10 月就由 Intel 首次提出,如今在 EAG 的框架下由 Intel 與 AMD 共同推動,並釋出了更多技術細節。 APX 六大核心改進 APX 並非單一功能的補強,而是對 x86 指令集架構的一次系統性升級。以下是主要改進 項目: 通用暫存器(GPR)翻倍:由現有的 16 個一舉擴充至 32 個。這讓編譯器可以將更多資 料與變數保留在暫存器中,而非寫入速度較慢的記憶體,對程式碼編譯與執行效率有直接 幫助。 https://i.imgur.com/2N81Nkk.jpeg 記憶體操作效率提升:經過 SPEC CPU 2017 整數基準測試的模擬驗證,APX 編譯後的程 式碼可減少 10% 的讀取操作(loads)與 20% 的寫入操作(stores),代表更快且功耗 更低的程式執行。 非破壞性指令形式:傳統 x86 指令大多是「破壞性」的,運算結果會直接蓋掉其中一個 來源運算元。APX 新增了非破壞性版本,減少暫存器複製需求,讓程式碼更簡潔且執行更 快。 條件執行擴充:過去 x86 的條件執行僅限於 CMOV 與 SET 等少數指令。APX 新增了條件 式讀取(Conditional Load)、條件式寫入(Conditional Store)、條件式比較/測試( Conditional Compare/Test)以及旗標抑制功能,大幅擴展 if-conversion 的應用範圍 ,減少分支預測失誤。 堆疊操作強化:新增 PUSH2 與 POP2 指令,可以在一次記憶體操作中同時推送或彈出兩 個暫存器,加速函式呼叫的進入與返回流程。 程式碼密度不變:儘管新增了大量指令與功能,APX 並不顯著增加程式碼體積,並且完全 向下相容——既有的 x86 軟體可以在支援 APX 的處理器上無縫執行。 與 ACE 指令集同屬 EAG 框架下的戰略布局 APX 的公布時間點極具戰略意義。就在兩天前的 4 月 30 日,Intel 與 AMD 才剛聯合發 布了 ACE(AI Compute Extensions)技術白皮書,將其定位為 x86 架構的「標準矩陣加 速架構」,支援 INT8、FP8、BF16 等主流 AI 資料格式,並相容於 AVX10 指令集。 ACE 聚焦 AI 矩陣運算加速,APX 則專注於通用運算效能的全面提升:兩者相輔相成,共 同構成 EAG 對 x86 架構未來發展的完整藍圖。EAG 自去年成立以來,陸續公布了 FRED (彈性返回與事件遞送)、AVX10(向量指令集統一)、ChkTag(記憶體安全標籤檢查) 以及 ACE 與 APX 等多項核心特性。 https://i.imgur.com/s3drPcm.jpeg 不用更大面積、不必更高功耗,效能自然提升 APX 最令人驚豔的特色之一,是這些效能提升幾乎不需要額外的矽晶圓面積或功耗作為代 價。Wccftech 的報導強調,APX 可以在不顯著增加核心面積與功耗的情況下,實現更高 的通用運算效能:這對於晶片設計與散熱解決方案來說,意義極為重大。 對開發者與消費者的意義 對於軟體開發者而言,APX 最大的價值在於編譯器的最佳化空間大幅增加。當編譯器能夠 將更多變數保留在暫存器而非記憶體中,程式就能跑得更快、更省電。尤其對於 LLVM 與 GCC 等主流編譯器來說,APX 的 32 個通用暫存器將成為極具吸引力的編譯目標。 對於一般消費者而言,APX 帶來的效益將間接體現在日常使用中:從網頁瀏覽、文書處理 到遊戲與內容創作,支援 APX 的處理器將能以更低的功耗完成相同的工作,或在相同功 耗下提供更流暢的效能表現。 結語 Intel 與 AMD 從數十年的競爭對手,到如今在 EAG 框架下聯手推進 x86 架構的演進: 這不僅是為了對抗 ARM 與 RISC-V 的新興威脅,更是對 x86 這套走過近半世紀的指令集 架構注入全新生命力。APX 的通用暫存器翻倍、ACE 的 AI 矩陣加速標準化,再加上 FRED、AVX10、ChkTag 等一系列基礎架構革新,x86 的故事顯然還沒有寫完。 心得: 出大事了 x86要大改了,上次大改還是x86-64 x86-64的重點在於擴充暫存器長度+新增新暫存器 APX的重點在於新增新暫存器+現代風格的資料流指令 目前用的資料流邏輯還是1970年代流行的那套 從古老到現代,過去50年的歷史刻在x86的指令集裡面 並且x86已經做好再戰50年的準備了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.233.109.127 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1778099855.A.2E4.html
hn9480412: 但還有一個豬隊友微軟 59.125.187.40 05/07 04:46
WusoAiwen: 難怪兩家股價最近這麼飆,果然商場上 101.8.48.155 05/07 06:44
WusoAiwen: 沒有永久的敵人 101.8.48.155 05/07 06:44
olozil: 阿不就越來越像RISC 220.132.89.193 05/07 08:10
NoneWolf: 太好了 我買AMD 42.70.198.105 05/07 08:29
takanasiyaya: x86抄risc也已經很久了就是。 49.218.208.119 05/07 08:40
smallreader: 新增16個暫存器不增加空間 是重新利223.139.162.224 05/07 08:56
smallreader: 用AVX的暫存器嗎(不懂就問)223.139.162.224 05/07 08:56
olozil: 這跟AVX沒什麼關係就是了 111.243.2.147 05/07 09:04
smallreader: 看來我被"不增加面積"誤導了,他們有223.139.162.224 05/07 09:28
smallreader: 在實體上增設這16個暫存器,說的也是223.139.162.224 05/07 09:28
smallreader: "不顯著增加"面積而已223.139.162.224 05/07 09:28
smallreader: 中文都亂寫,不意外223.139.162.224 05/07 09:30
oopFoo: 現代cpu都有幾百個"虛擬暫存器",只是開 36.224.222.169 05/07 09:31
smallreader: 第一段最後一句對應原文意思是「在不223.139.162.224 05/07 09:32
smallreader: 顯著增加...之下,能提升效能」223.139.162.224 05/07 09:32
oopFoo: 放出來而已。基本上就是指令集的改進。 36.224.222.169 05/07 09:32
oopFoo: NovaLake會有,Zen6應該要有。FRED已經在 36.224.222.169 05/07 09:33
smallreader: 被翻成在不增加...下能顯著提升 整個223.139.162.224 05/07 09:33
smallreader: 意思就大轉彎了223.139.162.224 05/07 09:33
oopFoo: PTL上了。FRED在某些io上有大進步。 36.224.222.169 05/07 09:34
oopFoo: https://reurl.cc/X2prXE 36.224.222.169 05/07 09:35
oopFoo: fred只需要作業系統支援。apx就需要重新 36.224.222.169 05/07 09:37
oopFoo: 編碼,理論上可20%的效能提昇。 36.224.222.169 05/07 09:38
oopFoo: 基本上,實體面積真的沒什麼增加。 36.224.222.169 05/07 09:44
olozil: 對APX不用太期待,基本上就是已經沒什麼手 111.243.2.147 05/07 09:49
olozil: 段了還不想大改,影響CPU的主要有計算、控 111.243.2.147 05/07 09:49
olozil: 制、IO、同步,增加暫存器就是對計算與控 111.243.2.147 05/07 09:50
olozil: 的部分增強,但效果有限,IO來說你加大了 111.243.2.147 05/07 09:50
olozil: L1反而性能會下降,你把L1從32K->48K 111.243.2.147 05/07 09:50
olozil: 訪問就會從4個cycle變5個cycle, 111.243.2.147 05/07 09:50
olozil: 然後掉性能,X86最大的問題一直是記憶體的 111.243.2.147 05/07 09:50
olozil: 一致性,這是RISC不會有的問題 111.243.2.147 05/07 09:50
smallreader: 就算是虛擬的也要有實體位置支援吧223.139.162.224 05/07 09:57
olozil: 直接舉例來說,上一次加暫存器是X86-64, 111.243.2.147 05/07 09:57
olozil: 然後這次幅度還會比上次小一點 111.243.2.147 05/07 09:58
smallreader: 不然能並行的線頭數量會減少(?)223.139.162.224 05/07 09:59
oopFoo: 記憶體的一致性,TSO,有好有壞。現代cpu 36.224.222.169 05/07 10:01
oopFoo: 的性能,根本發揮不出來。記憶體頻寬又小 36.224.222.169 05/07 10:02
oopFoo: 所謂的虛擬其實就是實際暫存器,我講的 36.224.222.169 05/07 10:04
oopFoo: 有點反過來。實際有幾百個暫存器,cpu會 36.224.222.169 05/07 10:04
oopFoo: 虛擬成好幾組,同時使用。現在只是開放 36.224.222.169 05/07 10:05
oopFoo: 給程式直接使用,可縮短程式碼,更有效率 36.224.222.169 05/07 10:06
smallreader: 嗯 反過來 實體=幾百個 虛擬=一個執223.139.162.224 05/07 10:06
smallreader: 行緒所看到的223.139.162.224 05/07 10:06
oopFoo: 的應用。 36.224.222.169 05/07 10:06
CyBw: 還沒要升x86-128嗎,都幾年了 114.35.167.130 05/07 10:09
oopFoo: 暫存器增加多吧,x64加8個,apx加16個。 36.224.222.169 05/07 10:14
oopFoo: cpu內部看到的暫存器跟程式碼不一樣。例如 36.224.222.169 05/07 10:15
oopFoo: store [rax]然後接著load rax,cpu會用兩 36.224.222.169 05/07 10:16
oopFoo: 暫存器,因為它們互不干擾,可以平行處理 36.224.222.169 05/07 10:17
oopFoo: 你要一個cycle同時處理8個指令,那這八個 36.224.222.169 05/07 10:18
oopFoo: 指令不能互相依賴。太少暫存器就容易製造 36.224.222.169 05/07 10:19
oopFoo: 依賴。 36.224.222.169 05/07 10:19
nrsair: 新指令集擴充 49.217.202.62 05/07 10:20
s25g5d4: 6202 年還在談 CISC/RISC 就落伍了,是沒 211.22.64.132 05/07 10:31
s25g5d4: 看到 ARM 近幾年瘋狂加各種 SIMD 指令集 211.22.64.132 05/07 10:31
s25g5d4: ,ARM 跟 x86 這幾年差異主要在 variable 211.22.64.132 05/07 10:31
s25g5d4: instruction length 而已。ARM 現在也是 211.22.64.132 05/07 10:31
s25g5d4: decoder 拆 mOP 下去跑,跟 x86 一樣, 211.22.64.132 05/07 10:31
s25g5d4: 只是 fixed length decoder 比較好做而已 211.22.64.132 05/07 10:31
kuninaka: 股價飆跟這沒關係啊 1.174.97.117 05/07 10:46
kuninaka: 那是AI需求 1.174.97.117 05/07 10:46
h311013: 蘋果推自研真的是很有遠見 61.227.103.243 05/07 11:31
wahaha99: 就算是實體暫存器 佔用空間也還好 37.19.205.168 05/07 11:35
wahaha99: 君不見現在佔CPU最多的早就不是邏輯單元 37.19.205.168 05/07 11:35
takanasiyaya: Apple從來就喜歡自研,只有core2時 49.218.208.119 05/07 12:43
takanasiyaya: 代的Intel真的太厲害才低頭用Intel 49.218.208.119 05/07 12:43
takanasiyaya: ,不然全部都嘛用自己的。不過M系列 49.218.208.119 05/07 12:43
takanasiyaya: 記憶體架構有創新是真的有意義 49.218.208.119 05/07 12:43
labbat: 存儲記憶體都是公共資源,通用暫存器都是 39.15.56.30 05/07 12:47
labbat: 特定執行緒限定資源,編譯器活用可以減輕 39.15.56.30 05/07 12:47
labbat: 匯流排負擔 39.15.56.30 05/07 12:47
Bencrie: 我想得到的好處就 x86-64 ABI 呼叫函數 60.251.10.52 05/07 12:51
Bencrie: 的時候 args 塞 regs 的上限變高 60.251.10.52 05/07 12:51
guanting886: 看起來雖然是APX很厲害 但感覺上是 42.78.166.15 05/07 13:16
guanting886: 兩邊找機會把過去的技術債一起清掉 42.78.166.15 05/07 13:16
guanting886: 之前有多少0day搞到資料中心很緊張 42.78.166.15 05/07 13:16
ltytw: 清掉技術債怎麼不是找時間重新發明X86? 36.234.230.69 05/07 13:20
ltytw: 例如什麼X86 Gen2 然後順便清掉技術債或 36.234.230.69 05/07 13:20
ltytw: 屎山代碼 36.234.230.69 05/07 13:21
tsairay: 清掉技術債不是叫你不要向下相容 202.39.11.150 05/07 13:22
bhmagic: 血紅姊哭哭 沒人理VIA 99.118.209.229 05/07 13:29
olozil: X86實際可用6個暫存器, _sp與_bp有限制 111.243.2.147 05/07 13:37
olozil: 所以是 86(6) -> 86-64(16) -> APX(32) 111.243.2.147 05/07 13:38
olozil: 這次增加幅度沒有上次多 111.243.2.147 05/07 13:39
commandoEX: 升128沒啥好處吧,要說的話AVX就能處 59.125.204.130 05/07 13:47
commandoEX: 理128/256/512 bit的數據了 59.125.204.130 05/07 13:48
takanasiyaya: 卡難,x86的小白使用者們不允許,i 49.218.208.119 05/07 13:48
takanasiyaya: 皇當初雄心壯志要打掉x86重練itinum 49.218.208.119 05/07 13:48
takanasiyaya: 的結果就是被AMD x86-64闖空門進去 49.218.208.119 05/07 13:48
takanasiyaya: 伺服器 49.218.208.119 05/07 13:48
commandoEX: VIA授權不是過期了嗎? 59.125.204.130 05/07 13:49
ma721: 把ai放進去 101.10.87.189 05/07 14:07
leon1757tw: 要清技術債的是x86s吧 不過被放棄了 123.110.162.31 05/07 14:17
s25g5d4: 重新發明 x86?IA64: 211.22.64.132 05/07 14:52
gainsborough: 只要I、A、高通、發哥還是賣SOC,那 114.41.201.174 05/07 16:10
gainsborough: 注定就有面積大小的成本獲利定價衝 114.41.201.174 05/07 16:11
gainsborough: 突,感覺還是打不贏大面積狂堆晶體 114.41.201.174 05/07 16:12
gainsborough: 管數量的蘋果SOC(面向普通消費者) 114.41.201.174 05/07 16:12
cor1os: 加新指令集才是淘汰老PC最快的方法 -.- 122.147.131.2 05/07 16:30
oopFoo: _bp沒有限制,_sp有限制所以_sp+_bp來存取 58.114.66.74 05/07 19:58
oopFoo: stack frame。但esp可以offset了,ebp就可 58.114.66.74 05/07 19:59
oopFoo: 空出來。如果你的環境許可,esp也可挪來用 58.114.66.74 05/07 20:00
oopFoo: 。但就算6>16>32。16還是比10多啊。 58.114.66.74 05/07 20:01
soem: 可惜X86S各方沒共識,能移除一些舊時代的指 1.34.10.55 05/07 20:04
soem: 令集的話也算是有進步 1.34.10.55 05/07 20:04
oopFoo: 移除沒有意義,因為空間佔很少。現代cpu的 58.114.66.74 05/07 20:08
oopFoo: 瓶頸在branch,在cache,在memory,這都不 58.114.66.74 05/07 20:10
oopFoo: 是指令集的問題。x86雖然丑,但相容性100% 58.114.66.74 05/07 20:11
friedpig: 相容性100%除了少數老舊工業軟體沒再更 114.32.196.169 05/07 21:48
friedpig: 新以外 真的那麼重要嗎? 114.32.196.169 05/07 21:48
friedpig: 真的必須的舊軟體沒剩多少了八 114.32.196.169 05/07 21:49
smallreader: 編譯器框架很在意相容性吧223.139.162.224 05/07 22:21
smallreader: 有一些萬年不變的程式碼還活在底層223.139.162.224 05/07 22:24

💻 電蝦 PC_Shopping 版:熱門文章

💻 電蝦 PC_Shopping 版:更多文章