作者trfmk1 (TRF小兵)
看板PC_Shopping
標題[心得] ComfyUI RX 9070XT便攜包分享
時間Sun Jun 21 21:11:25 2026
ComfyUI for AMD RX 9070XT便攜包更新
ComfyUI_Win_portable_RX9070 TRFv0.3-Lite
https://drive.google.com/file/d/1PasVAW889I1uzwtDBcWIP3IoeC-aIogi/view?usp=sharing
更新的軌跡
https://forum.gamer.com.tw/C.php?page=1&bsn=60030&snA=679332&gothis=2554285#2554285
ComfyUI更新到 0.25.0
第一次使用請先點擊Update ROCm.bat
安裝ROCm 與 PyTorch
https://i.imgur.com/Mcndnz5.png
選擇 1. 多架構 ROCm 與 PyTorch (gfx1201)
即可安裝最新版本ROCm/TheRock
安裝完可以選擇
4. 清除 UV 套件快取
接著點擊Start.bat會開始載入ComfyUI
跑完後將
http://127.0.0.1:8188 貼到瀏覽器啟動ComfyUI
1.此版本改用 SageAttention 2.2.0
https://github.com/thu-ml/SageAttention/pull/368
這是AMD的工程師jammm
針對RDNA4架構的特殊版本
QK 使用 int8 WMMA,對 PV 使用 fp8 WMMA
使用C++ 配合 AMD 的 HIP 框架來編寫底層 Kernel
最近的更新還支援了head_dim 256
https://i.imgur.com/CNynjM0.png
WAN2.2 480X832 81幀 57.45秒
https://i.imgur.com/ACDjIAi.png
WAN2.2 720X1088 81幀 153.03秒
https://i.imgur.com/TOzyPck.png
WAN2.2 720X1280 81幀 199.5秒
https://i.imgur.com/UeTNIMz.png
Z-image-turbo 1024*1204 6步 4.15秒
2.Flash_attn-2.8.4 RDNA4 CK(Composable Kernel 後端)支持
有些情況跑圖如果想要更高的精度
或者SageAttention出問題的情況
可以考慮換用Flash Attention
基本上SageAttention 2.2.0
RDNA4特化的版本速度是全面提升
PyTorch Version: 2.12.0+rocm7.14.0a20260620
ROCm Version (from PyTorch): 7.14.60850
https://i.imgur.com/04OiC7Z.png
https://i.imgur.com/YwJYmDQ.png
安裝好ROCm
點擊Start.bat啟動
https://i.imgur.com/dDXDxuL.png
步驟1~3建議選擇1即可
步驟 4: 選擇 VRAM 模式
https://i.imgur.com/z8NfqnK.png
系統記憶體比較小者
可以選擇2. 開啟動態 VRAM (--enable-dynamic-vram)
ComfyUI 0.25.0 多了很多自定義參數
動態顯存管理
舊的
-reserve-vram [GB]:手動預留一部分顯存(單位 GB)給操作系統或其它軟件,防
止 ComfyUI 把VRAM全部吃光導致系統卡死。
新的
-vram-headroom [GB]:為動態顯存(DynamicVRAM)設置額外的安全緩沖空間。
ComfyUI 會盡量保持這部分VRAM完全空閒。
節點的緩存管理參數
-cache-ram:【默認模式】基於系統RAM壓力進行緩存。可傳入 1 或 2 個值(如
--cache-ram 4 2),分別代表活動緩存和非活動緩存的RAM保留閾值。
-cache-classic:使用舊版的激進緩存機制(只要RAM夠就拼命緩存)。
-cache-none:完全不緩存任何中間結果。每次點生成,所有節點全部重新執行。極度
省VRAM/RAM,但連續生成速度會變慢。
-high-ram:高性能內存模式,如果系統內存極大或者比起頻繁加載模型更願意吃虛擬
RAM,開啟此項可微幅提升性能(內部會激活經典緩存)。
-fast-disk:當VRAM不夠時,優先把模型緩存到高速SSD(如 NVME SSD)上,而不是
系統RAM。
上面參數有其相關性
--high-ram與--fast-disk兩個互相沖突
一個是積極使用系統RAM
一個是優先使用硬碟當緩存
用--high-ram會強制連動使用--cache-classic模式
--cache-ram與--high-ram也沖突
因為會強制用--cache-classic
我做了一些調整讓這功能在A卡上穩定一些
許多變數與參數都寫在Start.bat裡面
https://i.imgur.com/W9YFMMf.png
預設我是使用--high-ram --vram-headroom 2
系統記憶體較小者可以嘗試
-fast-disk --vram-headroom 2
甚至
-fast-disk --cache-none --vram-headroom 2
步驟 5: 選擇智慧記憶體模式
單純跑圖 選擇1. 預設模式會比較快
如果要跑Wan2.2或LTX-2.3
選擇2. 關閉智慧記憶體 (--disable-smart-memory)會比較穩定
裡面內建了一些工作流
也可以從ComfyUI內建的工作流開始學起
目前ComfyUI壓根不想對GGUF量化做優化支持
動態顯存也不支持GGUF量化
建議模型都用FP8
我這裡提供一些基礎模型
https://drive.google.com/drive/folders/1A9YgUdtGQiTltQTz-kJxdR6A323ihS6Y
civitai也都抓的到
https://civitai.red/?sync-account=green
ComfyUI目前建議不要隨便更新
他們常常想幹嘛就幹嘛
常常破壞性更新
除非你有自行除錯的能力
就算你用N卡也有可能一更新就發現怎麼性能下降
甚至工作流直接報錯
非RDNA4架構的使用者
可以嘗試使用這個版本
https://www.bilibili.com/video/BV1LijF6iE8J/?spm_id_from=333.1387.list.card_archive.click
這個UP主我在QQ群有跟他交流分享
他本身是7900XT的用戶
基本上理念是不賣課免費分享
我將優化過的SageAttention1 Triton分享給他
跟怎麼調整參數也一併說明
讓7900XTX基本上提速30~40%
算是造福不少老卡用戶
https://www.bilibili.com/video/BV1PjEW6sEfD/?share_source=copy_web&vd_source=eb2
他比較傾向照顧所有A卡使用者
RDNA1~4全部支持跑ComfyUI
甚至照顧一群小白把屎把尿的
更新就沒有我的便攜包激進
我只單獨針對RDNA4調整比較沒包袱
我實在沒什麼耐心面對那麼多小白
不過也能去看他影片學習工作流怎麼使用
他都是跟A卡做試配的
最後一些圖片分享
https://i.imgur.com/mTsLAzH.jpeg
https://i.imgur.com/NLTJknJ.jpeg
https://i.imgur.com/7Rt8I8H.jpeg
https://i.imgur.com/lzC3lOo.jpeg
https://i.imgur.com/CsdkAOx.jpeg
https://i.imgur.com/HpAeniO.jpeg
https://i.imgur.com/HateKwx.jpeg
ANIMA基本上只要你想
怎麼玩都可以
https://i.imgur.com/jHPklY8.jpeg
多角色PLAY也不是問題
ROCm這半年加強舊卡支援
https://i.imgur.com/WHWnnao.png
也算是戰未來?
即將ROCm迎來8.0
AMD下半年如何
等7/22 Advancing Al 2026吧
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 125.229.59.186 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1782047488.A.7C9.html
※ 編輯: trfmk1 (125.229.59.186 臺灣), 06/21/2026 21:12:36
推 pxhome: 治天七看來是沒機會了 49.216.42.109 06/21 21:13
※ 編輯: trfmk1 (125.229.59.186 臺灣), 06/21/2026 21:15:45
→ freeunixer: 它對 inter arc Bx0 的支援好嗎? 60.250.90.238 06/21 21:17
推 WeasoN: 未看先推 220.133.186.61 06/21 21:31
推 sporocyst: 感謝你對魔法研究的貢獻 180.176.191.21 06/21 21:31
推 dw7931425: 可是ComfyUI的工作流複雜到我不知該如 114.33.133.253 06/21 21:34
→ dw7931425: 何下手... 114.33.133.253 06/21 21:34
→ spfy: 要從簡單的開始 可以直接問AI 有模型有編解 39.14.40.74 06/21 21:34
→ spfy: 碼和prompt就好了 我隨便玩玩就從三四個node 39.14.40.74 06/21 21:35
→ spfy: 慢慢試的 覺得不太滿足了再加節點 39.14.40.74 06/21 21:36
推 fu1vu03: 洛西加太大了吧(x 125.229.5.91 06/21 21:39
推 nrsair: AI125.224.110.207 06/21 21:41
→ a27588679: 看到便攜包我以為是方便帶著顯卡走的包 106.1.227.146 06/21 21:42
→ a27588679: 包 106.1.227.146 06/21 21:42
→ crimsonmoon9: 先叫GPT幫你生一個最基礎三四個節點 223.138.56.192 06/21 21:53
→ crimsonmoon9: 能出圖的接法 之後想要更進一步就會 223.138.56.192 06/21 21:53
→ crimsonmoon9: 嘗試去自己找資料了XD 223.138.56.192 06/21 21:53
推 MiluPeko: 如果我想做類似推特上特定畫師的畫風 39.15.9.152 06/21 22:04
→ MiluPeko: 是有辦法特別去找模型嗎?還是要自己訓 39.15.9.152 06/21 22:04
→ MiluPeko: 練呢? 39.15.9.152 06/21 22:04
嘛...我臨時弄了個工作流
https://forum.gamer.com.tw/Co.php?bsn=60030&sn=2555454
增加Anima繪師、角色、服裝選擇工具
應該能滿足大多人需求
→ gbcg9725: 可以去civitai找模型或lora 還有問ai 119.14.217.132 06/21 22:08
→ gbcg9725: controlnet怎麼用 不得已再訓練 119.14.217.132 06/21 22:08
→ oread168: 6~7已經巨大提升噴到該有的性能 8是不太 1.170.248.101 06/21 22:12
→ oread168: 期待了== 1.170.248.101 06/21 22:12
推 MiluPeko: 收到 乾蝦 39.15.9.152 06/21 22:12
推 v86861062: 推推 220.134.60.79 06/21 22:27
→ tazi: RDNA2也能用的話,我6800xt不就可以拿來玩XD 114.26.186.198 06/21 22:31
推 proton63: ,推111.242.119.125 06/21 22:52
推 sdbb: 謝謝 112.104.153.3 06/21 22:55
→ spfy: 其實也可以下載這包 拿裡面的模型就好了 39.14.40.74 06/21 23:06
→ spfy: 原po有蒐集一些很常見的模型 光是用檔名就能 39.14.40.74 06/21 23:07
→ spfy: 找到一堆資料的那種 我懶直接Nova Anime XL 39.14.40.74 06/21 23:07
推 mizumutsuki: 推推! 1.169.228.212 06/21 23:09
推 Justapig: 推推好厲害 42.75.20.128 06/21 23:16
推 grtfor: 分享推 114.33.43.179 06/21 23:25
推 pcfox: 好東西 推 蘇媽的好朋友 36.231.86.65 06/21 23:35
推 htps0763: 接觸一年ROCM,捲積演算法搜尋終於能跳122.121.195.201 06/21 23:37
→ htps0763: 過最慢了,不懂這麼簡單的實作放了這麼122.121.195.201 06/21 23:37
→ htps0763: 多年122.121.195.201 06/21 23:37
推 hangtenboy: 推推,目前用得很開心 101.10.79.248 06/21 23:44
→ ganei: 未下先推,佛心分享118.165.157.193 06/21 23:49
推 CrackedVoice: 先推再說! 110.28.105.73 06/21 23:54
※ 編輯: trfmk1 (125.229.59.186 臺灣), 06/22/2026 00:38:54
推 Rafale: 推111.240.145.138 06/22 00:56
推 skyshadow83: 推122.121.151.112 06/22 01:15
推 ss70012: 推問個anima 1024*1024 30步要多久? 36.231.93.79 06/22 01:17
我自己弄的工作量流15秒左右
掛加速LORA 10秒左右
※ 編輯: trfmk1 (125.229.59.186 臺灣), 06/22/2026 01:55:02
推 silveryiris: 先推再看 111.83.39.71 06/22 03:23
推 ganei: 忘記先前推文太近,補推一下118.165.131.169 06/22 04:16
推 Laviathan: 不分享到ai_art群組嗎?之前為了讓ma 49.216.16.132 06/22 06:25
→ Laviathan: x+395生成動畫,搞sageattention弄的 49.216.16.132 06/22 06:25
→ Laviathan: 我頭很大 49.216.16.132 06/22 06:25
只能說RDNA4是個質變
支援FP8 AI算力又大幅提升
現狀除非要玩LLM語言模型
需要很大的VRAM
生圖的擴散模型反而需要的是算力
推 aacj2642: 你們都很偉大 101.9.99.127 06/22 08:24
推 tn601374: 推 36.224.246.190 06/22 08:29
推 lolicat: 來了 昨天才剛看完小屋 結果我一換新版本 49.215.241.195 06/22 08:52
→ lolicat: 就跳了一個沒遇過的錯誤 還沒研究清楚 先 49.215.241.195 06/22 08:52
→ lolicat: 推 49.215.241.195 06/22 08:52
→ lolicat: 我只會簡單的文生圖 圖轉影片這種 太複雜 49.215.241.195 06/22 08:53
→ lolicat: 的工作流也是一陣一陣玩一下 49.215.241.195 06/22 08:54
推 dice456: 真有心 推個 124.218.134.80 06/22 09:39
推 ss70012: 感謝,amd還是很棒啊 36.231.93.79 06/22 09:40
推 vsbrm: A卡推廣大使~223.138.126.199 06/22 09:59
※ 編輯: trfmk1 (125.229.59.186 臺灣), 06/22/2026 10:00:37