🔥 PTT.BEST 批踢踢爆文 💬 八卦 Gossiping 😊 希洽 C_Chat 💰 股票 Stock 🏠 房屋 home-sale 🏀 美國職籃 NBA ⚾ 棒球 Baseball 👛 省錢 Lifeismoney 🚗 汽車 car 😡 政黑 HatePolitics 💻 電蝦 PC_Shopping 🥰 韓星 KoreaStar ✨ 英雄聯盟 LoL 🍿 電影 movie 🪖 軍事 Military 📡 通訊 MobileComm 🏀 台籃 basketballTW 🍼 寶媽 BabyMother 🇯🇵 日旅 Japan_Travel 🏭 科技 Tech_Job 👉 男女 Boy-Girl 👉 真香 CheerGirlsTW 👧 女孩 WomenTalk 👻 媽佛 marvel 💳 卡版 creditcard 👉 NS NSwitch 👉 PS5 PlayStation 👉 大氣 TY_Research 👉 婚姻 marriage 👉 台南 Tainan 👉 台中 TaichungBun 👉 Steam Steam 👉 高雄 Kaohsiung 👉 羽球 Badminton 👉 超商 CVS 👉 米哈遊 miHoYo 👉 iOS 👉 兄弟 Elephants 👉 日劇 Japandrama 👉 玄幻 CFantasy 👉 ES e-shopping 👉 WOW 👉 遊戲交易 Gamesale 👉 4X BaseballXXXX 👉 Lakers 👉 韓劇 KoreaDrama 👉 汽車買賣 CarShop 👉 機車 biker 👉 新竹 Hsinchu 👉 美保 BeautySalon 👉 串流 OTT 👉 歐美影集 EAseries 👉 手機交易 mobilesales 👉 健身 MuscleBeach 👉 MacShop 👉 Lions 👉 FGO FATE_GO 👉 中劇 China-Drama 👉 數位貨幣 DigiCurrency 👉 暗黑 DIABLO 👉 實習教師 studyteacher 👉 航空 Aviation 👉 藝文票券轉售 Drama-Ticket 👉 韓綜 KR_Entertain 👉 美妝 MakeUp 👉 速食 fastfood 👉 手錶 watch 👉 體適能 FITNESS 👉 攝影 DSLR 👉 Headphone 👉 嘻哈 Hip-Hop 👉 轉珠 PuzzleDragon 👉 美食 Food 👉 蔚藍 BlueArchive 👉 數位相機交易 DC_SALE 👉 筆電蝦 nb-shopping 👉 軟工 Soft_Job 👉 汪踢 Wanted 👉 台綜 TW_Entertain 👉 坂道閒聊 SakaTalk 👉 貓咪 cat 👉 日GO BabyProducts 👉 TypeMoon 👉 MLB 👉 職場 Salary 👉 臺劇 TaiwanDrama 👉 海賊王 ONE_PIECE 👉 PMGO PokemonGO 👉 國營 Gov_owned 👉 碧航 AzurLane 👉 家電 E-appliance 👉 布蘭德 Brand 👉 DMMG DMM_GAMES 👉 贈送 give 👉 神魔 ToS 👉 銀行服務板 Bank_Service 👉 原創 YuanChuang 👉 期權 Option 👉 重機 SuperBike
最近Andrej Karpathy 貼了一個meme https://x.com/karpathy/status/1976082963382272334 雖然他說,他只是要誇大強調太多exceptions https://chatgpt.com/share/68e82db9-7a28-8007-9a99-bc6f0010d101 上面是對話。 Karpthy是ai大神,"vibe coding"這詞也是他發明的,但寫程式不是他的強項。 這短短的幾行程式裡,有多餘的程式碼,有無效的程式碼,有dead codes。太多的exceptions只是其中一個問題 我把簡化的prompt丟到gemini,好一點,但一樣大有問題。 這其實就是我的ai coding經驗。ai slop,浪費時間。真的junior起碼不敢亂寫。ai就是倒垃圾碼出來讓你一直糾正。 之前我在本版說ai coding寫的程式有微妙的問題。但這麼久了,現在的評語就是垃圾,"ai slop"不是講假的。 ※ 引述《yamakazi (大安吳彥祖)》之銘言: : 抱歉,但你這做法有改進空間 : 如果是做演算法,優先用python 寫 : 現在主流AI寫python幾乎不可能錯 : 寫完後叫AI自己生一些測資再畫圖給你看 : 圖看完沒問題後再叫他改寫成C++ : 要特別跟他說不要亂猜 : 不懂的api和算法去看完python原始碼再來改寫 : 如果有看完原始碼再改寫的 : 我體感上幾乎不可能出錯 : 99趴沒問題 你被ai網軍洗腦太成功了,真的做了,就知道完全不是這麼回事。 Python改寫c++?你是認真的?本來只有一個問題,現在你有兩個大問題。 Cython搞那麼久,為什麼還是那麼少人用? typeless, gc, reference/ptr。光是這些差異就難搞死了。 : 剩下一趴你跟他對話也能改到好 : 再用剛剛的測資對一下bit true : 輕鬆解決 : 要進去看扣嗎? : 幾乎不用 這真是最大笑話。 現在的ai best practices就是請你一定要看程式碼。因為錯了不是ai的問題是你的問題。 還是要強調,ai不是沒有用,但現在genAi走的方向是錯的。這些ai公司要賺錢,強推各種solutions。 workslop,ai slop最近流行起來不是沒有原因的。 最後講個故事。有人在網路抱怨,說他外包程式很久了,他不期待2x或10x的ai產值,但他現在變成ai prompter,他要花很多時間去解釋為什麼回來的程式碼有問題。現在他是0.1x的發包商。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 58.114.66.74 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1760400376.A.206.html
yamakazi: Www 10/14 08:21
henrylin8086: 我再上篇文提到要一直問不如自己寫就是這原因 10/14 09:52
henrylin8086: 我Py跟C++都寫,這兩個程式語言思路差異很大 10/14 09:53
henrylin8086: 用AI根據上文給建議還不錯,但用問的我覺得比自己寫 10/14 09:55
henrylin8086: 還累,因為要一直修正。 10/14 09:55
henrylin8086: 但也可能是因為我用copilot,沒近期其他模型先進 10/14 09:58
MoonCode: 想太多了 一年兩年後這些問題不存在 10/14 10:21
NDark: 推樓上,是變化太快,任何認知都很快過時 10/14 10:39
NDark: 就我個人不擅長的領域是蠻好用的,但永遠也不會到達專精 10/14 10:40
NDark: 的程度 10/14 10:40
NDark: 如果我的問題是專精才能理解的地步,那我也看不出來有錯 10/14 10:40
Nitricacid: 推 ‘錯了不是AI的問題是你的問題’ 光這點就不可能 10/14 10:44
Nitricacid: 被AI取代了 10/14 10:44
yamakazi: https://i.imgur.com/rsh7rWG.jpeg 10/14 12:02
yamakazi: 你沒仔細看,這是他下的prompt,故意用極端的prompt來測 10/14 12:03
yamakazi: 試才會這樣,而且其實還是能用只是太多防禦性代碼而已 10/14 12:03
yamakazi: 我就問你各位誰會下「extraordinarily cautious, you ne 10/14 12:05
yamakazi: ver knows what could go wrong」 10/14 12:05
yamakazi: 你去叫一個本科新人寫一樣的東西,跟他說特別小心corner 10/14 12:06
yamakazi: case,他大概也會寫出類似東西,因為AI跟人類學的 10/14 12:06
你真的是外行人。我已經說那個程式碼有無效的,有多餘的,有dead codes,甚至完全錯誤的部份。 我也說我有簡化prompt去gemini測試。
yamakazi: 還有python 底層就是C++,你覺得python寫的東西不可能轉 10/14 12:07
yamakazi: 成C++? 10/14 12:07
richardz: 樓上python 底層是C ... 10/14 12:10
ILoveAMD: compiler 跟 transpiler 是不同概念 compiler是某個語 10/14 12:17
ILoveAMD: 言實作的 不代表能無痛轉成那個實作語言 10/14 12:17
yamakazi: 我同意不可能百分百無痛,但99趴無痛應該幾乎辦得到,而 10/14 12:22
yamakazi: 且我拿的例子是前一個人說的自適應濾波器,這幾乎百分百 10/14 12:22
yamakazi: 可以無痛轉 10/14 12:22
yamakazi: 而且自適應濾波器這東西早就出來幾十年了,搞不好年代還 10/14 12:23
yamakazi: 比python早,你說怎麼可能沒辦法用C/C++寫出來? 10/14 12:23
你還是不懂寫程式的問題。 ※ 編輯: oopFoo (36.224.199.125 臺灣), 10/14/2025 12:30:43
yamakazi: 而且你這例子和我內容天差地別,我是說有現成的python 10/14 12:34
yamakazi: 算法代碼,再請他生成測試資料,轉成C++還要做bit true 10/14 12:34
yamakazi: ,才不用審查代碼。 10/14 12:34
yamakazi: 你這例子沒有現成的代碼讓他閱讀,也沒有測資做bit true 10/14 12:34
yamakazi: ,天差地別 10/14 12:34
yamakazi: 我拿leetcode 舉例好了,線上打這種程式競賽,幾乎測資 10/14 12:36
yamakazi: 過就可以,再來不要exception不要TLE,不要memory leak 10/14 12:36
yamakazi: ,時間複雜度不要太誇張就過了,這種比賽哪有什麼評審去 10/14 12:36
yamakazi: 檢查你代碼? 10/14 12:36
yamakazi: 再來你自己寫算法也是要靠測資抓錯,寫leetcode大家都有 10/14 12:46
yamakazi: 經驗,一堆人一開始寫前幾筆測資ok,等到大點的測資一樣 10/14 12:46
yamakazi: TLE,沒測資光靠人眼review根本看不出有什麼錯誤。 10/14 12:46
lazarus1121: 讓AI寫寫method還行的吧,poc也能丟給他做 10/14 12:49
lazarus1121: 出錯難免,但整體的確能省下滿多時間 10/14 12:49
oopFoo: 生成資料不會出問題?照例子寫不會出問題?test不會出問題 10/14 13:05
oopFoo: ?你錯了,有經驗的人都知道,ai出包的機會很大。 10/14 13:06
oopFoo: Karpathy才剛說,nanoChat,沒辦法用ai寫,因為.... 10/14 13:07
WTS2accuracy: 光說不用檢查ai產的扣就能end了 0價值言論 10/14 13:08
oopFoo: "vibe coding"之父,ai大神,沒辦法用ai來寫程式,你不覺 10/14 13:08
oopFoo: 的,你需要考慮一下你的假設。 10/14 13:08
yamakazi: 你給的連結是長這樣 10/14 13:27
yamakazi: https://i.imgur.com/EJYrtCZ.jpeg 10/14 13:27
yamakazi: 你的AI之父只用auto complete,根本沒用Claude codex ag 10/14 13:29
yamakazi: ent好不好 10/14 13:29
yamakazi: 只用tab autocomplete生成的code?跟我假設天差地別 10/14 13:30
yamakazi: 也有可能我英文不好啦,不過看起來只用tab autocomplete 10/14 13:31
yamakazi: ? 10/14 13:31
yamakazi: 他的「沒辦法用ai寫」好像跟我們認知的「沒辦法用ai寫」 10/14 13:50
yamakazi: 不太一樣,他說Claude agent didn’t work well,所以沒 10/14 13:50
yamakazi: 辦法寫,但具體怎樣不work也沒講清楚 10/14 13:50
yamakazi: 終於看懂前後文了,他是說他寫nanochat不用vibe coding 10/14 13:56
yamakazi: ,不過你光講某個大神做某個專案不用Claude agent其實沒 10/14 13:56
yamakazi: 什麼太大說服力,不過你高興就好 10/14 13:56
gino0717: 南無阿彌陀佛 10/14 14:54
kuosos520: 嗯嗯,請不要用,推廣大家手工寫code 10/14 15:35
tzouandy2818: 哪個正常人會沒任何數據 卻開口就99趴99趴的叫 10/14 17:38
yamakazi: https://i.imgur.com/aZGjyYg.jpeg 10/14 17:57
wizozd84070: 雀食 10/14 18:23
abraxas: 英文都看不懂也出來跟人喊 99% 哦? 10/14 18:28
yamakazi: 拜託隨便給個X就要馬上看懂哦? 10/14 18:56
DrTech: 99%能取代推文又來了,拜託提出哪個論文或benchmark驗證出 10/14 18:59
DrTech: 99%,別靠 vibe 推文耶。 10/14 18:59
DrTech: 理性客觀討論,而不是靠"我感覺",來認為你的感覺是全世界 10/14 19:02
DrTech: 的事實。 10/14 19:02
DrTech: 拿一個濾波器演算法,來感覺全世界的程式碼都這樣,滿難說 10/14 19:04
DrTech: 服大家的。 10/14 19:04
yamakazi: 上面不都有98 100趴的了? 10/14 19:49
qqqlll666: AI就工具 難用就不要用 用下去變0.1還在用 那是人的問 10/14 19:52
qqqlll666: 題還是工具問題 AI現在就是在快速進化 剛用多少要磨合 10/14 19:52
qqqlll666: 磨合期抓短點 幾小時看不得效果就可以丟了 因為下個 10/14 19:52
qqqlll666: 月會有更好的 10/14 19:52
yamakazi: 而且很弔詭的一件事,你找軟體工程師也不會說要求這個工 10/14 19:54
yamakazi: 程師一定要通過什麼benchmark 99%,實務上也幾乎沒有人 10/14 19:54
yamakazi: 類有辦法benchmark 99 10/14 19:54
alihue: 其實現在LLM寫程式的能力已經遇到瓶頸了,不存在幾年後就 10/14 20:02
alihue: 會更好的問題,除非推出新的AI且不需要大量資料訓練就能 10/14 20:02
alihue: 自己推理 10/14 20:02
qqqlll666: auto complete 沒用? 叫他寫小scope的function沒用? 10/14 20:03
qqqlll666: 複雜功能現在的確還是很爛 因為他不會主動問 不會查 10/14 20:03
qqqlll666: 不會反抗 就算他不懂他還是會湊一個給你 因為AI訓練 10/14 20:03
qqqlll666: 就是有猜有分 10/14 20:03
qqqlll666: 想你對話那個問題 現在最法就是先叫他去survey 任何可 10/14 20:03
qqqlll666: 能意外 然後再解決 10/14 20:03
qqqlll666: 說實話你問一個人那個問題他大概只會問你要防啥 甚至 10/14 20:03
qqqlll666: 直接叫你滾一邊去 10/14 20:03
alihue: 其實看領域,如果是前端LLM來做是從從容容游刃有餘, 10/14 20:05
alihue: 出 bug 通常不致命;後端出 bug 很多是很慘的 10/14 20:05
DrTech: 上面benchmark不都有98 100趴的了? 喔,某人真的看不懂英 10/14 20:11
DrTech: 文耶,快笑死。那個98% 100%的,都不是coding的測試阿。 10/14 20:11
yamakazi: 你人去做coding測試也不會99 100趴,如果限制時間搞不好 10/14 20:15
yamakazi: 人類還0趴 10/14 20:15
yamakazi: 舉個例,10分鐘寫三題leetcode hard,就算很強的工程師 10/14 20:17
yamakazi: 可能一題都寫不出來,但十分鐘對AI來說綽綽有餘幾乎可以 10/14 20:17
yamakazi: 全對 10/14 20:17
DrTech: 所以AI可以完成99%的問題,到底在哪? 看不懂英文鬧笑話, 10/14 20:21
DrTech: 還跳針不回答大家疑問。 10/14 20:21
yamakazi: 奇怪了,我明明原文有下一些假設才能99趴,你都很喜歡自 10/14 20:24
yamakazi: 動放大解讀 10/14 20:24
DrTech: AI大師 yamakazi真是超越OpenAI的強者,OpenAI的模型,都 10/14 20:25
DrTech: 做不到的事情,coding benchmark通過率99%,yamakazi光靠 10/14 20:25
DrTech: 下prompt就超越了。真神人。 10/14 20:25
yamakazi: 有什麼好疑問的?反正不想用的人就繼續手寫我又無所謂。 10/14 20:26
yamakazi: 全世界最聰明的資料科學家和軟體工程師在開發的工具,我 10/14 20:26
yamakazi: 用就好了,少一個人用我少一個競爭對手很好啊 10/14 20:26
yamakazi: 覺得不到99趴就不要用很好啊,我幹嘛要幫你證明他有99趴 10/14 20:27
yamakazi: 然後還勸你去用XD 10/14 20:27
DrTech: 現在又跳針:不是99%是大家誤解了。 10/14 20:28
DrTech: 跳針:我說99%是對的,但我幹嘛證明99%是對的。真是笑死人 10/14 20:29
DrTech: 。 10/14 20:29
yamakazi: 你開心就好XD 10/14 20:29
Romulus: 蛤 上面那張圖和準確率完全無關耶 那是Benchmark比較耶 10/14 20:40
Romulus: 應該說那是比賽的準確率 俗稱滿分100分得幾分 10/14 20:43
Romulus: 這和你內文講的99%準確也差太多了 根本移花接木等級 10/14 20:44
Romulus: 而且每項表現不一樣 每項每個AI又不一樣 拿這個表出來說 10/14 20:45
Romulus: 這漏陷了吧 本來啥都不講還能把人唬的一愣一愣的 10/14 20:45
Romulus: 現在不就被看破手腳在超級亂吹 10/14 20:46
Romulus: 我工作上用Vibe做沒接觸過的領域&生架構然後review修 10/14 20:49
Romulus: 用得很高興也很好用 就不懂為什麼這群人要一直拿AI現在 10/14 20:49
Romulus: 根本還做不好的領域一直膨風 10/14 20:50
shortoneal: 我自己也是認為工具多碰,但是要上production這種事情 10/14 20:50
Romulus: 然後戳他牛皮就說好啊那你就不要用 講的好像他們的AI用法 10/14 20:50
Romulus: 才是對的 不照他們的用法沒那麼神就是不會用&不要用 10/14 20:50
shortoneal: 未來可期就是未來再用,別逼自己甚麼都要用 10/14 20:50
Romulus: 不熟的SDK叫AI生code比自己一個一個查文件那可快太多了 10/14 20:51
Romulus: 還不需要自己去餵食文件 反正Microsoft Learn上都有 10/14 20:52
ikachann: 通常我會先寫雛形 請ai把它完成 10/14 21:21

👉 軟工 Soft_Job 版:熱門文章

👉 軟工 Soft_Job 版:更多文章