作者:
oopFoo (3d)
2025-10-14 08:06:07最近Andrej Karpathy 貼了一個meme
https://x.com/karpathy/status/1976082963382272334
雖然他說,他只是要誇大強調太多exceptions
https://chatgpt.com/share/68e82db9-7a28-8007-9a99-bc6f0010d101
上面是對話。
Karpthy是ai大神,"vibe coding"這詞也是他發明的,但寫程式不是他的強項。
這短短的幾行程式裡,有多餘的程式碼,有無效的程式碼,有dead codes。太多的exceptions只是其中一個問題
我把簡化的prompt丟到gemini,好一點,但一樣大有問題。
這其實就是我的ai coding經驗。ai slop,浪費時間。真的junior起碼不敢亂寫。ai就是倒垃圾碼出來讓你一直糾正。
之前我在本版說ai coding寫的程式有微妙的問題。但這麼久了,現在的評語就是垃圾,"ai slop"不是講假的。
※ 引述《yamakazi (大安吳彥祖)》之銘言:
: 抱歉,但你這做法有改進空間
: 如果是做演算法,優先用python 寫
: 現在主流AI寫python幾乎不可能錯
: 寫完後叫AI自己生一些測資再畫圖給你看
: 圖看完沒問題後再叫他改寫成C++
: 要特別跟他說不要亂猜
: 不懂的api和算法去看完python原始碼再來改寫
: 如果有看完原始碼再改寫的
: 我體感上幾乎不可能出錯
: 99趴沒問題
你被ai網軍洗腦太成功了,真的做了,就知道完全不是這麼回事。
Python改寫c++?你是認真的?本來只有一個問題,現在你有兩個大問題。
Cython搞那麼久,為什麼還是那麼少人用?
typeless, gc, reference/ptr。光是這些差異就難搞死了。
: 剩下一趴你跟他對話也能改到好
: 再用剛剛的測資對一下bit true
: 輕鬆解決
: 要進去看扣嗎?
: 幾乎不用
這真是最大笑話。
現在的ai best practices就是請你一定要看程式碼。因為錯了不是ai的問題是你的問題。
還是要強調,ai不是沒有用,但現在genAi走的方向是錯的。這些ai公司要賺錢,強推各種solutions。
workslop,ai slop最近流行起來不是沒有原因的。
最後講個故事。有人在網路抱怨,說他外包程式很久了,他不期待2x或10x的ai產值,但他現在變成ai prompter,他要花很多時間去解釋為什麼回來的程式碼有問題。現在他是0.1x的發包商。
作者:
yamakazi (大安吳彥祖)
2025-10-14 08:21:00Www
我再上篇文提到要一直問不如自己寫就是這原因我Py跟C++都寫,這兩個程式語言思路差異很大用AI根據上文給建議還不錯,但用問的我覺得比自己寫還累,因為要一直修正。但也可能是因為我用copilot,沒近期其他模型先進
作者:
MoonCode (MoonCode)
2025-10-14 10:21:00想太多了 一年兩年後這些問題不存在
作者:
NDark (溺於黑暗)
2025-10-14 10:39:00推樓上,是變化太快,任何認知都很快過時就我個人不擅長的領域是蠻好用的,但永遠也不會到達專精的程度如果我的問題是專精才能理解的地步,那我也看不出來有錯
推 ‘錯了不是AI的問題是你的問題’ 光這點就不可能被AI取代了
作者:
yamakazi (大安吳彥祖)
2025-10-14 12:02:00https://i.imgur.com/rsh7rWG.jpeg你沒仔細看,這是他下的prompt,故意用極端的prompt來測試才會這樣,而且其實還是能用只是太多防禦性代碼而已我就問你各位誰會下「extraordinarily cautious, you never knows what could go wrong」
compiler 跟 transpiler 是不同概念 compiler是某個語言實作的 不代表能無痛轉成那個實作語言
作者:
yamakazi (大安吳彥祖)
2025-10-14 12:22:00我同意不可能百分百無痛,但99趴無痛應該幾乎辦得到,而且我拿的例子是前一個人說的自適應濾波器,這幾乎百分百可以無痛轉而且自適應濾波器這東西早就出來幾十年了,搞不好年代還比python早,你說怎麼可能沒辦法用C/C++寫出來?而且你這例子和我內容天差地別,我是說有現成的python算法代碼,再請他生成測試資料,轉成C++還要做bit true,才不用審查代碼。你這例子沒有現成的代碼讓他閱讀,也沒有測資做bit true,天差地別我拿leetcode 舉例好了,線上打這種程式競賽,幾乎測資過就可以,再來不要exception不要TLE,不要memory leak,時間複雜度不要太誇張就過了,這種比賽哪有什麼評審去檢查你代碼?再來你自己寫算法也是要靠測資抓錯,寫leetcode大家都有經驗,一堆人一開始寫前幾筆測資ok,等到大點的測資一樣TLE,沒測資光靠人眼review根本看不出有什麼錯誤。
讓AI寫寫method還行的吧,poc也能丟給他做出錯難免,但整體的確能省下滿多時間
作者: WTS2accuracy (宝鐘海賊団の一味) 2025-10-14 13:08:00
光說不用檢查ai產的扣就能end了 0價值言論
作者:
oopFoo (3d)
2025-10-14 13:08:00"vibe coding"之父,ai大神,沒辦法用ai來寫程式,你不覺的,你需要考慮一下你的假設。
作者:
yamakazi (大安吳彥祖)
2025-10-14 13:27:00你給的連結是長這樣
https://i.imgur.com/EJYrtCZ.jpeg你的AI之父只用auto complete,根本沒用Claude codex agent好不好只用tab autocomplete生成的code?跟我假設天差地別也有可能我英文不好啦,不過看起來只用tab autocomplete?他的「沒辦法用ai寫」好像跟我們認知的「沒辦法用ai寫」不太一樣,他說Claude agent didn’t work well,所以沒辦法寫,但具體怎樣不work也沒講清楚終於看懂前後文了,他是說他寫nanochat不用vibe coding,不過你光講某個大神做某個專案不用Claude agent其實沒什麼太大說服力,不過你高興就好
作者:
gino0717 (gino0717)
2025-10-14 14:54:00南無阿彌陀佛
作者:
yamakazi (大安吳彥祖)
2025-10-14 17:57:00作者: abraxas (Abr.) 2025-10-14 18:28:00
英文都看不懂也出來跟人喊 99% 哦?
作者:
yamakazi (大安吳彥祖)
2025-10-14 18:56:00拜託隨便給個X就要馬上看懂哦?
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-14 18:59:0099%能取代推文又來了,拜託提出哪個論文或benchmark驗證出99%,別靠 vibe 推文耶。理性客觀討論,而不是靠"我感覺",來認為你的感覺是全世界的事實。拿一個濾波器演算法,來感覺全世界的程式碼都這樣,滿難說服大家的。
作者:
yamakazi (大安吳彥祖)
2025-10-14 19:49:00上面不都有98 100趴的了?
AI就工具 難用就不要用 用下去變0.1還在用 那是人的問題還是工具問題 AI現在就是在快速進化 剛用多少要磨合磨合期抓短點 幾小時看不得效果就可以丟了 因為下個月會有更好的
作者:
yamakazi (大安吳彥祖)
2025-10-14 19:54:00而且很弔詭的一件事,你找軟體工程師也不會說要求這個工程師一定要通過什麼benchmark 99%,實務上也幾乎沒有人類有辦法benchmark 99
作者:
alihue (wanda wanda)
2025-10-14 20:02:00其實現在LLM寫程式的能力已經遇到瓶頸了,不存在幾年後就會更好的問題,除非推出新的AI且不需要大量資料訓練就能自己推理
auto complete 沒用? 叫他寫小scope的function沒用?複雜功能現在的確還是很爛 因為他不會主動問 不會查不會反抗 就算他不懂他還是會湊一個給你 因為AI訓練就是有猜有分想你對話那個問題 現在最法就是先叫他去survey 任何可能意外 然後再解決說實話你問一個人那個問題他大概只會問你要防啥 甚至直接叫你滾一邊去
作者:
alihue (wanda wanda)
2025-10-14 20:05:00其實看領域,如果是前端LLM來做是從從容容游刃有餘,出 bug 通常不致命;後端出 bug 很多是很慘的
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-14 20:11:00上面benchmark不都有98 100趴的了? 喔,某人真的看不懂英文耶,快笑死。那個98% 100%的,都不是coding的測試阿。
作者:
yamakazi (大安吳彥祖)
2025-10-14 20:15:00你人去做coding測試也不會99 100趴,如果限制時間搞不好人類還0趴舉個例,10分鐘寫三題leetcode hard,就算很強的工程師可能一題都寫不出來,但十分鐘對AI來說綽綽有餘幾乎可以全對
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-14 20:21:00所以AI可以完成99%的問題,到底在哪? 看不懂英文鬧笑話,還跳針不回答大家疑問。
作者:
yamakazi (大安吳彥祖)
2025-10-14 20:24:00奇怪了,我明明原文有下一些假設才能99趴,你都很喜歡自動放大解讀
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-14 20:25:00AI大師 yamakazi真是超越OpenAI的強者,OpenAI的模型,都做不到的事情,coding benchmark通過率99%,yamakazi光靠下prompt就超越了。真神人。
作者:
yamakazi (大安吳彥祖)
2025-10-14 20:26:00有什麼好疑問的?反正不想用的人就繼續手寫我又無所謂。全世界最聰明的資料科學家和軟體工程師在開發的工具,我用就好了,少一個人用我少一個競爭對手很好啊覺得不到99趴就不要用很好啊,我幹嘛要幫你證明他有99趴然後還勸你去用XD
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-14 20:28:00現在又跳針:不是99%是大家誤解了。跳針:我說99%是對的,但我幹嘛證明99%是對的。真是笑死人。
作者:
yamakazi (大安吳彥祖)
2025-10-14 20:29:00你開心就好XD
作者:
Romulus (Säubern Mode)
2025-10-14 20:40:00蛤 上面那張圖和準確率完全無關耶 那是Benchmark比較耶應該說那是比賽的準確率 俗稱滿分100分得幾分這和你內文講的99%準確也差太多了 根本移花接木等級而且每項表現不一樣 每項每個AI又不一樣 拿這個表出來說這漏陷了吧 本來啥都不講還能把人唬的一愣一愣的現在不就被看破手腳在超級亂吹我工作上用Vibe做沒接觸過的領域&生架構然後review修用得很高興也很好用 就不懂為什麼這群人要一直拿AI現在根本還做不好的領域一直膨風
我自己也是認為工具多碰,但是要上production這種事情
作者:
Romulus (Säubern Mode)
2025-10-14 20:50:00然後戳他牛皮就說好啊那你就不要用 講的好像他們的AI用法才是對的 不照他們的用法沒那麼神就是不會用&不要用
作者:
Romulus (Säubern Mode)
2025-10-14 20:51:00不熟的SDK叫AI生code比自己一個一個查文件那可快太多了還不需要自己去餵食文件 反正Microsoft Learn上都有
作者:
wuyiulin (龍破壞劍士-巴斯達布雷達)
2025-10-14 23:20:00講 LeetCode 就是沒遇過 edge case我覺得現在刷 LeetCode 最大的好處就是讓自己面對更難的問題、寫程式考慮更周全現實中比 LeetCode複雜的問題難了去,一般 LLM 還解不了新週賽問題。humble 啦 dude
作者:
oopFoo (3d)
2025-10-15 07:13:00也不是吵,只是想糾正被洗腦的部份,就像aime 2025是100%但那不是寫程式的benchmark,tau2-bench的telecom是98%,但那是agent tool的benchmark。現在agent coding其實是亂槍打鳥的方法。反正ai不會累,就一直亂打,寫到程式passedtest為止。想糾正沒有真正操作ai coding的人的錯誤認知。其實ai coding還蠻有意思的,作為輔助蠻適合的,但想取代人還要等下個突破。我等自駕等10年了,再等10年看看。
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-15 08:41:00yamakazi 連tool use是什麼都不知到,就在喊 AI coding是98%了。認真討論他也看不懂啦。Claude 在 swe-bench verified 資料集,最高跑到82%通過率。台灣y大神超越世界知名公司,達到99%。真神人。
作者:
lwecloud (CloudEX)
2025-10-15 09:10:00糾正被洗腦(X 宗教戰爭(O
作者:
yamakazi (大安吳彥祖)
2025-10-15 09:13:00糾正被洗腦XD我claude 4,4.5用到現在,每一行都有review ,這樣叫沒用過ai coding XD99趴是相對人類啦,AI 82,一般人類去寫還不知道多少勒
作者:
sperma (sperma)
2025-10-15 09:17:00對某些人來說實事求是很困難的 承認自己錯了就好像自己輸了 低人一等一樣 妙的是這種人通常都是半桶水 連基本英文閱讀都有問題 跟我說多會寫 code 騙鬼吧XD
作者:
yamakazi (大安吳彥祖)
2025-10-15 09:36:00人類方也沒提數據啊,人類有SWE bench可以看分數?人類自己都沒有benchmark 卻可以覺得人類自己做得比ai好才奇怪吧一堆東歐俄羅斯人英文不好,code照樣寫得嚇嚇叫好嗎
作者:
brucetu (sec)
2025-10-15 10:10:00寫扣跟英文相關性真的沒那麼強技術文件的英文都很清晰直白 真的看不懂還可以翻譯英文社群媒體的內容或是新聞理解能力就只是看你有沒有常在看而已 沒什麼好驕傲的 一天15分鐘滑幾篇廢文就練起來了
作者:
yamakazi (大安吳彥祖)
2025-10-15 10:13:00人類寫扣某種程度也是試錯亂槍打鳥,很少有人類可以一次寫對的,還不是要靠編譯器檢查,測資糾錯,上網查算法或用法
作者: WTS2accuracy (宝鐘海賊団の一味) 2025-10-15 11:43:00
也沒有洗腦不洗腦啦 AI無腦吹也就那幾個沒料的剩下的都在看笑話而已XDD 是要怎麼被洗腦
一個 type hint 能解決的事情,ai 竟然不知道...?
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-15 16:01:00所以AI寫程式正確率99%,到底在哪? 講半天一直跳針不回答。
作者: HaHadog 2025-10-15 16:47:00
python底層是c所以轉起來很容易 怎麼不說所有語言底層都是1跟0大家都一樣 想轉隨便轉笑死
作者:
expiate (夜露死苦)
2025-10-16 10:18:00真的佩服你們這些人浪費時間跟槓精討論,我都是看笑話的。
作者:
Romulus (Säubern Mode)
2025-10-16 10:54:00講不過就開始避重就輕,轉移焦點,顧左右而言他超級標準的完全沒料ptt牛王
作者:
NDark (溺於黑暗)
2025-10-16 11:05:00之前是 不是百分之百就是沒取代現在有退讓了 1% 算是努力有成果
作者:
yamakazi (大安吳彥祖)
2025-10-16 19:16:00樓上XD
算力最終會解決一切啦,產一段扣,自動refine個千萬次,99%真的不是問題,問題是浪費算力
作者:
NDark (溺於黑暗)
2025-10-18 22:12:00這個世界浪費的事還少做嗎希望這輩子看得見 核融合/戴森環的世界
作者:
pot1234 (鍋子)
2025-10-19 21:07:00即便很爛,我還是覺得寫的比我們新人好
作者:
yamakazi (大安吳彥祖)
2025-10-14 16:21:00Www
我再上篇文提到要一直問不如自己寫就是這原因我Py跟C++都寫,這兩個程式語言思路差異很大用AI根據上文給建議還不錯,但用問的我覺得比自己寫還累,因為要一直修正。但也可能是因為我用copilot,沒近期其他模型先進
作者:
MoonCode (MoonCode)
2025-10-14 18:21:00想太多了 一年兩年後這些問題不存在
作者:
NDark (溺於黑暗)
2025-10-14 18:39:00推樓上,是變化太快,任何認知都很快過時就我個人不擅長的領域是蠻好用的,但永遠也不會到達專精的程度如果我的問題是專精才能理解的地步,那我也看不出來有錯
推 ‘錯了不是AI的問題是你的問題’ 光這點就不可能被AI取代了
作者:
yamakazi (大安吳彥祖)
2025-10-14 20:02:00https://i.imgur.com/rsh7rWG.jpeg你沒仔細看,這是他下的prompt,故意用極端的prompt來測試才會這樣,而且其實還是能用只是太多防禦性代碼而已我就問你各位誰會下「extraordinarily cautious, you never knows what could go wrong」你去叫一個本科新人寫一樣的東西,跟他說特別小心cornercase,他大概也會寫出類似東西,因為AI跟人類學的還有python 底層就是C++,你覺得python寫的東西不可能轉成C++?
compiler 跟 transpiler 是不同概念 compiler是某個語言實作的 不代表能無痛轉成那個實作語言
作者:
yamakazi (大安吳彥祖)
2025-10-14 20:22:00我同意不可能百分百無痛,但99趴無痛應該幾乎辦得到,而且我拿的例子是前一個人說的自適應濾波器,這幾乎百分百可以無痛轉而且自適應濾波器這東西早就出來幾十年了,搞不好年代還比python早,你說怎麼可能沒辦法用C/C++寫出來?而且你這例子和我內容天差地別,我是說有現成的python算法代碼,再請他生成測試資料,轉成C++還要做bit true,才不用審查代碼。你這例子沒有現成的代碼讓他閱讀,也沒有測資做bit true,天差地別我拿leetcode 舉例好了,線上打這種程式競賽,幾乎測資過就可以,再來不要exception不要TLE,不要memory leak,時間複雜度不要太誇張就過了,這種比賽哪有什麼評審去檢查你代碼?再來你自己寫算法也是要靠測資抓錯,寫leetcode大家都有經驗,一堆人一開始寫前幾筆測資ok,等到大點的測資一樣TLE,沒測資光靠人眼review根本看不出有什麼錯誤。
讓AI寫寫method還行的吧,poc也能丟給他做出錯難免,但整體的確能省下滿多時間
作者: WTS2accuracy (宝鐘海賊団の一味) 2025-10-14 21:08:00
光說不用檢查ai產的扣就能end了 0價值言論
作者:
oopFoo (3d)
2025-10-14 21:08:00"vibe coding"之父,ai大神,沒辦法用ai來寫程式,你不覺的,你需要考慮一下你的假設。
作者:
yamakazi (大安吳彥祖)
2025-10-14 21:27:00你給的連結是長這樣
https://i.imgur.com/EJYrtCZ.jpeg你的AI之父只用auto complete,根本沒用Claude codex agent好不好只用tab autocomplete生成的code?跟我假設天差地別也有可能我英文不好啦,不過看起來只用tab autocomplete?他的「沒辦法用ai寫」好像跟我們認知的「沒辦法用ai寫」不太一樣,他說Claude agent didn’t work well,所以沒辦法寫,但具體怎樣不work也沒講清楚終於看懂前後文了,他是說他寫nanochat不用vibe coding,不過你光講某個大神做某個專案不用Claude agent其實沒什麼太大說服力,不過你高興就好
作者:
gino0717 (gino0717)
2025-10-14 22:54:00南無阿彌陀佛
作者:
yamakazi (大安吳彥祖)
2025-10-15 01:57:00作者: abraxas (Abr.) 2025-10-15 02:28:00
英文都看不懂也出來跟人喊 99% 哦?
作者:
yamakazi (大安吳彥祖)
2025-10-15 02:56:00拜託隨便給個X就要馬上看懂哦?
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-15 02:59:0099%能取代推文又來了,拜託提出哪個論文或benchmark驗證出99%,別靠 vibe 推文耶。理性客觀討論,而不是靠"我感覺",來認為你的感覺是全世界的事實。拿一個濾波器演算法,來感覺全世界的程式碼都這樣,滿難說服大家的。
作者:
yamakazi (大安吳彥祖)
2025-10-15 03:49:00上面不都有98 100趴的了?
AI就工具 難用就不要用 用下去變0.1還在用 那是人的問題還是工具問題 AI現在就是在快速進化 剛用多少要磨合磨合期抓短點 幾小時看不得效果就可以丟了 因為下個月會有更好的
作者:
yamakazi (大安吳彥祖)
2025-10-15 03:54:00而且很弔詭的一件事,你找軟體工程師也不會說要求這個工程師一定要通過什麼benchmark 99%,實務上也幾乎沒有人類有辦法benchmark 99
作者:
alihue (wanda wanda)
2025-10-15 04:02:00其實現在LLM寫程式的能力已經遇到瓶頸了,不存在幾年後就會更好的問題,除非推出新的AI且不需要大量資料訓練就能自己推理
auto complete 沒用? 叫他寫小scope的function沒用?複雜功能現在的確還是很爛 因為他不會主動問 不會查不會反抗 就算他不懂他還是會湊一個給你 因為AI訓練就是有猜有分想你對話那個問題 現在最法就是先叫他去survey 任何可能意外 然後再解決說實話你問一個人那個問題他大概只會問你要防啥 甚至直接叫你滾一邊去
作者:
alihue (wanda wanda)
2025-10-15 04:05:00其實看領域,如果是前端LLM來做是從從容容游刃有餘,出 bug 通常不致命;後端出 bug 很多是很慘的
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-15 04:11:00上面benchmark不都有98 100趴的了? 喔,某人真的看不懂英文耶,快笑死。那個98% 100%的,都不是coding的測試阿。
作者:
yamakazi (大安吳彥祖)
2025-10-15 04:15:00你人去做coding測試也不會99 100趴,如果限制時間搞不好人類還0趴舉個例,10分鐘寫三題leetcode hard,就算很強的工程師可能一題都寫不出來,但十分鐘對AI來說綽綽有餘幾乎可以全對
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-15 04:21:00所以AI可以完成99%的問題,到底在哪? 看不懂英文鬧笑話,還跳針不回答大家疑問。
作者:
yamakazi (大安吳彥祖)
2025-10-15 04:24:00奇怪了,我明明原文有下一些假設才能99趴,你都很喜歡自動放大解讀
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-15 04:25:00AI大師 yamakazi真是超越OpenAI的強者,OpenAI的模型,都做不到的事情,coding benchmark通過率99%,yamakazi光靠下prompt就超越了。真神人。
作者:
yamakazi (大安吳彥祖)
2025-10-15 04:26:00有什麼好疑問的?反正不想用的人就繼續手寫我又無所謂。全世界最聰明的資料科學家和軟體工程師在開發的工具,我用就好了,少一個人用我少一個競爭對手很好啊覺得不到99趴就不要用很好啊,我幹嘛要幫你證明他有99趴然後還勸你去用XD
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-15 04:28:00現在又跳針:不是99%是大家誤解了。跳針:我說99%是對的,但我幹嘛證明99%是對的。真是笑死人。
作者:
yamakazi (大安吳彥祖)
2025-10-15 04:29:00你開心就好XD
作者:
Romulus (Säubern Mode)
2025-10-15 04:40:00蛤 上面那張圖和準確率完全無關耶 那是Benchmark比較耶應該說那是比賽的準確率 俗稱滿分100分得幾分這和你內文講的99%準確也差太多了 根本移花接木等級而且每項表現不一樣 每項每個AI又不一樣 拿這個表出來說這漏陷了吧 本來啥都不講還能把人唬的一愣一愣的現在不就被看破手腳在超級亂吹我工作上用Vibe做沒接觸過的領域&生架構然後review修用得很高興也很好用 就不懂為什麼這群人要一直拿AI現在根本還做不好的領域一直膨風
我自己也是認為工具多碰,但是要上production這種事情
作者:
Romulus (Säubern Mode)
2025-10-15 04:50:00然後戳他牛皮就說好啊那你就不要用 講的好像他們的AI用法才是對的 不照他們的用法沒那麼神就是不會用&不要用
作者:
Romulus (Säubern Mode)
2025-10-15 04:51:00不熟的SDK叫AI生code比自己一個一個查文件那可快太多了還不需要自己去餵食文件 反正Microsoft Learn上都有
作者:
wuyiulin (龍破壞劍士-巴斯達布雷達)
2025-10-15 07:20:00講 LeetCode 就是沒遇過 edge case我覺得現在刷 LeetCode 最大的好處就是讓自己面對更難的問題、寫程式考慮更周全現實中比 LeetCode複雜的問題難了去,一般 LLM 還解不了新週賽問題。humble 啦 dude
作者:
oopFoo (3d)
2025-10-15 15:13:00也不是吵,只是想糾正被洗腦的部份,就像aime 2025是100%但那不是寫程式的benchmark,tau2-bench的telecom是98%,但那是agent tool的benchmark。現在agent coding其實是亂槍打鳥的方法。反正ai不會累,就一直亂打,寫到程式passedtest為止。想糾正沒有真正操作ai coding的人的錯誤認知。其實ai coding還蠻有意思的,作為輔助蠻適合的,但想取代人還要等下個突破。我等自駕等10年了,再等10年看看。
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-15 16:41:00yamakazi 連tool use是什麼都不知到,就在喊 AI coding是98%了。認真討論他也看不懂啦。Claude 在 swe-bench verified 資料集,最高跑到82%通過率。台灣y大神超越世界知名公司,達到99%。真神人。
作者:
lwecloud (CloudEX)
2025-10-15 17:10:00糾正被洗腦(X 宗教戰爭(O
作者:
yamakazi (大安吳彥祖)
2025-10-15 17:13:00糾正被洗腦XD我claude 4,4.5用到現在,每一行都有review ,這樣叫沒用過ai coding XD99趴是相對人類啦,AI 82,一般人類去寫還不知道多少勒
作者:
sperma (sperma)
2025-10-15 17:17:00對某些人來說實事求是很困難的 承認自己錯了就好像自己輸了 低人一等一樣 妙的是這種人通常都是半桶水 連基本英文閱讀都有問題 跟我說多會寫 code 騙鬼吧XD
作者:
yamakazi (大安吳彥祖)
2025-10-15 17:36:00人類方也沒提數據啊,人類有SWE bench可以看分數?人類自己都沒有benchmark 卻可以覺得人類自己做得比ai好才奇怪吧一堆東歐俄羅斯人英文不好,code照樣寫得嚇嚇叫好嗎
作者:
brucetu (sec)
2025-10-15 18:10:00寫扣跟英文相關性真的沒那麼強技術文件的英文都很清晰直白 真的看不懂還可以翻譯英文社群媒體的內容或是新聞理解能力就只是看你有沒有常在看而已 沒什麼好驕傲的 一天15分鐘滑幾篇廢文就練起來了
作者:
yamakazi (大安吳彥祖)
2025-10-15 18:13:00人類寫扣某種程度也是試錯亂槍打鳥,很少有人類可以一次寫對的,還不是要靠編譯器檢查,測資糾錯,上網查算法或用法
作者: WTS2accuracy (宝鐘海賊団の一味) 2025-10-15 19:43:00
也沒有洗腦不洗腦啦 AI無腦吹也就那幾個沒料的剩下的都在看笑話而已XDD 是要怎麼被洗腦
一個 type hint 能解決的事情,ai 竟然不知道...?
作者:
DrTech (竹科管理處網軍研發人員)
2025-10-16 00:01:00所以AI寫程式正確率99%,到底在哪? 講半天一直跳針不回答。
作者: HaHadog 2025-10-16 00:47:00
python底層是c所以轉起來很容易 怎麼不說所有語言底層都是1跟0大家都一樣 想轉隨便轉笑死
作者:
expiate (夜露死苦)
2025-10-16 18:18:00真的佩服你們這些人浪費時間跟槓精討論,我都是看笑話的。
作者:
Romulus (Säubern Mode)
2025-10-16 18:54:00講不過就開始避重就輕,轉移焦點,顧左右而言他超級標準的完全沒料ptt牛王
作者:
NDark (溺於黑暗)
2025-10-16 19:05:00之前是 不是百分之百就是沒取代現在有退讓了 1% 算是努力有成果
作者:
yamakazi (大安吳彥祖)
2025-10-17 03:16:00樓上XD
算力最終會解決一切啦,產一段扣,自動refine個千萬次,99%真的不是問題,問題是浪費算力
作者:
NDark (溺於黑暗)
2025-10-19 06:12:00這個世界浪費的事還少做嗎希望這輩子看得見 核融合/戴森環的世界
作者:
pot1234 (鍋子)
2025-10-20 05:07:00即便很爛,我還是覺得寫的比我們新人好