Re: [心得] AI的人性

作者: oopFoo (3d)   2026-04-07 03:06:40
二月後,anthropics改了一些東東
https://news.ycombinator.com/item?id=47664442
adaptive thinking default (Feb 9)
Medium effort (85) default on Opus 4.6 (Mar 3)
事情鬧大是因為
https://github.com/anthropics/claude-code/issues/42796
說Claude變很笨,這段時間寫的codes現在正在靠Codex5.4重新改寫。
寫issue的人說,那些defaults都改過,還是一樣笨。八點檔繼續演
※ 引述《cateran (雲川閒步)》之銘言:
: 最近工作上解一個問題用opus 4.6發生一個快讓我笑死的狀況
: 背景是本公司巨大的c++應用程式在某個情況下crash
: 餵log請AI檢查後很快就查查資料改好一版
: 說是因為某某某情況所以本來的map找不到查詢的指標
: 回傳一個out of bound的index value
: 新程式新增了一段進階檢查的迴圈應對特殊狀況
: 改好後跑原本測資還是crash
: 把log餵回AI請他再看看
: 結果第二版竟然把之前的修改全部拿掉
: 只在上層呼叫端加一個fallback說指標找不到就直接回傳0
: 還沾沾自喜跟我說 阿這樣就絕對不會crash了 很棒吧
: 我只好質問agent 阿你這樣只是把問題掩蓋住 這樣對嗎?
: AI也毫不掩飾的說 你說得沒錯 我不該這樣
: 最後AI給出的第三版總算把問題從底層修好
: 不禁在想第二版那種天兵解法的思路到底是怎麼出來的
: 是因為訓練資料也包含一些菜鳥工程師的程式嗎
: 有沒有AI大神可以解釋這種狀況
你確定有改好?其實埋了更多炸彈?
news.ycombinator 那篇很精彩,一堆人事後諸葛說我也發現Claude變笨了,然後一推人說reddit早就吵翻了。
其實還滿慘烈的。這麼多人用的ai,變笨,使用的人埋了一堆炸彈,現在要如何拆彈?
作者: jobintan (Robin Artemstein)   2026-04-07 07:43:00
往好的方向思考,這是給人類工程師製造機會,給想著用AI去人類的慣老闆們賞一巴掌。wwwww
作者: yamakazi (大安吳彥祖)   2026-04-07 10:36:00
裝笨讓你優越感一下
作者: Obama19 (^_^)   2026-04-07 10:40:00
有新模型快出來都會變笨 都演幾次了
作者: yamakazi (大安吳彥祖)   2026-04-07 10:44:00
就跟新手機新晶片新的方案出發出發之前,舊的偷降速降頻一樣,擠牙膏
作者: freeunixer (御劍客)   2026-04-07 13:20:00
還好我前兩個月都在打混沒用 ai (~誤
作者: sarsman (DeNT15T♠)   2026-04-07 13:25:00
說到底不就沒在review才導致這樣==
作者: USD5566 (美金五千五百六十六)   2026-04-07 15:35:00
重點不是笨不笨 而是你們是工程師然後居然跟一般人一樣在討論語言模型根本不存在的人格人性zzzzz 拜託這個板是認真的嗎
作者: zxc8787 (摸斗哈壓庫)   2026-04-07 15:54:00
樓上說的有道理==
作者: peterturtle (peter_turtle2000)   2026-04-07 17:54:00
我們還在機台上放乖乖呢,討論個人格人性怎麼了 www
作者: ManInBlack (阿闕)   2026-04-07 18:54:00
把物體擬人化確實是有幫助大家了解抽象的東西啦一本正經胡說/取悅使用者/降低思考強強度真的蠻「人」的XD
作者: yamakazi (大安吳彥祖)   2026-04-07 21:05:00
這不是腦補Karpathy用自動補全不是用agent的原Po嗎?之前還腦補使用claude code只是下prompt不是用agent把claude code想成下prompt和自動補全
作者: abccbaandy (敏)   2026-04-07 21:18:00
笨不笨難說,但Opus確實貴...
作者: superpandal   2026-04-07 22:32:00
對於工程師而言本來就有更適合的工具 除非本來就不會把這類工具當浮木的才會一直吹 效率工具本身也是工程師私有遠控CP值才高

Links booklink

Contact Us: admin [ a t ] ucptt.com