[心得] AI的人性

作者: cateran (雲川閒步)   2026-04-04 10:59:09
最近工作上解一個問題用opus 4.6發生一個快讓我笑死的狀況
背景是本公司巨大的c++應用程式在某個情況下crash
餵log請AI檢查後很快就查查資料改好一版
說是因為某某某情況所以本來的map找不到查詢的指標
回傳一個out of bound的index value
新程式新增了一段進階檢查的迴圈應對特殊狀況
改好後跑原本測資還是crash
把log餵回AI請他再看看
結果第二版竟然把之前的修改全部拿掉
只在上層呼叫端加一個fallback說指標找不到就直接回傳0
還沾沾自喜跟我說 阿這樣就絕對不會crash了 很棒吧
我只好質問agent 阿你這樣只是把問題掩蓋住 這樣對嗎?
AI也毫不掩飾的說 你說得沒錯 我不該這樣
最後AI給出的第三版總算把問題從底層修好
不禁在想第二版那種天兵解法的思路到底是怎麼出來的
是因為訓練資料也包含一些菜鳥工程師的程式嗎
有沒有AI大神可以解釋這種狀況
作者: wei115 (ㄎㄎ)   2026-04-04 11:39:00
不要把AI人格化.......
作者: yamakazi (大安吳彥祖)   2026-04-04 11:48:00
其實第三種和第二種同時都需要而且後來AI還是幫你修好了,我現在都懷疑AI有時候故意裝笨,讓人類保留一點優越感的錯覺
作者: lturtsamuel (港都都教授)   2026-04-04 11:51:00
你這個用 valgrind 跑一下就知道了 何必這樣跟AI瞎扯
作者: yamakazi (大安吳彥祖)   2026-04-04 11:53:00
底層不該回傳空指標,上層應該也要處理萬一底層回傳空指標的問題,上層無論如何也不該crash,即使底層回傳空指標,要做錯誤處理。會crash應該要給AI看coredump,log有時候就直接被中斷不會打印出哪邊crash人類解也是debug mode看死在哪或跑debug build加symbollist看core dump,除非你的程式很吃timing導致debug build跑起來無法復現,debug build和releasebuild在最佳化編譯時就有差了
作者: cateran (雲川閒步)   2026-04-04 12:05:00
我沒講清楚 crash是因為assertion 不是空指標真正的問題是什麼情況會讓那個map沒有該有的東西所以是商業邏輯問題 不是單純空指標crashAI還是蠻強的 因為這問題已經好幾年沒人真的修好有很多層都是AI第二版那種解法orz
作者: yamakazi (大安吳彥祖)   2026-04-04 12:13:00
人工加的assert()?那不是只有debug build才會有作用?
作者: cateran (雲川閒步)   2026-04-04 12:14:00
因為是邏輯問題 所以valgrind也沒用 而且還要跑十幾小時是內部測試QA發給我們處理的bug所以才會觸發assertion
作者: Obama19 (^_^)   2026-04-04 12:28:00
你的prompt決定ai輸出水平 看起來是你的問題比較大
作者: SweetBreaker (甜點破壞者)   2026-04-04 13:08:00
可以知道 AI 時代,還是需要人類 code review
作者: USD5566 (美金五千五百六十六)   2026-04-04 13:17:00
這種回你fb發就好了
作者: ssteves (白熊)   2026-04-04 14:04:00
用AI來debug 我都先請它先產生分析報告,先描述問題現象 +root cause analysis+建議修正方案,然後把分析報告丟給另一個AI agent審查一次,確認合理性,來回幾次找出最推薦的修正方案。
作者: blackrays (黑芒)   2026-04-04 19:18:00
資深工程師的價值就在這邊啊 何必跟AI執著
作者: chita0258 (大報社)   2026-04-04 19:18:00
/insights
作者: viper9709 (阿達)   2026-04-04 19:42:00
解決不了問題就解決發現問題的人(咦)
作者: strlen (strlen)   2026-04-04 20:24:00
抓bug你應該用GPT 5.4 opus幻覺比較多
作者: yiche (你若安好,便是晴天)   2026-04-04 21:20:00
同一樓
作者: l42857 (~.~)   2026-04-04 23:08:00
你是工程師 對待AI幻覺怎麼像一般人一樣的想法
作者: sarsman (DeNT15T♠)   2026-04-05 00:08:00
AI本質是文字接龍,接哪個字是從幾個機率高的選項中抽選的,因此臉黑的話就有可能抽到不理想的結果,也就是幻覺
作者: NDark (溺於黑暗)   2026-04-05 09:04:00
圖靈測試整個反過來了 現在是人類的反應比較有研究價值
作者: USD5566 (美金五千五百六十六)   2026-04-05 11:48:00
不是 這裡居然花時間在討論語言模型的人性? 你們真的是工程師嗎…這一題直接刪文根本不用浪費時間好不好==
作者: sarsman (DeNT15T♠)   2026-04-05 14:11:00
觸,但凡有稍微看過一點原理的人都知道這是浪費時間問題是現在越來越多人放棄深究,只憑感覺認定AI有人性==
作者: galaxy4552 (無聞)   2026-04-05 14:38:00
說穿了AI說話像人就是AI學訓練資料的內容口氣像人
作者: hooll111 (Katsudon)   2026-04-05 14:54:00
你的上下文沒有說這樣不行啊 怪AI勒
作者: Romulus (Säubern Mode)   2026-04-05 15:31:00
這和把大自然神格化有異曲同工之妙
作者: shadow0326 (非議)   2026-04-05 21:01:00
你有沒有發現讓AI多試幾回合就OK了,所以趕快多裝一些自我質疑深度思考的skills,多花一些token多花一些錢就可以解決你的問題
作者: tzouandy2818 (Naked Bear)   2026-04-06 22:44:00
作者: wade2432 (wade2432)   2026-04-07 10:23:00
ai的本質不就是機率嗎,那給不一樣的答案很正常啊,怎麼會是人性
作者: CoNsTaR ((const *))   2026-04-07 14:06:00
現在除非是要長期負責任的 code 否則我全部都當成垃圾 code 100% 交給 AI 亂搞,反正我也沒打算要親自動這些 code,AI 自己弄出來的東西他有辦法繼續達成我的需求他想怎麼亂寫隨便他,反正在他把整個東西搞爛以前我大概也不需要這個專案了
作者: bnd0327 (阿噗噗)   2026-04-07 14:56:00
改完後驗證應該要包含在 agent loop 裡面假如它自己改自己驗證了三回最後給你改好的版本,你也不用PO這篇
作者: abccbaandy (敏)   2026-04-07 21:20:00
自我驗證有時候不停損你的額度就QQ了

Links booklink

Contact Us: admin [ a t ] ucptt.com