作者:
chochola (chochola)
2026-03-31 01:46:02大家晚安,
最近在開發一個自動化測試的小玩具 OpenTestX,想說來板上取暖
原本是想說現在 AI 這麼紅,拿來產測試腳本應該很爽?
結果試了幾次發現 AI 根本是通靈,產出來的東西語法雖然會動,但商業邏輯亂噴一通,
改那個腳本的時間我拿來手動測還比較快
後來想說換個思路,既然我們本來就有一堆寫好的 Test cases 了,為什麼不直接餵給 L
LM 叫它幫我轉成Skill.md?
這工具大概在幹嘛:
1. 把你原本那些 Excel 裡的測試案例直接匯入。
2. 用 LLM 去理解內容,把它變成一個一個會動的 Skill。
3. 這樣就不用怕 AI 瞎猜邏輯,因為邏輯是你原本就定好的。
這東西現在還超陽春,功能很不完整,很多地方我都還沒修好,大概只有 0.1 版的程度
(請輕噴)。UI 很醜,有些邊緣情況跑起來會噴錯,但我目前還在持續補坑。
也附上GitHub ,讓有興趣的人可以 clone下來玩玩看:
https://github.com/BobChochola/openTestX
想問問板上測試的大大們,現在大家都怎麼處理 AI 邏輯亂跳的問題?
或是這種既有案例轉 Skill的做法有沒有什麼我沒想到的雷點
手機發文如果排版不優請見諒
編輯:把文章連結移除
作者:
labbat (labbat)
2026-03-31 02:10:00沒有頭緒,畢竟如果案例有規則那就不是案例了太多需要逐案判斷的東西了
品質把關的 system test 自己手動弄啦特別是 AI 對一些突然冒出來的「例外」很弱,因為他並不真的知道你的結果看上去要怎麼樣,太多細節是你文字沒辦法提供的了,就算你某個按鈕按下去會有個兔崽子跑出來跳曼波舞只要該跳的有跳AI也會跟你回報一切正常。
作者:
USD5566 (美金五千五百六十六)
2026-03-31 12:10:00這裡不是用來蹭medium點閱的請將文章重點貼出
作者:
CoNsTaR ((const *))
2026-03-31 12:19:00如果是未成年跑出來跳脫衣舞它就會改成回報 I'm a safe and helpful ai assistant 了 /s
講清楚就沒有所謂邏輯亂跳的問題~通常都是你講不清楚
/skill-creator @testcase.xlsx
邏輯好像有點怪,test本來就是看規格決定測試手法。你叫他看code去釐清要QA的項目有點詭異?這應用場景是手測QA還是軟體測試的QA? 然後如果某個button原本是方的要測有沒有改成圓的 會不會出現時間序錯誤的問題 導致怎麼測都會有問題?
不是這樣弄得 AI時代驗證的品質和角遠比code重要的多
作者:
pttano (pttano)
2026-04-01 18:16:00這個能幹嘛?
作者: guanting886 (Guanting) 2026-04-01 21:50:00
不太懂,你的專案Ai幫你寫Test會亂跳,但你另外做工具就不會,有沒有一種可能原因是你專案的Test本身就有存在一些問題以及給你他的指示不夠清楚你給他^
作者:
labbat (labbat)
2026-03-31 10:10:00沒有頭緒,畢竟如果案例有規則那就不是案例了太多需要逐案判斷的東西了
品質把關的 system test 自己手動弄啦特別是 AI 對一些突然冒出來的「例外」很弱,因為他並不真的知道你的結果看上去要怎麼樣,太多細節是你文字沒辦法提供的了,就算你某個按鈕按下去會有個兔崽子跑出來跳曼波舞只要該跳的有跳AI也會跟你回報一切正常。
作者:
USD5566 (美金五千五百六十六)
2026-03-31 20:10:00這裡不是用來蹭medium點閱的請將文章重點貼出
作者:
CoNsTaR ((const *))
2026-03-31 20:19:00如果是未成年跑出來跳脫衣舞它就會改成回報 I'm a safe and helpful ai assistant 了 /s
講清楚就沒有所謂邏輯亂跳的問題~通常都是你講不清楚
/skill-creator @testcase.xlsx
邏輯好像有點怪,test本來就是看規格決定測試手法。你叫他看code去釐清要QA的項目有點詭異?這應用場景是手測QA還是軟體測試的QA? 然後如果某個button原本是方的要測有沒有改成圓的 會不會出現時間序錯誤的問題 導致怎麼測都會有問題?
不是這樣弄得 AI時代驗證的品質和角遠比code重要的多
作者:
pttano (pttano)
2026-04-02 02:16:00這個能幹嘛?
作者: guanting886 (Guanting) 2026-04-02 05:50:00
不太懂,你的專案Ai幫你寫Test會亂跳,但你另外做工具就不會,有沒有一種可能原因是你專案的Test本身就有存在一些問題以及給你他的指示不夠清楚你給他^