Re: [討論] Claude開始水token

作者: LDPC (Channel Coding)   2026-04-21 04:52:56
應該會吃緊啊 現在矽谷一堆PR都用claude審 搭配人類
我們算過 一個複雜點PR claude大概花費5~20美金 然後品質比較跟人類比
只要正確搭配人類 可以省下30min ~1hr 我們這邊工時一個人都是100美金/hr起跳
現在都是用時間和token費用和品質在換算 結論就是token狂燒 幹死對家
比誰的錢多和迭代速度快 然後我們PM也捲起來 跳下來開始幹實作 和對接crossfun team
在模型設計上codex使用體感還是比claude 好 這真是出乎意料(參照下方)
有傳言codex是MoE設計 claude是dense transformer 理論上後者的邏輯順序會比較好
但缺點就是計算量和速度偏慢 前者是一定會快的 https://reurl.cc/R2LaWD
但很吃Harness上下文管理設計不然邏輯順序會亂掉
現在進行式就是 token費用 vs 人類價值 vs 速度產出 vs 系統品質搭建
看到上一篇說LLM/Agent只就只是個語言系統....嗯嗯恩 QQ 我好羨慕那個世界線
現在Agent就幹這幾件事 拆解問題 選擇工具 組合工具解問題 工具結果驗證
已經不在是個當純語言模型的問題了 這也是為啥Harness設計最近很夯
尤其最近一篇ICLR paper已經驗證 SFT去訓練模型會打輸模型加個好的Context設計
原因就是SFT會造成information collapse和失去reasoning ability

Links booklink

Contact Us: admin [ a t ] ucptt.com