Re: [心得] token maximum pacino PTT批踢踢實業坊

Re: [心得] token maximum

作者: pacino (carry me) 2026-03-07 10:12:44

看了這兩串, 充滿了疑問..
想討論一下這個主題： token
(1) 每個LLM 都有自己的max. tokens
這是在training model時就要決定的
(2) max output tokens是讓agent在送給LLM 之前處理用的，避免超過LLM model的max. to
(3) rules 沒被執行，有可能是context可能超過LLM model的max. tokens, agent 主動壓?
這樣不就解釋了兩串原po的問題？
麻煩指正，若我的了解有誤。

作者: DrTech (竹科管理處網軍研發人員) 2026-03-07 14:26:00

1. LLM什麼時後會停止回答，跟你設定多長的 max output token無關。2.max output token不是寫在prompt裡面。

作者: DrTech (竹科管理處網軍研發人員) 2026-03-07 22:26:00

1. LLM什麼時後會停止回答，跟你設定多長的 max output token無關。2.max output token不是寫在prompt裡面。LLM要停止輸出，不看max output tokens，是看有沒有算出EOS token。與你怎麼設定OS環境變數，是否放在prompt無關。按錯，我不是要噓。完全錯誤。首先，LLM本身不會回傳error或output error。丟太長的文字序列或向量進去，向量長度不合，"應用層程式碼"(例如pytorch)就報error了。LLM根本沒處理，更不會回傳error,。另外，Max output token，不是給agent看的。在預設的情況，agent 做任何選擇，agent輸出什麼文字，根本不看Max output token設定多少。 max output tokens通常是設定在serving service層(例如vllm)跟agent根本無關。簡單話：控制LLM輸出的長度，永遠不是LLM在做。是應用層程式碼在做。agent或LLM不會把關長度的。

繼續閱讀

Re: [請益] 技能樹有點點歪了怎麼拉回來joywilliamjo [徵才] IT資訊工程師lin774 [問卷] 求職品牌認知調查 (抽Apple Watch )PGennnnis [徵才] Tradow 投資團隊實習生招募 | 台北tradow [請益] 軟體業薪資gary82gary Fw: [系統] Gemini共同設計 CUE：Cosmos編程語言草案amidha Re: [心得] token maximumleicheong [分享] Sprint tasks 排程小工具 Schevoyachting Re: [討論] 再認真吹捧一次 AIpttano Re: [請益] 遠端控制ai cliart1