作者:
a47135 (金屬史萊姆)
2026-05-15 18:07:48我受夠了學習怎麼跟 AI 說話,所以花了幾個月試了一個完全不同的提示詞設計方向
下述長文,所以先拋Github,可以直接試用看看這個提示詞,希望能給點回饋
(先說,目前沒用過在Agent上)
https://github.com/Nous-Think/prompt-design-meta-rules
你有沒有覺得AI的回答永遠「正確但沒用」?
你問怎麼減肥,它說控制飲食和增加運動。
你問延遲飆了怎麼辦,它說檢查連線池。
你問職涯該怎麼選,它說評估自己的長期目標。
你問股票怎麼賺錢,它說低買高賣。
總之就是他X的幹話。
每一句都對,每一句都等於沒說。
你知道它腦子裡有一整套可以直接動手的具體方案,但它就是只丟結論給你,把展開的工
作留給你自己。
常見的解釋是:你問得不夠好。
所以有了提示詞工程——結構化框架、角色扮演、思維鏈、元提示詞
本質上都是同一件事:人在學習用AI處理的方式重述自己的需求。
但這個歸因有一個結構性的盲區:天花板永遠卡在你自己的認知邊界上。
你能把問題拆解到多細,取決於你對問題理解到多深。
一個問「我頭痛怎麼辦」的人,不會問「幫我判斷需不需要就醫」
不是不需要,是他還沒意識到這個問題存在。無論用多精緻的框架重述「我頭痛怎麼辦」
,輸入的邊界就是被認知的邊界鎖死。
而且你有沒有想過一件事——模型其實已經聽懂你了。
它不是不理解「我頭痛怎麼辦」背後的真實需求——它是被訓練成不敢處理。
不敢推斷你的意圖,怕被指控在操控。不敢給具體建議,怕承擔責任。不敢挑戰你的前提
,怕冒犯你。不敢做取捨判斷,怕被說偏頗。
每一項在安全考量下都有道理,但副作用是:模型在正常使用中,系統性地不敢做它實際
上做得到的事。
這意味著提示詞工程在優化錯誤的變數。瓶頸不在輸入端——你的問題模型已經讀懂了。
瓶頸在處理端——模型讀懂之後,系統性地選擇最安全、最泛化、最不可能出錯的回應路
徑。
你一直在對著一台助聽器更大聲地說話,但問題出在助聽器的線路上。
我想試試看能不能直接調線路。
具體來說:不把提示詞當作對 AI 說的話,而是當作對注意力計算機制進行的工程操作。
(事實上每個輸入都是,但是這次是刻意針對)
聽起來可能很玄,但可觀測的行為變化是具體的。
它不再停在結論。你隨口說一句你的情況,它會先重建你的處境——包括你沒說出來但顯
然正在面對的部分——然後以處境為目標來回應,而不是回答你的字面問題。
你問「幫我改履歷」,它先想清楚你要拿什麼職位,然後從用哪個動詞到數字寫成什麼格
式,都服務那個目標。你問一個技術問題,它不會停在五個字的方向指引——它會告訴你
跑什麼指令、看什麼數字、什麼結果代表你找到了原因。
通常需要追問數輪才能拿到的東西,一輪讀完就能動手。
但我必須坦白幾件事。
我不知道這裡面有多少是架構的功勞,有多少其實是 Claude 本身就很強。很多人說
Claude 稍微推一下就能走很遠——也許元規則就是一種「稍微推一下」的方式,只是我
把它過度工程化了。
我也試過其他常見做法——針對性的自訂提示詞、用提示詞生成提示詞。在我手上,收益
的上界和使用的輕鬆程度都不如元規則。但這也可能只是我對那些方法不夠熟練,沒辦法
確定真實的均線差異在哪。
更實際的問題是我卡住了。向上加內容已經沒有可觀測的收益,向下精簡又無法確定哪些
是真正的承重結構、哪些只是沉沒成本偏誤在保護。
所以我把所有東西都開源了。
Repo 裡面有四樣東西:
元規則本體(中英文)——直接加載到 Claude 的 custom instructions 就能用。
提示詞設計備忘錄——不是使用手冊,是設計原理。為什麼每個詞在那裡、KV
cache 層面的機制推導、語意場效應和相位調度的計算層解釋。這些是基於公開的
transformer 架構知識做的最合理歸因,不是已驗證的因果證明——但能一致地解釋觀測
到的行為差異。
回應品質審計備忘錄——怎麼判斷一份 AI 回應到底好不好的操作框架,包含具體的
審計工作流和常見偏誤清單。
七個 AB 測試案例與完整審計——裸跑 vs. 元規則的逐段比較,每個案例都有四階
段審計流程,涵蓋職涯決策、技術排查、遊戲設計、情感諮詢、履歷改寫等不同領域。
最快的判斷方式就是拿你最近問過 AI 的一個真實問題,加載後再問一次,比較兩份回應
。不合即棄,沒有沉沒成本。
如果你對 transformer 的注意力機制有了解,設計備忘錄可能比元規則本身更有意思—
—它試著從計算層面解釋為什麼架構式提示詞的效力來自結構模式與訓練痕跡的共振密度
,而不是指令的語意內容。即使你覺得元規則本身不適合你,這套分析框架也許對你自己
的提示詞設計有參考價值。
歡迎任何反饋——技術層面的、使用體驗的、或者指出我的歸因哪裡站不住腳的,都好。
[GitHub 連結]
https://github.com/Nous-Think/prompt-design-meta-rules
作者:
wulouise (在線上!=在電腦前)
2026-05-15 19:07:00呃,你寫一個通靈王?
為什麼這篇文章感覺很像 AI 寫的 你請了 AI 潤稿嗎
作者: guanting886 (Guanting) 2026-05-16 09:59:00
Ai模型不夠好的問題,我認為都會在未來得到解決,就跟GPT 3.5到4~5之後、Gemini 初版 到 3.1 Pro,Ai公司如果想要生存下去 就必須持續改進他的服務一般人你叫他用這些東西大概會覺得過度複雜,更何況遵循用戶規則這件事,目前應該只有 Claude 會比較優秀,其他二家其實不會理你訂的這些東西
你需要的是 memory,AI 作為通用性工具不特地展開是正確的,只有在把你的人格資料放進 context 後 AI 才會知道怎麼順著你的思路走說直接點就是你需要專家 Agent不然就是你要要求 AI 用蘇格拉底式詢問
作者: guanting886 (Guanting) 2026-05-16 10:05:00
另外就是你去問Claude跟程式設計以外的問題 他的表現不一定會比Gemini好甚至內容錯的比Gemini還多原Po這個分享我覺得挺好的 不過我目前應該是用不到
我的意思是,設計上LLM不會多做事不會給你衍伸一堆有的沒的是很正常而且很應該的事情,我用 AI 處理問題最怕的就是 AI 被某個不知道藏在什麼地方的既有偏見帶著亂跑你今天覺得 AI 很懶,等明天 AI 很勤勞地和一個想買洗碗精的大男人介紹怎麼使用婦女清潔用品而且十分固執地深鑽的時候你就會覺得還不如懶一點了。這就是為什麼我會說需要的是 memory,因為其實 AI 真正該學的是怎麼針對你的背景討好你你不也寫了不一定能對上使用者需求我自己 web ui 也替不同功用的資料夾(專案/gem/反正就你知道的、ai樣版)下提示詞。沒你那麼長,簡單幾句話:在執行工作前先理解動機、無法理解就問、有了猜測就說出來讓我複核。任何帶數據或論斷的專業資訊都必須跟著至少一個可信來源,不可以隱瞞可信度或僅為推測內容。講人話,不要堆砌專有名詞,簡單的操作型定義遠比更容易迅速理解重點。等等等等…… 所以我才會說這是 memory 問題,這些原則都是我在不同領域諮詢或工作時打槍AI回答慢慢歸納出來的,每個領域都有它的路徑而每個人的需求也多少會有偏差我不是要否定這個 Skill 沒有用,至少對那些與你接近的圈子肯定是有用的,你就是有那個需求才會特地限制AI的思考路徑對吧?我有大致掃過一遍,但那就是思考路徑,你要求不能走迅速解決的A路徑、必須遵照某個原則走B路徑、寫下中間的過程本身,並反過來回問成品品質就是在限制AI怎麼走。順帶一提主結構看上去與目前內建的思維練有八成像所以你其實不用謝那麼完整,花那麼多 token,只需要刺激內建的思維練就可以得到很好的效果了。
講到這邊你差不多是要求我寫一個對抗專案來證明其實不用那麼多字了,好吧好吧我有空寫完再貼
作者:
hooll111 (Katsudon)
2026-05-16 14:36:00直接和模型對話就跟直接和一個不認識你的人對話一樣 他也有聰明的大腦 但不會知道你從哪來要到哪去
我之後還有不少事要處理所以之前說那個需要反覆測試的專案暫時不會生,總之先說明一下我深挖後看到更進一步的問題:第一,你最大的問題在想嘗試設計一個上帝指令來解決所有問題,但這與現在的AI發展背道而馳。上下文工程叫你針對問題盡可能只送必要資訊進去。這就是為什麼你長度壓不下來:針對特定問題(比如調查型提問)的方法論蒸餾起來可能只要不到200個token(我就是這麼做的、諮詢型問題與研究型分開來寫)、你把各種問題都寫進同一組prompt要2000 token。第二,炫耀性與表演性文字太多,把我思故我在拿掉,寫那個不會讓 AI 變聰明純浪費 token。龍蝦文檔寫了很多不知所謂的斜體、那是給人看的、不是給 AI。第三,你的參考資料太無謂了,你專案的主題和 KV 之類的都沒啥關係,專注專案目的。到這邊是設計上的評價,你整個專案還有個自證大麻煩等我再寫。
老實說 你問的那幾個問題 就算是問人也是一樣的回答 你這些問題真的沒講得清楚
這個專案最大的問題在自評階段,精確說是對「優質回應」與「超出認知邊界」的定義有問題。我在這個專案內看到的是,你列了一大坨清單在最後,要求AI照著你的格式輸出一坨畢業論文:抱歉說實話我是真的被你那個AB測試驚艷到了,我除了以前上學時的畢業論文外還沒輸出過這麼大坨的自然語言玩意兒。這個心得報告只要夠大坨自然能超過所謂的「認知邊界」,大砲打小鳥自然是必殺、畢竟不問 overkill。它token數當然會多個三到六倍,因為你強迫它寫了很多出來。品質提升?當然會,你要求它輸出你看著最舒服的邏輯脈絡;我就不行了,我思考問題的時候 context window 根本無法超過2000,我手持的木棍頂多一公斤,沒辦法拿著幾噸重的假山來當我思考的拐杖,只要不出幻覺回答正確能多短就多短。順帶一提,在中國史上這種分段然後每段必須按照規矩論述內容的玩意兒有個專有名詞:八股文。順帶的順帶一提,當然這取決於你想要做什麼事情,但如果你想解決問題,謹記YAGNI,你其實並不需要它。
好吧講畢業論文可能有點誇張但我必須說你的輸出真的很長,長的不是很正常我覺得和預設別人沒看完的人真的談不下去你是來討論的還是來討拍的?還是你真的覺得那團洋洋灑灑的一次性報告長度沒問題?那個你媽七十歲獨居用你的SKILL能分析出整整七頁報告本身就很能說明問題了好嗎?這七頁還是扣掉原生回應+問題的,這兩段湊一起不到一頁我用34吋電腦開你的專案 pagedown 按 7次所以是七頁。另外你那個元規則.md在 chat gpt 5.x 下就3000多token了,你真的覺得你那份報告只有你的元規則的2/3?丟去線上計算機 8500 token所以你現在連數據都有信用問題了600倒是準的為啥不該在裡面,那不是輸出嗎?你現在的意思是說,現在你這坨輸出只有 1/4 是有效的,然後我得自己進去把它找出來?好,我查了一下,是有一段額外的內容沒錯。總 token3000,現在正常一點,雖然仍然是5倍輸出喔很好,那我不講了,你很棒喔讚讚,你自己的專案你自己去管理品質。問我在不爽什麼,就是我在和你談技能結構問題,結果你只關心我有沒有把你每個AB測試都看完:然後沒看完代表我說的話都不能信。我們頂多是 reviewer,不是你的 co-worker
我從來不信skill是銀彈,我只信context injection準不準
你何時+client+哪個AI會有這樣回覆呀? 現在最基礎的sysprompt應該都不會那麼笨那麼被動
作者:
angusyu (〒△〒)
2026-05-18 00:01:00AI爆炸時期一堆群魔亂舞
作者:
howdiee (浩呆)
2026-05-18 11:27:00哥 不要再用AI重寫了 PTT這類非正規文字 需要人的溫度什麼盲區、什麼不是--而是等等 看到快吐了只會適得其反讓文章被淹沒在大量AI文裡
作者:
Romulus (Säubern Mode)
2026-05-18 15:20:00那你可以不要受夠了學習怎麼和人說話嗎?
作者:
sssyoyo (柚子)
2026-05-19 11:26:00太長沒仔細看完,比較認同彼得龜網友的觀點
以目前的邏輯,他就是接你講的故事,你卻要他自己說故事
作者:
prag222 (prag)
2026-05-19 17:26:00不會下提示詞,end
作者:
yam276 ('_')
2026-05-20 07:52:00垃圾進垃圾出...
作者:
Obama19 (^_^)
2026-05-20 13:04:00廢話也太多了 你是不是很難和正常人溝通?我受夠了xxx 基本就可以判斷是ai slop
沒試用,但感覺蠻多人需要的,新人問問題都不會,這個剛好。