作者:
arrenwu (鍵盤的戰鬼)
2026-05-04 14:13:27※ 引述《area223672 (JOJO的奇妙比喻)》之銘言:
: 之前都用gemini問東西也是幻覺嚴重
: 那麼最新的5.5模型
: 叫他查攻略
: 例如蔚藍檔案國際服競技大賽前五十名芒打隊伍推薦
: 他會查給我正確資訊嗎
這個問題會出現,
我不禁懷疑是不是因為各大家AI公司急著變現所以刻意避談LLM的性質
LLM所給出來的結果不是確定性的 (deterministic),
也就是你現在問跟等一下問或者稍微用不同的方式問同樣問題,
都有可能出現不一樣的結果。
我目前也沒看過哪家公司的LLM保證你問同一個問題100遍結果保證都一樣。
什麼樣的結果是確定性的?
你用python的numpy函式庫去算 sin(0.368) ,
除非是機器被強力宇宙射線打到,
不然不管執行幾億次,結果都會是 0.35975005528622994
那些標準函式庫以及寫在數學課本上的定理,
才是所謂的「可靠的、不建議一般人去質疑」的結果。
而基於這個認知,就應該能理解「他會查給我正確資訊嗎」不是一個合理的疑問;
該問的是「我該用什麼樣的方式驗證LLM給的資訊」
作者:
brmelon (清水西瓜)
2026-05-04 14:17:00推正確觀念
作者:
npc776 (二次元居民)
2026-05-04 14:17:00給他~~~逼母~~~~~
作者:
jelly22 (果凍水母魚)
2026-05-04 14:17:00推
作者:
DendiQ (貔貅)
2026-05-04 14:19:00問題在怎麼用啊,你可以配合周邊工具讓他只做思考的工作可以極好地約束他生成的結果
就文字接龍擲骰子就是你說的要可驗證才有價值看到很多人還拿生成式AI問數學加法比大小就有趣我都叫AI寫程式跑XD
作者:
zoo2020 (傘蜥蜴)
2026-05-04 14:20:00好的 建議以後都不要問問題 因為你無法確認問題的正確性
作者:
DendiQ (貔貅)
2026-05-04 14:20:00我講白了,同個事情給同個人去做,產出也不一定相同
作者:
DendiQ (貔貅)
2026-05-04 14:21:00你也要有能力驗證他的結果
作者:
wei115 (ㄎㄎ)
2026-05-04 14:21:00所以現在才在玩駕馭工程,用流程限制死AI發揮
產出不一定相同,結果是正確的就好所以要能夠驗證結果
gpt可以打開直接看思考過程跟參考資料吧 gemini好像不
作者:
wei115 (ㄎㄎ)
2026-05-04 14:22:00不要問AI任何知識性的問題,知識性問題都是不可靠的
作者: AntitheApple (蘋果? 那是什麼好吃嗎) 2026-05-04 14:24:00
Gemini請他提供的參考資料常常連連結都打不開我是用PRO 不是快捷
知識型問題,最好的方法還是NotebookLM來源都是你提供的資料
作者: CCNK 2026-05-04 14:26:00
看看會不會不用要求 以後回覆完都付網址
作者:
npc776 (二次元居民)
2026-05-04 14:26:00知識型問題不是問估狗查維基就好....
作者:
wei115 (ㄎㄎ)
2026-05-04 14:27:00那是AI去搜尋後得出結果,本質是AI的理解能力而不是AI的記憶能力,LLM的架構注定任何知識性的問題都不保証正確
作者:
DendiQ (貔貅)
2026-05-04 14:27:00如果開始了解人類是怎麼思考的,就不會覺得LLM沒用了
作者:
brmelon (清水西瓜)
2026-05-04 14:27:00連自己不知道什麼都不知道的時候問AI 再從裡面找關鍵字查
作者:
npc776 (二次元居民)
2026-05-04 14:28:00有正確答案的問題 還叫他去海搜網路上錯誤答案風向雞帶風
作者:
DendiQ (貔貅)
2026-05-04 14:28:00我的意思是人類也不是什麼很有邏輯的生物
作者:
zeolas (zeolas)
2026-05-04 14:29:00推觀念正確,一堆人把ai當成google用,以前還有Let Me Google That For You的笑話,現在看到這些人真的笑不出來
作者:
SSglamr (海邊漂來的qwer)
2026-05-04 14:29:00看情況吧 像原PO問的類似"最強隊伍" 這種也沒甚麼100%的標準答案 對新手而言AI協助判斷就很有用
作者:
owo0204 (owo0204)
2026-05-04 14:30:00完全沒概念的問題確實可以問一下llm然後自己去查,這給我蠻多幫助的
作者:
owo0204 (owo0204)
2026-05-04 14:31:00例如說我想要買某產品,有怎樣的需求,我應該去哪裡買什麼規格有什麼差別這些東西,其實llm可以給出不錯的參考
作者: hayate65536 2026-05-04 14:33:00
AI適合問什麼類型的問題也是個學問
把AI當GOOGLE也不是不行google搜尋就內建AI MODE只是常常唬爛
作者: hayate65536 2026-05-04 14:35:00
內建的AI有時候會直接被他寫出來的來源打臉,還蠻好笑的
不適合問1+1=2不適合問開車去加油站加油,五分鐘,要開車還是走路
它就是統計學啦你不如叫ai做routine的事比較好大家一直噓gemini,我用過gpt也是會出現幻覺啊
作者: hayate65536 2026-05-04 15:07:00
大家嘴G不是全世界只有他會幻覺的意思
驗證不難啊,叫它提供資料來源,這比一堆空口白話唬爛的強多了,至少AI不會拒絕提供經驗夠多就知道人與人之間的對談根本充滿唬爛
作者:
zxc8787 (摸斗哈壓庫)
2026-05-04 16:25:00觀念正確
直接限定他只找論壇資訊就好,可以過濾一堆內容農場的垃圾文,只能說還是一堆人不會用
的確是沒有確定性,但人類回答問題也沒有確定性阿,問題是在產生“錯誤答案”的機率有多少LLM生成回答基本上是在做文字接龍,比如「太陽從東邊升起」和「日出是在東方」,在定義上是不重複不同的回答,但兩個意思是相同的你問人一加一等於多少,在頭被打到還是口齒不清的時候也是可能得到錯誤回答,那問LLM呢?恐怕給出「錯誤答案」的機率一樣低到可以忽略而且實際上現在的主流AI工具,都可以要求它們去套用你說的函式庫去做運算,也可以提供計算程式碼讓使用者去驗證生成AI給的答案越來越像人類助理,他就像人類一樣會出錯,但你也可以求他去用計算機之類信賴度高的工具,不過也像人類一樣,會不會按錯按鍵就是另外一回事了