Re: [問卦] Deepseek為什麼光速過氣?

作者: bluebluelan (新陰流大目錄免許皆傳)   2025-04-11 14:38:28
因為沒有足夠的H100來燒
請參照我一月底的文章
https://www.ptt.cc/bbs/Gossiping/M.1737844950.A.7EE.html
"如果有一個更有效率的架構/模型 假設你拿五千張H100就能做出Deepseek R1"
"那些有十萬張的公司就能搞出更屌的東西"
Deepseek很好 提出reasoning, multi-head latent attention這兩個東西
其他AI公司有資本的抄一抄 馬上就趕出一樣的東西還超前
Deepseek當下就像是珍珠港時刻 或者美國海軍飛行員看到零戰在天上飛的瞬間
嚇死
但是最後還是工業力勝出 誰財大氣粗就能做出更屌的東西
除非今天給Deepseek同等級的財力跟算力 不然有什麼新架構橫空出世
那些十萬張等級的公司訓練新模型就是一個禮拜的事情而已
Deepseek比較像是研究中心 不是AI公司 其他家是真的打算把自家的AI服務拿來賺錢
但是Deepseek就是提出一個很屌的東西 但是軟體服務沒跟上 用戶體驗下降
就回到其他家 體驗更好 模型更屌
※ 引述《markban (馬克白)》之銘言:
: 看安卓商店deepseek下載數卡在谷底
: 現在也沒什麼人講deepseek
: 講到ai不是馬斯克的grok3
: 就是傳統的chatgpt
: 是什麼讓deepseek光速過氣
: 你各位中國人怎麼說==

Links booklink

Contact Us: admin [ a t ] ucptt.com