[問卦] Deepseek不就是說MoE便宜又好用而已?

作者: bluebluelan (新陰流大目錄免許皆傳)   2025-01-28 04:56:05
安安 在AI產業的 MoE也不是什麼太陌生的題材
市面上好幾個MoE模型 加上最近的小模型趨勢
DeepSeek只是證明MoE加小模型 便宜又好用
整體還是在Transformer架構之下搭起來的 運算量還是在那邊
花更少的資源做一樣的事情 不就代表一樣的資源能做更多事?
AI即將更便宜更好用 大家不是應該要更爽才是 都不用工作了

Links booklink

Contact Us: admin [ a t ] ucptt.com