[新聞] DeepSeek推手不到30歲 小米祭千萬挖角

作者: NakiXIII (洋蔥頭)   2025-01-27 21:21:50
1.媒體來源:
TVBS 游舒婷 報導
DeepSeek推手不到30歲 小米創辦人祭千萬挖角天才少女
4.完整新聞內文:
https://reurl.cc/mR2lGA
新崛起的中國AI新創公司DeepSeek引發熱議,最新推出的開源大型語言模型(LLM)不僅
訓練效率大幅提升,訓練成本更是低於其他AI競爭對手,其後面推手也引起大家好奇。據
悉,DeepSeek-V2的關鍵開發者之一是一名未滿30歲的天才少女「羅福莉」,她還被小米
創始人高薪挖角。
DeepSeek於2024年年底、2025年初推出的開源大型語言模型(LLM)「DeepSeek-V3」與「
DeepSeek-R1」引發話題,其中,訓練的低成本也讓DeepSeek-V3有「AI界拼多多」的稱號

而開源大模型DeepSeek-V2的關鍵開發者之一,是一名叫做羅福莉的天才少女,陸媒介紹
,羅福莉出生在四川,雖然大學在北京師範大學主修電腦專業,但是一開始她因為基礎太
差,常常跟不上課業,不過後來學出興趣,天賦和努力加持下成績快速進步,最後保送進
入北京大學的計算語言學研究所。
讀研究所期間,羅福莉發表的人工智能相關的論文就受到大眾的關注,碩士畢業後羅福莉
就進入加入阿里達摩院機器智能實驗室,主導開發多語言預訓練模型VECO。2022年,她加
入幻方量化從事深度學習相關策略建模和演算法研究,後來正式加入DeepSeek擔任深度學
習研究員,成為研發大模型DeepSeek-V2的參與者之一。就在DeepSeek推出模型吸引市場
之際,小米創始人雷軍用人民幣千萬元(約新台幣4518萬元)年薪挖角羅福莉,要她到小
米帶領新的AI實驗室大模型團隊。
而DeepSeek因為用低成本訓練出大規模模型,在AI屆成功崛起,也吸引了美國矽谷的注意
,Meta一名工程師甚至透露Meta設立了四個專案部門,專門研究DeepSeek的技術。
5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體:
https://news.tvbs.com.tw/world/2763307
6.備註:
樓下表示可以 羅*莉

Links booklink

Contact Us: admin [ a t ] ucptt.com