獨家丨一位 AI 科學家,拒絕了張一鳴開出的千萬年薪
作者丨李梅
編輯丨陳彩嫻
AI 科技評論獨家獲悉:字節跳動向知名 AI 青年科學家、深度學習框架 MXNet 作者李沐發出邀請,希望請他加入字節參與大模型研發,開出千萬年薪。盡管條件豐厚,但綜合考慮后,李沐選擇了婉拒。
日前,AI科技評論報道了前亞馬遜機器學習部門首席科學家 Alex Smola 和李沐師徒離職、宣布在大模型賽道創業的消息。李沐與博士導師 Alex Smola 創立了一家公司,叫 Boson.ai,受到行業熱烈關注。
大模型的門檻高,據統計,全球能訓練大模型的 AI 科學家不超過 500 人,華人科學家則更少,搶人成為近日國內大廠的重頭戲。雷峰網得到消息,字節跳動的創始人張一鳴曾親自邀請李沐,不過李沐婉拒了這個年薪千萬的工作機會,最終選擇在硅谷創業。
李沐的選擇出乎當前行業主流觀點的意料之外。大家的共識是:國內能做成大模型的互聯網科技大廠最終不會超過5家,BATH+字節;按照以往的規律,創業公司在大廠的擠兌下沒有生存的空間。但李沐對張一鳴說不的這一舉動,卻給了大模型的小創業團隊一個新的啟示:
大廠并非唯一選擇。
盡管大廠有幾萬人,但最終主導大模型研發的團隊不過幾十人。一方面,大廠有太多來自架構、業務、資源分配等方面的不確定性因素,最終能做成什么樣還是未知數;另一方面,在一個新的、需要搶跑的賽道中,一個有能力、有決心 all in 的平臺,或許更能把握節奏,搶占先機。
最終,大模型做成,技術平臺積淀,再以數億的金額賣給大廠,也不失為一個好的選擇。進可攻,退可守,創業成為明星科學家眼中更「香」的選擇。
(AI科技評論將持續關注大模型創業動態,歡迎添加本文作者微信ExperienceMachine交流爆料、互通有無)
—— 1 ——
李沐的「選擇」
李沐
這不是李沐第一次創業。
在上一波深度學習落地潮中,AI人才大規模流向工業界,彼時快要博士畢業的李沐也抓住機遇,選擇與他的兩位導師Alex Smola和Dave Andersen一起創業,成立了一家公司Marianas Labs,李沐出任CTO。起初,公司的項目進展很順利,還被一家上市公司看中,就將公司賣給了對方,但后來還是終止了合作。最后,由于團隊核心人員離開,Alex和Dave分別去了亞馬遜和谷歌,李沐的這次創業便就此終止。
緊接著,又一次重要的選擇來到李沐面前。谷歌的AI掌門人Jeff Dean向李沐發來一封郵件邀請他去谷歌工作。當時Jeff Dean主導的深度學習框架Tensorflow問世,實力非常強,這對李沐而言當然是一個很好的機會。
但李沐還有自家的MXNet要發展,他認為“自己挖的坑,總是要自己填的”。當時李沐也考慮了一些技術性強的小創業公司,但從MXNet的發展來看,還是要找家巨頭來依靠更好,所以去亞馬遜是更優選擇。
于是李沐就先以兼職的身份去了亞馬遜,帶著一些人做MXNet開發和AWS上深度學習的應用。之后李沐于2016年7月正式入職亞馬遜AWS,直接向擔任副總裁級別科學家的Alex匯報。
如今,六年多過去,在新一輪AI大模型熱潮下,李沐面臨著更大的機遇和更多的選擇。如同許多下場創業的AI科學家一樣,李沐也已經瞄準大模型,準備開啟新事業。
Boson.ai 官網
—— 2 ——
頂級科學家選擇創業?更能 All in 大模型
字節跳動已經入場語言生成大模型,挖人才進來正是頭等大事。字節現已經攬入一名大將,原達摩院大模型M6帶頭人楊紅霞。而據知情人士稱,張一鳴親自給在國外巨頭工作的華人科學家打電話,邀請他們回國加入字節大模型事業。
像李沐這樣的頂級科學家,選擇自己創業,而對大廠的招攬有所保留,這并不是個別現象,亦有其合理性。大廠固然體量大、資源多,但真要論內部專門投入做大模型的人才密度,恐怕并不高,再加上資源分配等方面可能存在諸多束縛,大廠最終能否做好自己的ChatGPT是一個問號。因此,在頂級科學家眼里,大廠并非是唯一的、最好的去處。
語言生成大模型本身也有很高的技術壁壘,所以,相比去一家聲量大但大模型并非主要方向的公司,建立一支更重視AI、能夠all in大模型的團隊,或許是更聰明的選擇。
這是經過許多歷史驗證的,比如當年的百度少帥之一、曾任字節跳動AI Lab總監的李磊,曾考慮去百度新聞做推薦系統,當時剛離開百度、創立地平線的余凱勸說他,最好去一個推薦系統是核心業務、受重視的地方,哪怕是家小公司。最后李磊便加入了當時規模還不大的今日頭條。
而且,創業如果成功,賣給大廠如亞馬遜后帶來的收益,也并非現在加入大廠拿千萬美元年薪所能相比的。
(預告:2012年后,以余凱為代表的一群華人科學家從硅谷NEC Lab離開回國,直接推動了中國AI產業變革,也影響了包括李沐、李磊在內的一大批AI大牛。雷峰網后續將推出相關文章《硅谷NEC Lab往事》,歡迎添加作者微信ExperienceMachine交流)
另外,從亞馬遜在這一波AI大模型競爭中的位置來看,盡管亞馬遜也已經布局,且內部已經開始測試類GPT工具,但目前在美國戰場占據制高點的,無疑還是微軟與谷歌兩大巨頭。像李沐和其導師Alex Smola這樣的科學家們,有技術、有影響力,也不會缺投資,所以他們要參與這一波競爭,創業的確是一個不錯的選擇。
而在技術優勢方面,ChatGPT目前主要是堆數據、堆參數的方式,其模型效果具有一定的偶然性,在工程優化、降低成本方面還有很大的空間。而李沐正是做系統出身,非常擅長工程優化這一塊,所以他的機會很大。
(公眾號:雷峰網)
隨便看看:
相關推薦:
網友評論:
推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件