這家杭州科技公司創始人,為何成為總理的「座上賓」?

2025年01月23日23:50:38 科技 7237
1月20日下午,中共中央政治局常委、國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(徵求意見稿)》的意見建議。
這家杭州科技公司創始人,為何成為總理的「座上賓」? - 天天要聞
在此次座談會上,共有9人先後發言,就解決當前發展中的問題、做好今年政府工作提出了意見建議。他們分別是北京大學經濟學院院長張輝,浙江大學黨委書記任少波,中國工商銀行黨委副書記、行長劉珺,國產大模型企業深度求索(deepseek)創始人梁文鋒,遨博(北京)智能科技股份有限公司董事長魏洪興,中國機械工業集團有限公司副總經理、總工程師陳學東,國家圖書館古籍館館長陳紅彥,中國醫學科學院北京協和醫院副院長杜斌,國際級運動健將、中國體操運動員鄒敬園
其中,深度求索(deepseek)是來自杭州的一家科技公司。這家公司是什麼來頭,創始人梁文鋒為何能成為總理的「座上賓」?
這家杭州科技公司創始人,為何成為總理的「座上賓」? - 天天要聞

來自東方的神秘力量

大模型界的「拼多多」



deepseek,全稱「杭州深度求索人工智能基礎技術研究有限公司」,成立於2023年7月,由知名量化資管巨頭幻方量化創立。
在硅谷,deepseek很早就被稱作「來自東方的神秘力量」,也是網上熱議的「杭州六小龍」之一。
真正讓deepseek火出圈的是2024年12月26日,這家公司宣布上線並同步開源的 deepseek-v3模型,並公布了長達53頁的訓練和技術細節。
它以1/11的算力、僅2000個gpu芯片訓練出性能超越gpt-4o的大模型。其總訓練成本只有557.6萬美元,而gpt-4o的約為1億美元,使用25000個gpu芯片。雙方的成本至少是10倍的差距。
在性能上,deepseek-v3在數學、代碼能力和中文知識問答方面還超過了chatgpt-4o。
這家杭州科技公司創始人,為何成為總理的「座上賓」? - 天天要聞
國外獨立測評機構artificial analysis測試後,發出了「超越了迄今為止所有開源模型」的驚嘆;meta科學家田淵棟感慨:「這是非常偉大的工作。」
「性價比」是商業社會中的制勝法寶之一,deepseek也因創新的模型架構和史無前例的性價比被稱為「大模型界的拼多多」,引發位元組、阿里、百度等大廠的大模型價格大戰。
在外部看來,降價很像在搶用戶,也有人說這家公司是行業的一條鯰魚,公司創始人梁文鋒表示,「我們不是有意成為一條鯰魚,只是不小心成了一條鯰魚。」
「搶用戶並不是我們的主要目的,我們降價一方面是因為在探索下一代模型的結構中,成本先降下來了;另一方面也覺得無論api,還是ai,都應該是普惠的、人人可以用得起的東西。」梁文鋒說。
 

中國大模型將成為不容忽視的力量



與deepseek-v3低成本訓練一樣令人驚嘆的是deepseek的員工規模。
在團隊配置上, deepseek團隊只有139名研發人員,相比openai擁有1200名研究人員,團隊規模是deepseek的近乎9倍之多。
其中,算子、推理框架、多模態等研發工程師以及深度學習方面的研究人員共有約70人。比如前段時間的熱門話題「雷軍千萬年薪挖95後天才ai少女」,這位「95後ai天才少女」羅福莉,就是deepseek開源大模型deepseek-v2的關鍵開發者之一
openai前政策主管、anthropic聯合創始人jack clark曾這樣評價deepseek:「僱傭了一批高深莫測的奇才」,還認為中國製造的大模型,「將和無人機、電動汽車一樣,成為不容忽視的力量。」
這家杭州科技公司創始人,為何成為總理的「座上賓」? - 天天要聞
 

梁文鋒是誰?



說回deepseek創始人梁文鋒,他出生於1985年,廣東湛江人,此前他接受專訪時自稱,「我是80年代在廣東一個五線城市長大的。我的父親是小學老師……」
17歲時,梁文鋒考入浙大,讀的是電子工程系人工智能方向,畢業後在浙大攻讀碩士研究生,論文題目是《基於低成本ptz攝像機的目標跟蹤算法研究》。
2015年,30歲的梁文鋒和朋友一起創辦了杭州幻方科技有限公司,立志成為世界頂級的量化對沖基金。2016年10月,幻方量化推出第一個ai模型,第一份由深度學習生成的交易倉位上線執行。到2017年底,幾乎所有的量化策略都採用ai模型計算。
2023年5月,38歲的梁文鋒宣布做通用人工智能(agi)。7月,他正式創辦杭州深度求索人工智能基礎技術研究有限公司,就是deepseek公司,專註於ai大模型的研究和開發,公司設在杭州。
從公開的工作經歷和職業生涯來看,梁文鋒在量化投資和高性能計算領域具有深厚的背景和豐富的經驗,創業範疇橫跨金融和人工智能領域。
 

這家公司為何會受邀參加座談會?



去年,12月18日至20日,李強總理在浙江調研。在杭州,李強來到城西科創大走廊未來科技城展館和之江實驗室調研。
他指出,創新是引領發展的第一動力。要主動擁抱科技變革浪潮,大力開展基礎研究和共性關鍵技術研究,加強算力等新型基礎設施布局建設,取得更多原創性引領性成果,為實現高水平科技自立自強貢獻力量。
這家杭州科技公司創始人,為何成為總理的「座上賓」? - 天天要聞
杭州未來科技城
1月20日,就在參加總理座談會的當天,deepseek正式發佈deepseek-r1模型。這款大模型在數學、代碼、自然語言推理等任務上,性能比肩openai o1正式版。
在座談會上,李強總理提到,「要以科技創新推動新舊動能轉換,集中力量突破關鍵核心技術和前沿技術,加快推進科技成果產業化,努力培育更多經濟新增長點。」
deepseek只是杭州科技創新的一個代表,國產大模型公司在列總理座談會,可見國家對科技的重視,也足見杭州在人工智能領域的強大實力。
這家杭州科技公司創始人,為何成為總理的「座上賓」? - 天天要聞
之江實驗室
過去30多年的it浪潮,中國基本上沒有參與到真正的技術創新,扮演的是追隨者的角色。梁文鋒曾在訪談中提到,「隨着經濟的發展,中國也應該逐步成為技術創新的主要貢獻者,而不是一直依賴別人的成果。」


橙柿互動·都市快報 記者 邵婷 殷軍領
編輯 成嘉怡
審核 毛迪 陳奕

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發佈了控股股東「正在與其他國資央企集團籌劃重組事項」的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日 - 天天要聞

從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日

發佈會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了「廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退「外敵」,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,積架路虎宣布暫停對美出口一個月,奧迪更是直接