DeepSeek啟示錄:偉大不能被計劃

2025年01月31日19:40:20 時尚 9382

DeepSeek啟示錄:偉大不能被計劃 - 天天要聞

正如梁文鋒所說:「創新都是自己產生的,不是刻意安排的。」
















DeepSeek啟示錄:偉大不能被計劃 - 天天要聞

文 | 佘宗明



「國運級科技突破」「美國的斯普特尼克時刻」「ai珍珠港事件」……deepseek颳起的「最炫民族ai風」,遠沒有停下來的跡象。


美國方面對deepseek以國家安全調查名義展開「獵巫」,又為其輿論熱度火上澆了油。


看上去,deepseek才是「春節檔」最大贏家:成立僅1年半的deepseek於無聲處釀出了驚雷,堪比作「魔童鬧海」;使出降龍十八掌直接重創納斯達克的deepseek提振了國人信心,不啻為「俠之大者」;掀起ai領域「算力起義」的deepseek改寫了ai權力遊戲規則,配得上被「封神」。


正因如此,在國內外輿論場,deepseek幾乎被各種震驚體圍裹。


DeepSeek啟示錄:偉大不能被計劃 - 天天要聞


▲《黑神話·悟空》製作人馮驥將deepseek-r1視作國運級別的科技成果。


在宏大敘事框架下,deepseek的異軍突起,很容易被人拿來跟華為突破美國封堵重新推出「爭氣機」5g手機華為mate60 pro並論,跟大國科技崛起的話語綁定。


在芯片法案與tiktok剝離法案已成中美科技競賽烈度直觀反映的當下,這類解讀在所難免。


但不能因此就抹殺deepseek奇蹟中「去nationalism」的部分,要看到,deepseek能變成眼下的deepseek,跟很多具體因素有關,如梁文鋒的極致技術理想主義,如deepseek人才使用的反經驗主義。


也正是deepseek身上的多重獨特性,使得它可以像荊棘花那般不懼凜風與涸土地盛開。


在我看來,如果要用一句話總結deepseek啟示錄的精髓,那就是:偉大不能被計劃。


01 

「偉大不能被計劃」,言下之意是,不要試圖去設計規劃好一切,很多事情本就是「無心插柳」的結果。


deepseek能同時登頂蘋果app store中美下載排行榜第一,就是最直觀的驗證。它的崛起之路,有着太多的「讓人意想不到」。


在9個月前,許多人印象中的國內ai頭部玩家,還是以bat和位元組為代表的大廠和ai大模型六小虎(智譜ai、月之暗面、百川智能、minimax、階躍星辰、零一萬物)。


誰能想到,「名少見經傳」的deepseek 能戳穿性價比天花板,證明「明明是主流玩家的電影,我卻偏偏要有姓名」呢?


在1個多月前,很多人認知中的openai挑戰者,依舊在硅谷——紅杉資本此前就認為,現在ai領域是五強爭霸:微軟+openai,亞馬遜+antropic,谷歌,meta和xai。


誰能想到,deepseek能用openai僅約1/10的預訓練成本,就推出了性能可與gpt-4o、claude 3.5 sonnet等頂尖閉源模型相匹敵的deepseek-v3呢?


在10多天前,有些人仍然會認為,deepseek-v3隻是曇花一現,連deepseek都很難再複製deepseek。


誰能想到,deepseek又掏出了成本依舊低廉、性能更加強大的deepseek-r1(性能可對標openai o1正式版,api服務定價則要低上27-55倍),直接震驚歐美科技界呢?


DeepSeek啟示錄:偉大不能被計劃 - 天天要聞


▲deepseek-r1引發美股地震後,引起國內外媒體廣泛關注。


事實上,就在deepseek-v3發佈時,依然有國內專家將deepseek視作小米su7,「神似某捷的外型、單層的、民用級剎車卡鉗、大概其的隔音……雖然一上賽道跑幾圈剎車就嚴重衰減,雖然里里外外都是蔚小理玩過的東西,沒有技術和形態突破。」有國外人士認為deepseek雖然拿出了「30美元iphone」,但那只是平替。


但deepseek-r1用特朗普震驚、山姆·奧特曼嘆服、馬斯克「內涵」的反應證明了,它確實不是池中物。


而今,不少國內網友儼然用滿屏驚嘆擺成了四郎的表情包:你還有多少驚喜是朕不知道的?


02  

「偉大不能被計劃」,也是因為,很多「偉大」的事物一開始可能是「微小」的。


deepseek能不能承載起「國運級成果」的名頭,興許還有爭議,但它確實當得起「神奇」二字。


deepseek-r1究竟厲害在哪?懂技術的人興許張口就是一堆名詞:合成數據、知識蒸餾、fp8低精度、稀疏模型、moe、多頭注意力機制……


這些技術未必是首創,但deepseek能利用既有技術,實現訓練量效比、算力能效比的極致提升,也是現象級突破。


都說「多少輛馬車相加,都加不出一輛汽車來。」喬布斯當年發明iphone,不是在功能機上疊加mp3、攝像機等功能,而是用觸屏體驗+軟硬件一體化重新定義了手機。deepseek的難得之處也在於「重新定義」——它打破了路徑依賴,重新定義了算力提升方式。


有人這樣比喻:若是把提升算力視作蓋樓,那openai就是狂堆磚塊(芯片硬件),deepseek則是依託發明鋼筋混凝土(數學框架創新)來重塑建造方式。


openai讓大模型研發變成了比誰磚塊多的比賽,deepseek則讓大模型研發變成了比誰建築方式更高效的pk。


DeepSeek啟示錄:偉大不能被計劃 - 天天要聞▲有網友這樣調侃openai跟deepseek的差別。


deepseek只是個200多人的公司,卻能挾工程能力優勢用算法優化「發明」出算力倍增器,干出很多國內外大廠都沒幹出的事來,這不免讓人想起凱文·凱利在《5000天後的世界》中的那句話——「未來最成功的那個公司,必然是今天還默默無聞的、在社交媒體領域外的某個小公司。」


小就是大。在大公司成功的經驗成為它們的桎梏時,創業公司卻可以以好奇心驅動的創新動能、扁平無層級的組織架構,展現出更大的創新勢能來。


deepseek就是典型。ai創業公司的高強活力跟梁文鋒的高維認知疊合後,產生的化學反應十分驚人。


梁文鋒對agi(通用人工智能)的技術信仰,對中美ai差距本質是「原創與模仿之差」的清醒洞見,對「閉源的護城河是短暫的,openai閉源也無法阻止被趕超」的前瞻判斷,本就體現了高於行業的認知能力。


deepseek採用無層級的靈活協作機制,重潛力和好奇心不重行業經驗的招聘標準,開源的生態戰略,都與此有關,也放大了其勢能。


因而,deepseek可以在朱嘯虎式判斷廣受推崇的時下,篤定「不做應用,專註大模型研究」的長期主義戰略,可以在openai路線大行其道的情況下,擁抱更高效更開放的ai發展道路。


為什麼是deepseek?部分答案就藏在其中。


03 

「偉大不能被計劃」,也意味着,那些偶然性與獨特性不該被忽略。


行業專家楊寬老師就說:當openai沉迷於暴力堆料時,deepseek團隊在玩「算力俄羅斯方塊」——把每個cuda核心的價值壓榨到小數點後四位,就硬件利用率而言,硅谷利用gpu群組通信損耗技術達到了30%-40%,deepseek則利用自研moe+動態路由算法達到了78%,「這不是技術差距,而是工程思維的代際碾壓。」


這背後就離不開deepseek團隊提出的mla架構創新,它藉此將顯存佔用降至傳統方法的5%-13%。背後的背後則是一年輕研究員的突然靈感和突發奇想。


他還講到,梁文鋒將量化交易思維注入ai訓練當中:風險對沖(用多模態數據構建「投資組合」)、高頻調參(在行業標準72小時/次的前提下,每2小時優化一次超參數)、動態止損(自動終止低效訓練分支),這套「華爾街鍊金術」使得deepseek的每次訓練都像在玩《文明6》的科技樹速通。


這很容易讓人想到肯尼斯·斯坦利和喬爾·雷曼在《為什麼偉大不能被計劃》中舉的例子:發明飛機的萊特兄弟,最早其實是單車製造商;真空管是早期計算機的奠基性零件,但真空管的誕生與計算機毫無關係……


做量化交易起家的梁文鋒,創造出了「性價比」超強的ai大模型,又為其新添了案例。


DeepSeek啟示錄:偉大不能被計劃 - 天天要聞

▲被很多歪果仁稱作「東方神秘力量」的deepseek,發展路徑有其獨特性。


deepseek被津津樂道的,還有其開源模式:在openai背離初心變成closeai的背景下,deepseek變成了真正open的ai;在openai把開發者當「數字佃農」時,deepseek用開源協議發動「ai土地革命」……這也是其了不起的地方。


這也跟梁文鋒的技術理想主義氣質緊密相關。換個人,可能又是師山姆·奧特曼長技以制競爭對手的打法了。


梁文鋒說:「創新都是自己產生的,不是刻意安排的。」


這相當於拍了拍肯尼斯·斯坦利們,並向他們表達了認同。因為肯尼斯·斯坦利說:真正的偉大是計劃不出來的,跟着好奇心一步一步走,才是成就非凡的正確路徑。

04  

「偉大不能被計劃」,所以那些看似很小的種子,沒準也能「開出花,伸出新長的枝椏」;那些在邊緣地帶、外圍區域、隱秘角落的探索,興許也能「小力出奇蹟」。


跟國外的gafa(谷歌蘋果臉書亞馬遜)和英偉達、國內的bat一樣,deepseek不是計划出來的,而是在適宜土壤上長成的。


既然創新是激發好奇心、激活創造性後擺脫路徑依賴的產物,而非計划出來的結果,那對於創新應有的呵護與激勵,也不該是回到路徑依賴中去,而是為那些好奇心與創造性提供良好的制度環境,包括包容氛圍、試錯空間。


就目前看,deepseek走紅後,輿論場中有些反應就值得警惕,這其中的某些反應,更進一步通向的就是那種對「計劃」的路徑依賴。具體來說就包括:


一,將deepseek的突破導入nationalism的語境中,認為要將其作為「ai國家隊」來加以收編、大力扶持。


「自創生」的deepseek,不需要揠苗助長,只需要適合創新的氣候土壤。


仔細看會發現,從《黑神話·悟空》到宇樹科技的機器狗再到deepseek在stylectrl類別中排第一的大模型,都誕生在杭州。


這不是偶然。通常而言,市場底色足-民營企業多-創新氛圍濃-經濟活力足-發展機遇廣-成為未來科技中心概率大,是一體的。


尊重市場、鼓勵創新、擁抱開放、包容失敗,培育適宜創新的市場生態,就可能會有更多企業——包括中小民營企業,像deepseek一樣冒出來。


倒是那些以關懷為名的干預,以擔當為由的裹挾,可能會抑制其活力。


二,以「干翻硅谷,單挑華爾街」的「厲害了,我的ds」態度,將其推向大時代的旋流中。


在美國持續升級對華ai芯片限制的背景下,deepseek利用華為芯片、中國本土ai人才、更低的算力成本研發出了性能領先的大模型,激發民族自信心和自豪感很正常,被寄予打破卡脖子局面的厚望也很正常。


但這不應導向對deepseek的無意識捧殺,更不應通往對「脫鉤斷鏈論」的裡應外合。


把deepseek的突破視作「國運級」的,個中的揚眉吐氣心態可以理解,饒是如此,也該盡量避免把企業跟「干翻」「單挑」之類的字眼關聯,否則很可能迎合外部的那些「××威脅論」,將其無形中推到靶子位置。


DeepSeek啟示錄:偉大不能被計劃 - 天天要聞

▲deepseek眼下正遭到美國方面以國家安全調查為名的「獵巫」。


往大了說,我們不該在「妄自菲薄」和「妄自尊大」兩極間橫跳。


《暗知識》作者王維嘉就認為,從技術格局來看,儘管 deepseek 的成果縮小了中美在人工智能技術上的差距,但中美人工智能整體格局尚未被撼動。


他覺得,「在人工智能技術的幾個關鍵方面,芯片領域中國仍與美國存在較大差距;在算法突破方面,過去十年間,從 2012 年的 alexnet 到2017 年的 transformer,再到 2022 年的 chatgpt 以及後續的思維鏈、rag 和推理訓練等重大突破,大多發生在美國,法國的 mistral 公司也有少量貢獻,deepseek 的貢獻佔比約為 5%,但這已然十分了不起。」


接下來,我們需要更多deepseek出來去縮小差距,而不是在捧殺deepseek中掐滅火種。


05 

說到底,deepseek的勝利,是對《為什麼偉大不能被計劃》中那個觀點的最佳註解——「在探索未知領域的過程中,保持對有趣事物的開放性,在搜索到足夠數量的踏腳石之後,偉大的成就自然就會與我們不期而遇。」


deepseek邁出了ai發展史上的重要一步,免不了被置於未來大國博弈、科技競爭的框架下打量。


但無論如何,別忘了——


deepseek的創新不是計划出來的,deepseek的創新被看到後也不需要「計劃」來裹挾。



DeepSeek啟示錄:偉大不能被計劃 - 天天要聞

✎作者 | 佘宗明

✎運營 | 李玩

歡迎分享到朋友圈

轉載須經許可


 ©

敬請關注

時尚分類資訊推薦

剛到貨一架,民進黨就迫不及待炒作起來 - 天天要聞

剛到貨一架,民進黨就迫不及待炒作起來

F-16V,民進黨政客近日瘋狂吹噓的一款軍機。上月底,在延宕兩年多後,美方終於向台灣軍方交付了第一架F-16V Block 70,這也是今年交付的唯一一架。 2019年,台灣空軍編列「鳳翔....
39家馬來西亞企業參展第五屆消博會 - 天天要聞

39家馬來西亞企業參展第五屆消博會

4月13日,海南海口,第五屆中國國際消費品博覽會開幕。本屆消博會共吸引馬來西亞39家企業參展,參展品牌41個,參展面積達到610平方米,展品涵蓋食品、保健品、消費電子、珠寶等行業。圖為參觀者在馬來西亞館選購餅乾。中新社記者 駱雲飛 攝 4月13日,海南海口,第五屆中國國際消費品博覽會開幕。本屆消博會共吸引馬來西亞3...
賣了塊「勞力士」收到37萬5,第二天銀行卡被凍結?賣家:我是無辜的 - 天天要聞

賣了塊「勞力士」收到37萬5,第二天銀行卡被凍結?賣家:我是無辜的

上個月,小陳賣了一塊勞力士手錶收了37萬多,結果銀行卡被凍結了,警方說這筆錢是四川一個詐騙受害者轉的。小陳家在紹興蘭亭開新材料公司,他說1月份買了一隻勞力士錶宇宙計型迪通拿系列18K金,雖然是二手錶但其實是全新的,當時花了38萬多。後來出於種種考慮,也有顏色太張揚的因素,他打算把表賣掉掛在閑魚上標價39萬。一...
又能穿上短袖了!下周南北方多地組團上30℃ - 天天要聞

又能穿上短袖了!下周南北方多地組團上30℃

剛剛過去的一周天氣太複雜!大風、沙塵、強雨雪、降溫……新的一周,天氣將出現大轉折。 劃重點:1.明天白天華北、黃淮一帶仍有大風,夜間將明顯減弱。2.中東部氣溫回升,下周南北方多地將組團上30℃,南方部分地區還將出現高溫。3.南方16日至17日、18日至19日將有降雨過程,後一次過程部分地區可能伴有強對流天氣。4.北方...
上海明天繼續刮大風,下周四、周五氣溫再上3字頭 - 天天要聞

上海明天繼續刮大風,下周四、周五氣溫再上3字頭

蒙古、東北雨雪紛飛,廣東、海南浮塵襲擾,華北、華東大風呼嘯,今天(4月13日)全國各地天氣都不平靜。上海今日大風藍色預警高掛,大部地區陣風達6~7級,局部更強。雖然大風迅猛,但陽光毫不退讓,啟動升溫,午後大部地區回到20℃以上,市區徐家匯站最高氣溫定格在 20.6℃。今夜北部地區有短時小雨,影響不大。風力明顯減...
武漢市晴朗天氣回歸,日溫差大 - 天天要聞

武漢市晴朗天氣回歸,日溫差大

湖北日報訊(記者湯煒瑋、通訊員陳聲超)4月13日從武漢市氣象局獲悉,預計未來一周,武漢市以晴或多雲天氣為主,氣溫迅速回升,有利於大家生產生活;到了20日前後,武漢市又將有一次降水過程,建議公眾參考天氣情況合理安排出行。昨天武漢市陰天轉多雲,受冷空氣南下影響,北風風力較大,伴有浮塵。今日上午武漢市天氣晴朗...
鏡頭連中外丨七彩「雲花」香飄越南 - 天天要聞

鏡頭連中外丨七彩「雲花」香飄越南

2025年4月11日,雲南昆明斗南花卉市場人頭攢動。越南老街花商阮翠雲穿梭在一簇簇盛放的鮮花間,手機鏡頭對準花株,將最新價格和品質信息實時發送到越南客戶群。就在前一日,她帶來的河內客商在昆明花卉基地完成實地考察,即將簽訂一份30萬元人民幣的訂單——這只是這位中越花卉貿易「擺渡人」日常的縮影。這是4月11日在昆明...