一文讀懂 | 關於DeepSeek公司及其大模型

2025年01月27日19:33:24 科技 1008

來源:環球市場播報

一文讀懂 | 關於DeepSeek公司及其大模型 - 天天要聞

作為一家成立僅一年多的人工智能(AI)初創公司,DeepSeek憑藉突破性的AI模型在硅谷收穫了驚嘆和錯愕:該模型的性能不亞於全球最強的那些聊天機器人,而成本看起來只有它們的一個零頭。

DeepSeek的異軍突起,或對AI向前發展將需要越來越多電力和能源的普遍看法構成挑戰。

隨着DeepSeek創新引發的熱度越來越高,投資者開始消化它對其美國競爭對手及它們的硬件供應商的影響,全球科技股在1月末大跌。

DeepSeek究竟是什麼?

DeepSeek是一家於2023年成立的中國初創企業,創始人是AI驅動量化對沖基金幻方量化的掌門人梁文鋒。該公司開發開源AI模型,這意味着廣大的開發者社區可以檢查和改進軟件。其移動應用程序(app)於1月初發布,然後迅速登頂美國iPhone下載榜。

該app與OpenAI旗下ChatGPT等其他聊天機器人的區別是,它會在對提示做出回應之前闡明其推理過程。該公司聲稱,其R1版本的性能與OpenAI的最新版本相當,並且允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。

DeepSeek R1與OpenAI或Meta AI比起來怎麼樣?

儘管該公司沒有詳細說明培訓和開發DeepSeek模型的成本,但其似乎只是OpenAI或Meta最佳產品的一個零頭。該模型的效率高出了這麼多,使得人們懷疑斥巨資購買英偉達等公司最新、最強大AI加速器的必要性。

DeepSeek R1在幾個主要基準測評中的表現接近或優於競爭對手模型,例如數學領域的2024年美國數學邀請賽、常識領域的大規模多任務語言理解(MMLU)和問答領域的AlpacaEval 2.0。在加州大學伯克利分校相關的排行榜Chatbot Arena上,該模型也名列前茅。

DeepSeek何時引發的全球關注?

自2023年發布最早一版模型以來,這家AI開發商就受到了密切關注。然後在11月,它向世界展示了一下旨在模仿人類思維模式的DeepSeek R1推理模型。該模式支撐起了其移動聊天機器人app,今年1月,作為一種比OpenAI便宜得多的替代品,其app及網頁版在全球聲名鵲起,投資人Marc Andreessen稱其為“AI的人造衛星時刻”。

市場跟蹤機構App Figures的數據顯示,截至1月25日,DeepSeek移動app在澳大利亞、加拿大、中國、新加坡、美國和英國的iPhone應用商店下載量達到160萬次,排名第一。

DeepSeek的創始人是誰?

梁文鋒1985年出生於廣東,擁有浙江大學信息與電子工程系學士和碩士學位。天眼查數據顯示,他創立DeepSeek的註冊資本只有1000萬元人民幣。

梁文鋒曾表示,主要員工大多是中國頂尖高校的應屆畢業生,並強調英偉達的領先是整個西方技術社區和產業共同努力的結果,中國AI的發展需要類似的生態。

“更多的投入並不一定產生更多的創新,否則大廠可以把所有的創新包攬了,”他說。

DeepSeek在中國AI版圖中處於什麼位置?

從阿里巴巴集團、百度到騰訊,中國的科技龍頭企業投入了大量資金和資源來為它們的AI企業獲取硬件和客戶。DeepSeek和李開復的初創公司“零一萬物”則另闢蹊徑,採取了開源方式,旨在快速招募儘可能多的用戶,然後再以這些大量用戶為基礎制定變現策略。

由於DeepSeek的模型更便宜,它已經在幫助降低中國開發AI成本方面發揮了作用;大公司打起了價格戰,在過去一年半時間裡已經多輪降價。

對全球AI市場影響幾何?

DeepSeek的成功可能會促使OpenAI和其他美國供應商降價以保持現有的領先地位。如果更高效的模型能夠以少得多的支出參與競爭,那麼人們就會質疑Meta和微軟等公司的巨額支出 —— 它們分別承諾了今年至少650億美元的資本支出、主要是在AI基礎設施上。

全球市場掀起風浪,阿斯麥、英偉達等之前受益於AI服務需求欣欣向榮的股票大跌。科大訊飛等與DeepSeek相關的中國股票上漲。

世界各地的開發人員已然在測試DeepSeek的軟件,並考慮用它來構建工具。這可能會加速先進AI推理模型的採用 —— 同時也可能引發對是否需要限制使用的更多擔憂。DeepSeek的進步可能會加緊旨在控制AI開發的監管。

DeepSeek有什麼缺點?

DeepSeek的雲基礎設施可能會經受流量激增的考驗。該公司曾在1月27日短暫大宕機,而隨着新老用戶向其聊天機器人發去更多問題,其將得管理甚至更大的流量。

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發布了控股股東“正在與其他國資央企集團籌劃重組事項”的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從“星靈安全守護體系”到昊鉑HL,看懂廣汽科技日 - 天天要聞

從“星靈安全守護體系”到昊鉑HL,看懂廣汽科技日

發布會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了“廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退“外敵”,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,捷豹路虎宣布暫停對美出口一個月,奧迪更是直接