一文讀懂 | 關於DeepSeek公司及其大模型

2025年01月27日19:33:24 科技 1008

來源:環球市場播報

一文讀懂 | 關於DeepSeek公司及其大模型 - 天天要聞

作為一家成立僅一年多的人工智能(AI)初創公司,DeepSeek憑藉突破性的AI模型在硅谷收穫了驚嘆和錯愕:該模型的性能不亞於全球最強的那些聊天機械人,而成本看起來只有它們的一個零頭。

DeepSeek的異軍突起,或對AI向前發展將需要越來越多電力和能源的普遍看法構成挑戰。

隨着DeepSeek創新引發的熱度越來越高,投資者開始消化它對其美國競爭對手及它們的硬件供應商的影響,全球科技股在1月末大跌。

DeepSeek究竟是什麼?

DeepSeek是一家於2023年成立的中國初創企業,創始人是AI驅動量化對沖基金幻方量化的掌門人梁文鋒。該公司開發開源AI模型,這意味着廣大的開發者社區可以檢查和改進軟件。其移動應用程序(app)於1月初發佈,然後迅速登頂美國iPhone下載榜。

該app與OpenAI旗下ChatGPT等其他聊天機械人的區別是,它會在對提示做出回應之前闡明其推理過程。該公司聲稱,其R1版本的性能與OpenAI的最新版本相當,並且允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。

DeepSeek R1與OpenAI或Meta AI比起來怎麼樣?

儘管該公司沒有詳細說明培訓和開發DeepSeek模型的成本,但其似乎只是OpenAI或Meta最佳產品的一個零頭。該模型的效率高出了這麼多,使得人們懷疑斥巨資購買英偉達等公司最新、最強大AI加速器的必要性。

DeepSeek R1在幾個主要基準測評中的表現接近或優於競爭對手模型,例如數學領域的2024年美國數學邀請賽、常識領域的大規模多任務語言理解(MMLU)和問答領域的AlpacaEval 2.0。在加州大學伯克利分校相關的排行榜Chatbot Arena上,該模型也名列前茅。

DeepSeek何時引發的全球關注?

自2023年發佈最早一版模型以來,這家AI開發商就受到了密切關注。然後在11月,它向世界展示了一下旨在模仿人類思維模式的DeepSeek R1推理模型。該模式支撐起了其移動聊天機械人app,今年1月,作為一種比OpenAI便宜得多的替代品,其app及網頁版在全球聲名鵲起,投資人Marc Andreessen稱其為「AI的人造衛星時刻」。

市場跟蹤機構App Figures的數據顯示,截至1月25日,DeepSeek移動app在澳大利亞、加拿大、中國、新加坡、美國和英國的iPhone應用商店下載量達到160萬次,排名第一。

DeepSeek的創始人是誰?

梁文鋒1985年出生於廣東,擁有浙江大學信息與電子工程系學士和碩士學位。天眼查數據顯示,他創立DeepSeek的註冊資本只有1000萬元人民幣。

梁文鋒曾表示,主要員工大多是中國頂尖高校的應屆畢業生,並強調英偉達的領先是整個西方技術社區和產業共同努力的結果,中國AI的發展需要類似的生態。

「更多的投入並不一定產生更多的創新,否則大廠可以把所有的創新包攬了,」他說。

DeepSeek在中國AI版圖中處於什麼位置?

從阿里巴巴集團、百度到騰訊,中國的科技龍頭企業投入了大量資金和資源來為它們的AI企業獲取硬件和客戶。DeepSeek和李開復的初創公司「零一萬物」則另闢蹊徑,採取了開源方式,旨在快速招募儘可能多的用戶,然後再以這些大量用戶為基礎制定變現策略。

由於DeepSeek的模型更便宜,它已經在幫助降低中國開發AI成本方面發揮了作用;大公司打起了價格戰,在過去一年半時間裏已經多輪降價。

對全球AI市場影響幾何?

DeepSeek的成功可能會促使OpenAI和其他美國供應商降價以保持現有的領先地位。如果更高效的模型能夠以少得多的支出參與競爭,那麼人們就會質疑Meta和微軟等公司的巨額支出 —— 它們分別承諾了今年至少650億美元的資本支出、主要是在AI基礎設施上。

全球市場掀起風浪,阿斯麥、英偉達等之前受益於AI服務需求欣欣向榮的股票大跌。科大訊飛等與DeepSeek相關的中國股票上漲。

世界各地的開發人員已然在測試DeepSeek的軟件,並考慮用它來構建工具。這可能會加速先進AI推理模型的採用 —— 同時也可能引發對是否需要限制使用的更多擔憂。DeepSeek的進步可能會加緊旨在控制AI開發的監管。

DeepSeek有什麼缺點?

DeepSeek的雲基礎設施可能會經受流量激增的考驗。該公司曾在1月27日短暫大宕機,而隨着新老用戶向其聊天機械人發去更多問題,其將得管理甚至更大的流量。

科技分類資訊推薦

Pura80Pro與Mate70Pro,誰是華為旗艦更優解?一文看懂 - 天天要聞

Pura80Pro與Mate70Pro,誰是華為旗艦更優解?一文看懂

每當華為旗艦新機臨近發佈節點,科技圈的焦點就會轉移到「新舊旗艦」之間的對比上,這也是許多消費者最關注的問題之一,比如即將在6月11日發佈的「Pura80 Pro」以及已經上市半年的「Mate70 Pro」,一款是華為在影像領域進一步突破的全
周鴻禕:準備幹掉360整個市場部,每年能省幾千萬 - 天天要聞

周鴻禕:準備幹掉360整個市場部,每年能省幾千萬

6月6日晚,360集團創始人、董事長周鴻禕在其個人自媒體賬號發文稱,「我準備幹掉360整個市場部,這樣一年可以給公司省下幾千萬。」他表示從當天起,要做一個挑戰,一個人完成一場完整的新產品發佈會。「聽起來像天方夜譚,但這次我準備動真格的了。」周鴻禕稱,過去做一個產品發佈會,需要市場部幾十號人,忙活大半個月,費...
新疆低空經濟加力擴容 - 天天要聞

新疆低空經濟加力擴容

天山網/新疆日報記者 馬伊寧不久前,「阿勒泰低空飛行服務保障中心」及「布爾津、富蘊低空飛行服務保障站」投入運營。作為擁有世界級旅遊資源的區域,阿勒泰地區正構建覆蓋北疆的低空飛行服務網絡,為通用航空、無人機物流、低空旅遊等業態提供全鏈條服務保
特斯拉「擎天柱」人形機械人項目負責人宣布離職 - 天天要聞

特斯拉「擎天柱」人形機械人項目負責人宣布離職

中新網6月7日電(吳家駒)綜合外媒報道,特斯拉「擎天柱」(Optimus)人形機械人項目負責人米蘭·科瓦奇(Milan Kovac)周五表示,他將離開公司。 科瓦奇在X平台上發文稱,「我不得不做出一生中最艱難的決定,我將離開我的職位。我離家太久了,需要花更多的時間和國外的家人在一起。」科瓦奇稱,這是「唯一的原因,與其他任何事情...
512GB售價2039元!3840HZ+7550mAh+極窄直屏,紅米手機價格親民了 - 天天要聞

512GB售價2039元!3840HZ+7550mAh+極窄直屏,紅米手機價格親民了

卡頓可以說是很多消費者使用手機時遇到的最為頭疼的情況,好在就如今新發佈的機型就算是在長時間的使用之下,也並不會讓你出現如此的情況,這就比如說紅米Turbo 4 Pro這款機型就是如此,這款機型不僅性能狂飆、續航超長,更有旗艦級配置和貼心細節