1月27日11點左右,deepseek官網一度顯示「deepseek網頁/api不可用」,功能現已恢復。
昨日(26日),deepseek也「崩」了一次。deepseek隨後回應稱,1月26日下午deepseek確實出現了局部服務波動,但問題在數分鐘內得到解決。此次事件可能與新模型發布後的訪問量激增有關,而官方狀態頁未將其標記為事故。
1月27日早間,deepseek應用登頂蘋果中國地區和美國地區應用商店免費app下載排行榜,在美區下載榜上超越了chatgpt。
1月24日,在國外大模型排名 arena 上,deepseek-r1 基準測試已經升至全類別大模型第三,其中在風格控制類模型(stylectrl)分類中與 openai o1 並列第一。而其競技場得分達到1357分,略超 openai o1 的1352分。
更為關鍵的是,該模型每百萬個token的查詢成本僅為0.14美元,而openai的成本為7.50美元,便宜了98%,而且允許開源。
嚇懵!科技權重股集體大跌
deepseek讓華爾街算力板塊投資人感受到了涼意。
寒武紀一度大跌近10%,天孚通信、中際旭創、工業富聯、中興通訊等多隻科技權重股也有不同程度下跌。
英偉達美股夜盤跌超5%,博通跌超4%。美股期貨持續走低,納斯達克指數期貨跌超1.7%。
圖 / wind
與此同時,主導星際之門計劃的軟銀集團股價一度下跌近6%,創下去年11月1日以來的最大跌幅;藤倉大跌超8%,東京電子和disco均跌超3%。
「中國模型」震動華爾街
網路社群里,越來越多的人把deepseek的出現與近期英偉達的回調聯繫在一起。
美股大v「the short bear」在社交媒體上表示,deepseek 創造了一個ai巨頭們的痛苦時刻,而投資者必須對此敲響警鐘。「如果擊敗 openai 所需要的金額是 5500萬美元(包括5000個 h800 gpu和500萬預訓練費用),那麼這個行業的商業化會比很多人預想的要快很多。」
包括海外媒體 vital knowledge,德國世界報知名市場評論員 holger zschaepitz,都不約而同地把 deepseek 稱之為「美國股市最大的威脅」。
揭秘背後操盤手
天眼查顯示,deepseek的開發者為杭州深度求索人工智慧基礎技術研究有限公司(簡稱「深度求索」),該公司成立於2023年7月份,由寧波程恩企業管理諮詢合夥企業(有限合夥)和梁文鋒共同持股。
據了解,深度求索背後的操盤手梁文鋒是金融圈成名已久的高手。他創立的幻方量化,為國內量化私募巨頭之一。
據湛江發布,來自湛江的梁文鋒近日現身《新聞聯播》,以deepseek創始人的身份參加了一場國家超高規格座談會,並現場發言。
梁文鋒是湛江市吳川市覃巴鎮米歷嶺村人,父母都是小學語文老師。梁文鋒一直是學校里的「尖子生」,並在數學學科表現出極大天賦,初中時期就學完了高中數學,甚至開始學大學的數學。
最後一排右邊第6個是梁文鋒,圖:湛江發布
目前,梁文鋒持股寧波程恩50.1%,寧波程信柔兆企業管理諮詢合夥企業(有限合夥)持股49.8%,寧波程普商務諮詢有限公司持股0.1%。而寧波程信由梁文鋒、鄭達韡、李歡、陳哲等自然人共同持股。
deepseek微信公眾號信息顯示,1月20日,深度求索正式發布deepseek-r1大模型,並同步開源模型權重。「deepseek-r1 在後訓練階段大規模使用了強化學習技術,在僅有極少標註數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 openai o1 正式版。」深度求索在發布信息中表示。
《黑神話:悟空》的主創馮驥也高度評價和推薦deepseek,他指出存在六大優點:
1、強大。比肩o1的推理能力,暫時沒有之一;
2、便宜。參數少,訓練開銷與使用費用小了一個數量級;
3、開源。任何人均可自行下載與部署,提供論文詳細說明訓練步驟與竅門,甚至提供了可以運行在手機上的mini模型;
4、免費。官方目前提供的服務完全免費,任何人隨時隨地可用;
5、聯網。暫時唯一支持聯網搜索的推理模型(o1還不支持);
6、本土。深度求索是一家很小規模的年輕中國公司,由沒有海外經歷甚至沒有資深從業經驗的本土團隊開發完成。
此外,在美國矽谷,多位人工智慧行業意見領袖對deepseek-r1表達由衷讚美。據證券日報報道,微軟ceo薩蒂亞・納德拉公開表示:「他們切實有效地開發出了一款開源模型,在推理計算方面表現出色,且超級計算效率極高。」曾投資過openai的投資人馬克·安德里森在社交平台表示,deepseek-r1是我見過的最令人驚嘆,最令人印象深刻的突破之一,並且是開源的,是對全世界的大禮。
值得注意的是,據湛江發布消息,性能比肩gpt-4o的deepseek-v3,投入研發費用為558萬美元,訓練成本不到gpt-4o的1/20,且只用了2048張h100的gpu集群,用時僅53天。在同等水平下,哪怕是全球ai第一梯隊的頭部公司,至少也要用到1.6萬張以上的gpu進行訓練。
市場認為,deepseek r1的成功可能削弱了市場對英偉達ai晶元需求的預期,已有多家券商發布相關研報。
實地探查deepseek
deepseek是家極為低調的創業公司,一度遊離在主流視野之外,但在2024年12月上線並同步開源deepseek-v3模型之後突然爆火。在這突然爆紅之際,深度求索卻選擇了「深潛」,不想與外部有任何形式的交流互動。
杭州深度求索的註冊地位於杭州市拱墅區環城北路169號匯金國際大廈西1幢1201室。
1月14日上午,21世紀經濟報道記者實地探訪了杭州匯金國際大廈。
匯金國際大廈由4幢寫字樓組成,均需要刷卡進入,其中ab樓的前台人員向21世紀經濟報道記者確認,「這裡是西1幢」,其表示,「需聯繫公司的對接人才能刷卡進電梯上樓」,拒絕了記者的進一步探訪要求。
而21世紀經濟報道記者多次撥打公開電話,均提示「暫時無法接通」。
「找他們的人踏破門檻了」,「最近幾波我們去約都沒約上」,有投資人向21世紀經濟報道記者透露。
此外,1月14日,21世紀經濟報道記者加入了深度求索的「官方交流98群」。該群的群公告寫道,「暫不對外進行項目合作,不提供私有化部署及相關支持服務;deepseek將集中研發精力奉上更強的模型,盡情
21世紀經濟報道記者曾注意到,群里一度討論氛圍熱烈,不時有人提問,「請問什麼時候發布 ios端?」「什麼時候出圖轉視頻的功能?」
諸多跡象表明,外界對神秘的deepseek充滿了好奇和期待。
概念股引爆a股,多家上市公司回應
1月27日,deepseek概念股引爆a股,網傳的多隻成分股高開或漲停。
南財快訊記者以投資者身份致電了10餘家上市公司,但由於今日是春節假期前最後一個交易日,僅有3家上市公司進行了回應。
並行科技(839493.bj)工作人員表示,公司在周末也關注到相關信息,目前正在和業務部門確認中,如果有後續信息,會第一時間發布相關公告。
杭錦科技(000818.sz)工作人員表示,具體信息以披露為準。
潤澤科技(300442.sz)工作人員表示,公司不了解終端客戶的具體情況。
南財快訊記者注意到,a股已有多家上市公司披露與deepseek的合作情況。
如崑崙萬維披露,公司攜手新加坡南洋理工大學成功開發q*演算法,顯著提升現有大模型推理能力。在math數據集上,q*幫助deepseek-math-7b提升至55.4%的準確率,超越了gemini ultra。
每日互動也表示,隨著行業進入大模型時代,公司也在第一時間接入chatgpt、文心一言、chatglm、通義千問、deepseek等國內外通用大模型,結合自身的數據積累和挖掘能力以及對特定行業深刻洞察,開發出垂直場景類大模型應用在商業營銷和公共服務領域。
不過也有公司表示未與deepseek合作。卓創資訊就稱,公司尚未與deepseek深度求索建立業務合作關係。
來源:21世紀經濟報道綜合財聯社、wind、東方財富、湛江發布
報料、維權通道:應用市場下載「晨視頻」客戶端,搜索「報料」一鍵直達;或微信添加報料客服:xxcbcsp;或撥打熱線0731-85571188。如需內容合作,請撥打政企服務專席19176699651。