國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一

2024年05月07日14:21:29 科技 4386

明敏 發自 凹非寺

量子位 | 公眾號 qbitai

最新國產開源moe大模型,剛剛亮相就火了。

deepseek-v2性能達gpt-4級別,但開源、可免費商用、api價格僅為gpt-4-turbo的百分之一。

因此一經發布,立馬引發不小討論。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

從公布的性能指標來看,deepseek-v2的中文綜合能力超越一眾開源模型,並和gpt-4-turbo、文心4.0等閉源模型同處第一梯隊。

英文綜合能力也和llama3-70b同處第一梯隊,並且超過了同是moe的mixtral 8x22b。

在知識、數學、推理、編程等方面也表現出不錯性能。並支持128k上下文。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

這些能力,普通用戶都能直接免費使用。現在內測已開啟,註冊後立馬就能體驗。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

api更是是骨折價:每百萬tokens輸入1元、輸出2元(32k上下文)。價格僅為gpt-4-turbo的近百分之一。

同時在模型架構也進行創新,採用了自研的mla(multi-head latent attention)和sparse結構,可大幅減少模型計算量、推理顯存。

網友感嘆:deepseek總是給人帶來驚喜!

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

具體效果如何,我們已搶先體驗!

實測一下

目前v2內測版可以體驗通用對話代碼助手

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

在通用對話中可以測試大模型的邏輯、知識、生成、數學等能力。

比如可以要求它模仿《甄嬛傳》的文風寫口紅種草文案。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

還可以通俗解釋什麼是量子糾纏。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

數學方面,能回答高數微積分問題,比如:

使用微積分證明自然對數的底e 的無窮級數表示。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

也能規避掉一些語言邏輯陷阱。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

測試顯示,deepseek-v2的知識內容更新到2023年。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

代碼方面,內測頁面顯示是使用deepseek-coder-33b回答問題。

在生成較簡單代碼上,實測幾次都沒有出錯。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

也能針對給出的代碼做出解釋和分析。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

不過測試中也有回答錯誤的情況。

如下邏輯題目,deepseek-v2在計算過程中,錯誤將一支蠟燭從兩端同時點燃、燃燒完的時間,計算成了從一端點燃燒完的四分之一。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

帶來哪些升級?

據官方介紹,deepseek-v2以236b總參數、21b激活,大致達到70b~110b dense的模型能力。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

和此前的deepseek 67b相比,它的性能更強,同時訓練成本更低,可節省42.5%訓練成本,減少93.3%的kv緩存,最大吞吐量提高到5.76倍。

官方表示這意味著deepseek-v2消耗的顯存(kv cache)只有同級別dense模型的1/5~1/100,每token成本大幅降低。

專門針對h800規格做了大量通訊優化,實際部署在8卡h800機器上,輸入吞吐量超過每秒10萬tokens,輸出超過每秒5萬tokens

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

在一些基礎benchmark上,deepseek-v2基礎模型表現如下:

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

deepseek-v2 採用了創新的架構。

提出mla(multi-head latent attention)架構,大幅減少計算量和推理顯存。

同時自研了sparse結構,使其計算量進一步降低。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

有人就表示,這些升級對於數據中心大型計算可能非常有幫助。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

而且在api定價上,deepseek-v2幾乎低於市面上所有明星大模型。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一 - 天天要聞

團隊表示,deepseek-v2模型和論文也將完全開源。模型權重、技術報告都給出。

現在登錄deepseek api開放平台,註冊即贈送1000萬輸入/500萬輸出tokens。普通試玩則完全免費。

感興趣的童鞋,可以來薅羊毛了~

體驗地址:

https://chat.deepseek.com

api平台:

platform.deepseek.com

github:

https://github.com/deepseek-ai/deepseek-v2?tab=readme-ov-file

科技分類資訊推薦

海信推出 Vidda NEW S100 Pro 電視:100 英寸 192 分區,8999 元 - 天天要聞

海信推出 Vidda NEW S100 Pro 電視:100 英寸 192 分區,8999 元

IT之家 5 月 19 日消息,海信今天在京東上架一款 Vidda NEW S100 Pro 電視,這款電視主打「100 英寸 144Hz」,不過僅有 192 分區,該電視將於 5 月 21 日凌晨 0 點開售,首發價 8999 元。據介紹,這款電視配備 3840 x 2160 解析度 144Hz 面板,擁有 192 分區,覆蓋 85% DCI-P3 色域,
中核集團:全國最大海上光伏電站開工建設,2025 年全容量併網 - 天天要聞

中核集團:全國最大海上光伏電站開工建設,2025 年全容量併網

IT之家 5 月 19 日消息,據中核集團消息,5 月 19 日,我國最大的海上光伏項目 —— 中核田灣 200 萬千瓦灘涂光伏示範項目在江蘇連雲港正式開工建設。▲ 圖源中核集團公眾號,下同據介紹,項目預計於 2024 年 9 月首次併網,2025 年全容量併網,在運行期 25 年內年平均上網電量 22.34 億千瓦時,能夠滿足中等發達國家約 23...
長治振興小鎮「研學熱」持續升溫 「教育+科技」是亮點 - 天天要聞

長治振興小鎮「研學熱」持續升溫 「教育+科技」是亮點

田小麗立夏之後,暑氣漸顯。長治振興小鎮「研學熱」持續升溫,研學團接踵而至。5月11日,來自長治市實驗小學的學生走進振興小鎮,開展「感觸科技魅力 體驗非遺傳承」趣味研學游活動。5月18日,長治市平順縣苗庄中心校、北社中心校研學團隊走進振興小鎮開展「紅色教育點亮心燈 勞動實踐助力成長」研學游活動。……科技創新、...
聚焦數據要素×、AI安全等話題,2024西湖論劍·數字安全大會舉行 - 天天要聞

聚焦數據要素×、AI安全等話題,2024西湖論劍·數字安全大會舉行

5月18日,以「智繪安全 乘數而上」為主題的2024第十二屆西湖論劍·數字安全大會在杭州國際博覽中心舉行。作為國內首個進入第十二年的數字安全行業盛會,大會聚焦探討「數字安全助力數據要素×產業落地」「AI引領數字安全變革」等議題,全面、深入探討人工智慧浪潮下的數字安全新質生產力實現路徑,旨在為國內數字安全領域提...
使用Python Tkinter庫打造簡陋股票補倉計算器桌面應用 - 天天要聞

使用Python Tkinter庫打造簡陋股票補倉計算器桌面應用

前言大家好,最近洒家在股市裡虧麻了,洒家就尋思用python搗鼓一個簡陋的股票補倉計算器的桌面小工具,方便隨時計算補倉成本,廢話不多說,咱們這就開干!編程環境1.文中電腦操作系統:win72.文中所使用的python模塊:(1).
618來真的,iPhone和iPad全線降價,手機4699元,新平板4599元 - 天天要聞

618來真的,iPhone和iPad全線降價,手機4699元,新平板4599元

眾所周知,由於競品實力強大,自身創新不足,一季度蘋果手機在國內市場份額下跌不少,相比於去年一季度,有19.1%的下跌。而來到第二季度,也是傳統的大促618,蘋果終於發力了,手機平板全線降價,誓要奪回市場份額。我們看了下,確實是來真的,沒有各種條件,從5月20日起直接降價。其中,iPhone 15 128GB版本直接降價1300元...
76億!孫正義再出手,領投比爾·蓋茨狂贊的自動駕駛獨角獸 - 天天要聞

76億!孫正義再出手,領投比爾·蓋茨狂贊的自動駕駛獨角獸

作者丨巴里編輯丨關雎題圖丨圖蟲創意今年自動駕駛賽道最大的一輪融資來了!日前,英國自動駕駛獨角獸Wayve宣布獲得10.5億美元(約75.76億元人民幣)C輪投資,本輪融資由軟銀集團領投,新投資方英偉達和現有投資方微軟跟投。同時,作為最終交易的一部分,軟銀將加入Wayve的董事會。據悉,該行業上一筆10億美元級別融資發生在...
華為手錶推出520主題表,營造極致浪漫美學 - 天天要聞

華為手錶推出520主題表,營造極致浪漫美學

5 月確實是一個繽紛多彩的月份,在勞動節和母親節之後,年輕人們又開始關注起 520 這個諧音「我愛你」的特殊日子,甚至也有網友將其命名為「網路情人節」,「大膽表達愛」已然成為這個特殊日子的一種潮流。也就是在這樣的一個特殊日子裡,華為傾聽到了眾多年輕人的心聲,在520前夕帶來了全新的華為 520 主題錶盤,幫助用戶...