最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」

2023年10月09日12:41:10 科技 1007

夢晨 發自 凹非寺
量子位 | 公眾號 QbitAI

一個神秘磁力鏈接,成了開源大模型社區的新寵。

裏面是來自法國的開源大模型Mistral-7B,大家試用下來,覺得Llama 2都不香了

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

有開發者建議,代碼之外的數據微調,34B以下規模先試試它就對了。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

也有公司開始把它用在簡歷自動解析和評估業務上。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

想基於Mistral創業的更是大有人在。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

發佈不到2周,配套生態也迅速發展起來,如何在單卡上微調的教程有了。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

各種基礎設施和工具鏈也添加了對Mistral-7B的支持。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

專用於代碼補全的微調版本也有人搞出來了。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

甚至有人基於它微調了一個神秘學玄學大模型,也很受歡迎。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

Meta剛剛發佈Llama的時候,迅速出現各種其他駝和神獸,發展成大模型動物園的場景太像了。

Mistral這個單詞在法語里代表冬季的一種強風。

羊駝們,準備好過冬了嗎?

Mistral為什麼火了?

先上總結,綜合官方公告和社區反饋,主要有5個方面:

性能更強,硬件需求更少,有2023年的知識,安全對齊沒那麼離譜,開源協議更寬鬆,

目前最好的7B模型

根據官方發佈公告,Mistral 7B在所有嘗試過的評測基準中超過Llama 2 13B。

並在代碼、數學和推理評測中超過Llama 1 34B。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

另外代碼任務上的表現接近專門的CodeLlama 7B,同時保留了自然語言能力。

上下文窗口也達到了8k。

更詳細的測評數據如下。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

筆記本輕鬆跑

以小勝大,意味着取得相似的效果硬件需求更少。

官方也特別說明用了各種優化手段,FlashAttention,Grouped-Query Attention,Sliding Window Attention一起上。

現在已經看到很多開發者曬自己在蘋果筆記本跑起來的經驗。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

量化後只需要6G顯存。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

訓練數據更新

官方沒有具體說明訓練數據截止日期。

但經網友測試,2023年3月OpenAI發佈GPT-4的事它也知道。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

相比之下Llama 2的預訓練數據截止到2022年9月,只有部分微調數據最多到2023年6月。

實用性更強

Llama 2的安全對齊措施非常充分嚴格,甚至損失了一部分實用性。

比如拒絕回答如何「殺死」一個Linux線程,只能說過於禮貌也是一種不禮貌了。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

還有創業者根據自己經歷總結了3點是Mistral-7B能做但Llama 2做不好的。

他做的是檢索複雜SQL語句,對比測試發現Llama 2 13B有幾個缺點:

  • 即使提供少樣本示例,也會在結構化輸出中插入評論
  • 會在時間字段上出錯
  • 在數據結構定義DDL中如果有多個表,總是漏掉至少一個表

而Mistral-7B具體效果還在測試中,至少這些問題都不存在。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

另外Mistral-7B還非常適合用來微調,官方也出了經過指令微調的聊天版本作為補充。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

開源協議更寬鬆

Mistral基於非常寬鬆的Apache2.0協議開源,免費,允許商業使用、修改和分發。

相比之下Meta為Llama 2準備的協議,甚至被開源界批評為嚴格來講不算真正的開源。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

比如有附加商業條款,月活超過7億的產品或服務需要單獨申請許可,這條主要針對大公司。

針對個人和小公司的也有不能使用Llama生成的結果來改進其他模型等。

歐洲的OpenAI

Mistral AI成立於今年5月,總部法國巴黎,3位創始人是DeepMind和Meta前員工,

外界將這家公司看成是歐洲的OpenAI

當初剛成立4周還沒有產品時,就靠6個員工7頁PPT拿到超過1億美元融資,當時還引起一番爭議,被當成是AI泡沫的代表。

Mistral AI最初計劃在2024年發佈首個大模型,沒想到剛到9月底就已拿出成果,團隊也擴大了不少。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

三位聯合創始人中,CEO Arthur Mensch此前在DeepMind巴黎工作。

CTO Timothée Lacroix和首席科學家Guillaume Lample則在Meta共同參與過Llama系列的研發,Lample是通訊作者之一。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

事實上Llama初始團隊中已有過半離職,其中Marie-Anne Lachaux後來也加入了Mistral AI。

有點子當年OpenAI部分員工出走成立Anthropic的意思了,歷史總是驚人的相似。

Mistral AI接下來也會繼續推出規模更大的模型,增強推理能力以及多語言能力。

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

如果你對Mistral-7B感興趣,可以在Perplexity或HuggingChat試玩。

labs.perplexity.ai

https://huggingface.co/chat

還有一個與Llama 2同台競技的小遊戲可玩。

https://llmboxing.com

最好的7B模型易主,免費開源可商用,來自「歐洲的OpenAI」 - 天天要聞

下載模型也可以去Hugging Face。

https://huggingface.co/mistralai

參考鏈接:
[1]https://mistral.ai/news/announcing-mistral-7b

[2]https://predibase.com/blog/fine-tuning-mistral-7b-on-a-single-gpu-with-ludwig
[3]https://x.com/hrishioa/status/1710702855491879027
[4]https://twitter.com/Teknium1/status/1710505270043189523

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

科技分類資訊推薦

無線信號增強秘籍,橋接和中繼模式哪個更強? - 天天要聞

無線信號增強秘籍,橋接和中繼模式哪個更強?

【ZOL中關村在線原創技術解析】隨着無線通信與計算機技術飛速發展,人們愈發渴望隨時隨地享受穩定的數據通信服務。無線路由器作為無線網絡核心設備,作用關鍵。但當其信號覆蓋不足,如穿過兩堵牆後信號微弱時,可通過無線橋接或中繼模式連接兩個無線路由器,擴展網絡、增強信號。中繼模式和橋接模式雖都能擴展網絡覆蓋,但...
流暢更耐用 魅族Note 16將預裝Flyme 12 - 天天要聞

流暢更耐用 魅族Note 16將預裝Flyme 12

魅族官方透露,將於5月發佈的魅族Note 16系列將出廠預裝Flyme 12新系統,這也是Flyme系統大版本首次在非旗艦機型上首發。魅族Note 16搭載紫光展銳T765處理器,配備6.78英寸LCD屏,分辨率達2460*1080。後置採用八邊形相機模組,由5000萬像素主攝和200萬像素鏡頭組成。續航方面,內置6600mAh大容量電池,支持40W有線充電
跨境電商迎「成本地震」,行業洗牌加速 - 天天要聞

跨境電商迎「成本地震」,行業洗牌加速

【環球網財經綜合報道】近日,美國正式終止了對中國價值不超過800美元的小額包裹免徵關稅的政策,這一變化引發了中國跨境電商行業的連鎖反應。多家物流公司隨即調整策略,物流費用普遍上漲,並增加了高額預收稅金。(圖片來源:東方IC)美國的800美元小額免稅政策(De Minimis)自2016年實施以來,極大地推動了全球跨境電商...
音樂節超時粉絲吵上熱搜!羅雲熙周深發佈聯合說明 - 天天要聞

音樂節超時粉絲吵上熱搜!羅雲熙周深發佈聯合說明

5月4日,太湖灣音樂節組委會「關於5月1日太湖灣音樂節的相關討論」,聯合羅雲熙工作室、周深工作室作出如下說明:在演出過程中,現場因節奏調整產生變化,相關團隊均已積極協作,確保了整體流程順利完成。對於由此引發的相關關注,我們充分理解大家的關心
國外一公司推出「空中單車」:可垂直起飛、極速200公里/時 - 天天要聞

國外一公司推出「空中單車」:可垂直起飛、極速200公里/時

快科技5月5日消息,近日,國外一家名為Volonaut的新成立公司推出了一款 「空中單車」,這是一款具有創新性和顛覆性的飛行載具。其由Jetson One(註:一款飛行器)創造者托馬斯・帕坦(Tomasz Patan)在波蘭研發,其設計靈感源自科幻電影,尤其是《星球大戰》中的飛行摩托。外觀上沒有傳統飛行器的冗餘結構,僅見容納推進...
全球首款雙形態人形機械人正式發佈! - 天天要聞

全球首款雙形態人形機械人正式發佈!

前言首次定義具身人形機械人商用範式。近日消息,全球首款雙形態人形機械人——數字華夏IP系列開山之作星行俠P01正式發佈。顏值高、智商高、易使用首次定義具身人形機械人商用範式據悉,數字華夏推出IP系列的初衷,是打造屬於這個時代的「商用機械人」。「外形潮流時尚、智商情商兼具、使用維護極簡,首次定義具身人形機...
三星One UI 8測試版或下月推出 給後續修復留出時間 - 天天要聞

三星One UI 8測試版或下月推出 給後續修復留出時間

【CNMO科技消息】三星已經開始內部測試全新的One UI 8系統,同時也在包括Galaxy Z Flip6在內的多款設備上進行適配測試。按照目前的進度來看,這次更新的到來時間可能比很多人預想得更早,有可能會在今年7月或8月之前就正式推出。 和以往一樣,三星應該會先上線One UI 8的測試版計劃,給部分用戶提前嘗鮮的機會。根據最新消...
蘋果引入Anthropic開發的Claude AI系統 欲放棄自研? - 天天要聞

蘋果引入Anthropic開發的Claude AI系統 欲放棄自研?

【CNMO科技消息】蘋果最近開始引入Anthropic公司開發的Claude AI系統,用於協助其工程師更高效地編寫代碼。 長期以來,蘋果一直堅持自主研發核心技術,很少依賴外部力量。但這一次,它選擇與Anthropic合作,將後者的Claude Sonnet模型集成到自家開發工具Xcode的升級版本中。據彭博社報道,這項合作已經開始在內部落地,主要...
6 大升級!Apple Watch SE 3 入門款到底有多能打? - 天天要聞

6 大升級!Apple Watch SE 3 入門款到底有多能打?

文 | 路邊同學還有 4 個月,蘋果將推出新一代入門級智能手錶 —— Apple Watch SE 3。這款原計劃在 2024 年發佈的機型,因市場節奏調整延後至今,卻也讓外界對其升級細節有了更充分的爆料空間。