Mistral AI推出24B開源模型,能運行於32GB RAM蘋果MacBook

2025年01月31日22:23:05 科技 1588

同樣面對 AI 大模型領域的“鯰魚”DeepSeek,不同於美國 AI 公司 Anthropic CEO 達里奧·阿莫迪(Dario Amodei)用“萬字檄文”施壓白宮加強管制的敵對態度,法國明星 AI 公司 Mistral AI 則在發布自家新模型的同時在其技術博文中兩次“致敬”DeepSeek。



Mistral AI推出24B開源模型,能運行於32GB RAM蘋果MacBook - 天天要聞

圖 | Mistral AI 在技術博文中兩次提及 DeepSeek(來源:Mistral AI)


當地時間 1 月 30 日,Mistral AI 發布一款名為 Mistral Small 3 的開源模型。與此同時,其發表了一篇技術博文針對該模型加以詳細介紹。


Mistral AI 在博文中表示:“Mistral Small 3 既沒有經過強化學習訓練,也沒有經過合成數據訓練,因此比 Deepseek R1(一項偉大而互補的開源技術!)等模型更早進入模型生產流程。”


其還寫道:“對於開源社區來說,這是激動人心的日子!和最近發布的 DeepSeek 一樣,Mistral Small 3 為大型開源推理模型帶來了補充,作為一款強大的基礎模型,其推理能力得到了更進一步的發展。”言辭之間,似乎流露着 Mistral AI 對於 DeepSeek 的惺惺相惜。



Mistral AI推出24B開源模型,能運行於32GB RAM蘋果MacBook - 天天要聞

(來源:Mistral AI)


據介紹,Mistral Small 3 是一個經過預訓練和指導的模型,其參數為 240 億,其在大規模多任務語言理解(MMLU,Massive Multitask Language Understanding)上的準確率超過 81%,延遲為 150 tokens/秒,並可以被部署在任何設備上,甚至能在 32GB RAM 的蘋果 MacBook 上運行。


值得一提的是,Mistral Small 3 的層數遠少於同類模型,大大減少了每次前向傳播的時間。


Mistral Small 3 與 Llama 3.3 70B 的指令相當,但在相同硬件上速度快出 3 倍以上。這讓 Mistral Small 3 能與 Llama 3.3 70B 或 Qwen 32B 等參數更大的模型相媲美。


Mistral AI 表示,Mistral Small 3 是 GPT-4o mini 等閉源專有模型的優秀開源替代品,還稱 Mistral Small 3 在延遲上得到了優化。



Mistral AI推出24B開源模型,能運行於32GB RAM蘋果MacBook - 天天要聞

(來源:Mistral AI)


在評估該模型的性能時,Mistral AI 與外部第三方供應商一起針對 1k 多個專有編碼和通才提示進行並排評估。這項評估任務旨在從 Mistral Small 3 與從另一個匿名模型生成的內容中,挑選出來更受歡迎的模型響應。


Mistral AI 在博文中寫道:“我們意識到在某些情況下,人類判斷的基準與公開可用的基準截然不同,但在核實公平評估時我們格外謹慎。因此我們相信,上述基準是有效的。”


評估結果顯示,相比三倍於其大小的開源權重模型和專有 GPT4o-mini 模型,Mistral Small 3 的指令調優模型在代碼、數學、常識和指令遵循基準測試上更加出色。


由於所有基準測試的性能準確性,均是通過相同的內部評估流程獲得。因此,測試結果可能與 Qwen2.5-32B-Instruct、Llama-3.3-70B-Instruct、Gemma-2-27B-IT 這幾款模型之前報告的性能略有不同。


而 Wildbench、Arena hard 和 MTBench 等基於評判的評估,均基於 OpenAI 於 2024 年 5 月 13 日發布的 GPT-4o 模型。


Mistral AI 表示,Mistral Small 3 是目前同類產品中最有效的模型,它很好地補全了大型開源推理模型,其還稱 Mistral Small 3 極大降低了計算成本,並表示這可能會重塑先進 AI 部署的經濟性。


正因此,Mistral AI 在其領英主頁上稱 Mistral Small 3 是“加速全球各行各業採用生成式 AI 的遊戲規則改變者(game-changer)”。



Mistral AI推出24B開源模型,能運行於32GB RAM蘋果MacBook - 天天要聞

(來源:Mistral AI)


Mistral AI 的聯合創始人兼首席科學官紀堯姆·蘭普萊(Guillaume Lample)也告訴媒體:“我們認為,它在所有參數小於 700 億的模型中是最好的。”“我們估計它基本上與幾個月前發布的 Meta Llama 3.3 70B 相當,而 Mistral Small 3 卻比它小了近三倍。”


據介紹,Mistral AI 之所研發這款新模型,是為了在適合本地部署的規模上拉滿模型性能。Mistral AI 的技術方法側重於效率而非規模,其主要通過迭代模型訓練技術來提高模型性能,這樣一來無需再投入更多的計算能力。


事實上,不僅 Mistral AI 的模型訓練方式有所不同,其模型優化的方式也有所不同。據介紹,Mistral Small 3 在 8 萬億個 tokens 上進行訓練,而同類模型的訓練量為 15 萬億,這讓那些重視計算成本的企業更容易獲得先進的 AI 功能。


據該公司稱,Mistral Small 3 可以在單個圖形處理器(GPU,graphics processing unit)上運行,並能處理 80-90% 的典型業務,這些業務往往需要嚴格的語言和指令遵循表現、以及對於延遲要求非常低。與此同時,Mistral AI 在 Apache 2.0 協議下發布了預訓練和指令調優的檢查點。



Mistral AI推出24B開源模型,能運行於32GB RAM蘋果MacBook - 天天要聞

(來源:Hugging Face)


目前,該模型已經可以在 Hugging Face、Ollama、Kaggle、Together AI、Fireworks AI 等平台下載使用,未來不久開發者也能在 NVIDIA NIM、Amazon SageMaker、Groq、Databricks 和 Snowflake 等平台下載使用。


Mistral Small 3 允許企業自由修改和部署它,因此 Mistral AI 表示它非常期待開源社區來採用 Mistral Small 3 以及基於定製其進行模型性質,並表示非常歡迎開發者通過破解 Mistral Small 3 來使其變得更好。


同時,Mistral AI 還在官網預告稱,預計未來幾周內 Mistral AI 的小模型和大模型將具有更強的推理能力。


隨着 AI 行業的成熟,Mistral AI 對更小、更高效模型的關注,可能會被證明是一種具有先見之明的做法。目前,OpenAI 和 Anthropic 等公司更專註於開發越來越大、越來越昂貴的模型,而 Mistral AI 的做法則和其形成鮮明對比。


該公司的聯合創始人兼首席科學官紀堯姆·蘭普萊(Guillaume Lample)也預測稱:“很多開源模型都可能帶有非常寬鬆的許可證。我們認為,這種‘條件型(conditional)’模型很可能會成為一種商品。”


另據悉,Mistral AI 成立於 2023 年 4 月,一共有三位創始人。他們分別是:擔任聯合創始人兼 CEO 的阿瑟·曼斯(Arthur Mensch)、擔任聯合創始人兼首席科學家的紀堯姆·蘭普萊(Guillaume Lample)以及擔任聯合創始人兼 CTO 的蒂莫西·拉克魯瓦(Timothée Lacroix)。



Mistral AI推出24B開源模型,能運行於32GB RAM蘋果MacBook - 天天要聞

(來源:https://medium.com)


聯合創始人兼 CEO 阿瑟·曼斯(Arthur Mensch)此前曾在 DeepMind 的法國工作室擔任研究員。其本科畢業於法國巴黎綜合理工學院,碩士畢業於法國巴黎薩克雷高等師範學校,博士畢業於法國巴黎薩克雷大學。



Mistral AI推出24B開源模型,能運行於32GB RAM蘋果MacBook - 天天要聞

圖 | 阿瑟·曼斯(Arthur Mensch)(來源:領英)


聯合創始人兼首席科學家紀堯姆·蘭普萊(Guillaume Lample)此前曾在 Meta 法國分公司工作過六年多之久。早年其先後在法國巴黎綜合理工學院和美國卡內基梅隆大學獲得兩個碩士學位,並在法國巴黎第六大學獲得博士學位。



Mistral AI推出24B開源模型,能運行於32GB RAM蘋果MacBook - 天天要聞

圖 | 紀堯姆·蘭普萊(Guillaume Lample)(來源:https://www.actuia.com/acteur/guillaume-lample/)


聯合創始人兼 CTO 蒂莫西·拉克魯瓦(Timothée Lacroix)此前也在 Meta 法國分公司工作過數年之久,早年其在法國巴黎高等師範學院獲得了本科學位。



Mistral AI推出24B開源模型,能運行於32GB RAM蘋果MacBook - 天天要聞

圖 | 蒂莫西·拉克魯瓦(Timothée Lacroix)(來源:https://soundcloud.com/timothee-lacroix)


2024 年夏,Mistral AI 獲得 6 億歐元的融資,投資者中包含微軟英偉達。目前,Mistral AI 公司估值約為 60 億美元,其將自己定位為全球 AI 競賽中的“歐洲領頭羊”。


2025 年 1 月,Mistral AI 與法新社簽署了一項協議,這讓用戶使用 Mistral AI 的產品能夠訪問法新社以六種語言發布的新聞。


最近,該公司的聯合創始人兼 CEO 阿瑟·曼斯(Arthur Mensch)在參加達沃斯世界經濟論壇時,接受了彭博社的採訪。採訪中其表示,Mistral AI 正在為最終的首次公開募股(IPO,Initial Public Offering)做準備。


在全球 AI 領域,“法國 AI”是一股不可忽視的力量。圖靈獎得主&Meta 首席科學家楊立昆Yann LeCun)、“Keras 之父”& 前谷歌高級工程師弗朗索瓦·肖萊(François Chollet)均出生於法國。


法國現任法國總統馬克龍也曾表示希望將法國變為歐洲的一個創業國家,此前馬克龍還親自出席過巴黎一家孵化器的落成典禮。


儘管如此,作為一家 AI 公司要想在全世界都能“吃得開”那就必須擁抱美國市場,此前有報道稱 Mistral AI 將在美國加州舊金山灣區帕洛阿托建立辦事處。


與此同時,該公司還計劃在新加坡開設一個辦事處,以便更好地拓展亞太地區業務。總之,Mistral AI 早已不滿足於在法國發展而是志在全球。


參考資料:

https://mistral.ai/news/mistral-small-3/

https://venturebeat.com/ai/mistral-small-3-brings-open-source-ai-to-the-masses-smaller-faster-and-cheaper/

https://www.zdnet.com/article/mistral-ai-says-its-small-3-model-is-a-local-open-source-alternative-to-gpt-4o-mini/

https://insiderpaper.com/frances-mistral-hails-deepseeks-ai-model/

https://www.linkedin.com/feed/update/urn:li:activity:7290735119026257921/

https://techcrunch.com/2025/01/21/mistral-ai-plans-ipo/

https://www.ibm.com/think/news/french-ai-goes-west

https://www.pymnts.com/artificial-intelligence-2/2024/mistral-reportedly-eyes-us-expansion-to-take-on-ai-giants/


運營/排版:何晨龍

科技分類資訊推薦

補貼後售價20.49萬元起,大六座SUV深藍S09正式上市並開啟交付 - 天天要聞

補貼後售價20.49萬元起,大六座SUV深藍S09正式上市並開啟交付

深藍CEO承諾深藍S09一年不降價,為什麼這一句承諾引起很多關注?因為近年來太多“背刺”老車主的事情,讓咱們害怕買車就降價,感覺自己虧了。其實新車上市沒多久就降價,主要是因為市場競爭壓力,和產品技術迭代太快,這兩個因素造成的結果。
百度發布金融行業大模型,沈抖:產業從提示詞優化走向智能體構建 - 天天要聞

百度發布金融行業大模型,沈抖:產業從提示詞優化走向智能體構建

圖片系AI生成6月6日消息,在2025智能經濟論壇上,百度集團執行副總裁、百度智能雲事業群總裁沈抖宣布,目前已有65%的央企選擇與百度智能雲開展深度合作,同時百度智能雲發布千帆慧金金融大模型,並推出了覆蓋能源、交通、汽車、醫療、環境等領域的精選行業場景智能體家族。百度摸索行業大模型,金融領域做試點行業大模型是...
一日一技:如何正確渲染大模型返回的Markdown? - 天天要聞

一日一技:如何正確渲染大模型返回的Markdown?

我們經常讓大模型返回Markdown格式的文本,然後通過Python的markdown庫把文本渲染成HTML。但不知道大家有沒有發現,大模型返回的Markdown並不是標準的Markdown。特別是當返回的內容包含列表時,大模型返回的內容有
迷你電腦、筆記本、整機都不足2000元,618這幾款低價PC很彪悍 - 天天要聞

迷你電腦、筆記本、整機都不足2000元,618這幾款低價PC很彪悍

最近朋友想買一款2000元內的電腦,主要是家裡辦公用。由於有顯示器,所以就想買個主機,也就可以了。評價君不看不知道,看了一下發現,在低價電腦方面,現在出的最多的要數宏碁了,其迷你電腦、筆記本、整機都不足2000元,給出了豐富的選擇。首先是商用台式機Veriton D750,原價1999元,補貼價1599元。這款電腦採用了銳龍5...
全球壟斷卻賣不動?ASML的尷尬:最牛光刻機遭台積電嫌棄 - 天天要聞

全球壟斷卻賣不動?ASML的尷尬:最牛光刻機遭台積電嫌棄

ASML這家公司活得挺憋屈——手握全球90%的光刻機市場,EUV光刻機更是獨門生意,按理說該躺賺。可現實是,它正被兩頭堵得喘不過氣:一邊是美國攥着對華出口的“遙控器”,另一邊是自家最先進的設備賣不動,連台積電都甩臉子不買賬。先說美國的“緊箍
小米:被罵得越狠,賣得越火?揭秘“招黑體質”背後的生存法則 - 天天要聞

小米:被罵得越狠,賣得越火?揭秘“招黑體質”背後的生存法則

小米這家公司,真是行業里的“奇葩”。自打誕生起,罵聲和掌聲就從來沒斷過。有人誇它是“價格屠夫”,有人罵它是“組裝廠”;有人捧它“讓科技更親民”,有人踩它“沒核心技術”。可怪就怪在這兒——挨罵最多的小米,反而越活越滋潤,手機、家電、汽車樣樣開
充電時,先插手機還是充電器?這幾種充電方法,手機壞得快! - 天天要聞

充電時,先插手機還是充電器?這幾種充電方法,手機壞得快!

我們每天都在使用手機,但很多人可能不知道正確的手機充電方式。充電時,先插手機還是充電器?手機一定要滿充滿放嗎?這些知識一定要掌握01手機一定要滿充滿放嗎?關於充電,總流傳着一些說法:手機電量耗盡再充電,每次要充滿,這樣才有利於電池保養,隨時充會影響電池壽命。實際上,這些理論都比較過時了。早些年廣泛使...
全球第一台積電,對比大陸第一中芯國際,差距究竟有多大? - 天天要聞

全球第一台積電,對比大陸第一中芯國際,差距究竟有多大?

眾所周知,在全球芯片代工領域,台積電是真正的第一名,不管是技術,還是市場份額都是第一名。而在中國大陸,則中芯國際是第一名,同樣不管是技術,還是市場份額,都是中國大陸的第一名。那麼問題來了,我們拿台積電,來對比一下中芯國際,看看差距到底有多大