AI 月報:10 億美元訓練不出 GPT-5;低成本中國開源大模型走紅;AI 幻覺不全是壞處

2024 年 12 月的全球 ai 大事記。

文丨賀乾明編輯丨程曼祺

2024 年 12 月的 ai 月報,你會看到:

  • openai、google 發布新模型,中國的 deepseek 也搶到了風頭

  • gpt-5 訓練遇阻的更多細節

  • 強化學習的重要性持續提升

  • 至少有三個團隊推出了世界模型

  • google 霸佔大模型競技場前三

  • 中國公司在開源社區存在感大漲

  • 博通幫大公司自研 ai 晶元,市值破萬億美元

  • openai 正式啟動轉型營利公司

  • 20+ ai 公司獲 5000 萬美元以上投資,有 2 家中國公司

  • 大模型的幻覺並不是一無是處

以下是我們第 2 期 ai 月報,歡迎大家在留言區補充我們沒有提到的重要進展。

技術|10 億美元沒訓出 gpt-5,新版 scaling laws 初步證明可行,多款世界模型亮相

gpt-5 訓練遇阻的更多細節

openai 訓練 gpt-5(代號 orion)遇阻,是大模型能力提升放緩的重要證據。12 月,多家媒體提供了更多的細節:

2023 年 4 月推出 gpt-4 後,openai 一直在開發 gpt-5,已經持續 20 個月。openai 看到過樂觀信號:24 年 4 月,openai ceo 山姆·阿爾特曼(sam altman)在斯坦福大學的演講中說,gpt-5 將比當時的模型聰明得多;5 月,他在公司內部也發表了類似的看法;openai 最大的投資方微軟預計年中能看到 gpt-5。

阿爾特曼當時在公司內部說,雖然(應該是第二遍訓練)gpt-5 的訓練過程只完成了 20%,但它回答問題、完成任務等能力已經與 gpt-4 相當。但從那之後,gpt-5 的性能提升放緩,最後並沒有超出 gpt-4 太多。而 openai 一直希望 gpt-5 能到博士生水平。

到 12 月,openai 至少從頭訓練了兩遍 gpt-5,都沒有達到預期。openai 內部和行業人士估計,openai 訓練一遍 gpt-5,算力成本就有 5 億美元。

公開優質數據不夠了,用人和 o1 來湊

openai 訓練 gpt-5 的麻煩是缺少多樣化、高質量的數據。此前,openai 幾乎抓了互聯網上所有公開的優質數據,並儘可能購買大量版權數據,還是不夠。

openai 的解決辦法是,用大模型生成數據訓練模型。這種方法存在問題,大模型本身就是它訓練數據的壓縮,所以 ai 生成的數據質量通常較差。openai 的科學家們認為,他們的新模型 o1 可以避免這些問題。

openai 也在僱傭一批人寫數據。他們不再是在經濟落後區域做數據標註或審查內容的工人,而是軟體工程師、數學家、物理學家等。openai 讓他們編寫複雜題目、給出答案,把最高效的解題過程寫下來。一部分研究者還認為,代碼數據能幫大模型解決尚未遇到的問題。

但這個過程比較緩慢。假設 1 人 1 天寫 5000 字,1000 人要 200 天才能生產 100 億字的數據,而 gpt-4 訓練的數據量超過 10 萬億字。

此外,還有另一個數據證明,更多人工能提升大模型能力。12 月,ai 軟體基礎設施公司 langchain 發布年度報告,用他們工具的大模型應用開發者,拿人類反饋提升大模型能力的次數增長了 18 倍。

一位中國雲計算平台企業 ai 應用負責人告訴我們,基於人類反饋的強化學習,現在已經成為他們為大型客戶提供 ai 服務的標配。

強化學習重要性再提升,新 scaling laws 初步證明可行

2024 年 9 月,openai 發布 o1 模型,稱模型花更多時間、更多算力回答問題(test-time compute),能力會持續提升。那時,大模型訓練有了陷入瓶頸的跡象——增加數據、算力,擴大模型參數規模,但性能提升緩慢。

3 個月後,openai 正式放出 o1,用實際能力證明它解決數學題或編程問題時,的確比 gpt-4o 等模型更強。比如它幾乎每一次都能判斷 9.9 比 9.11 大,gpt-4o 現在不行。

12 月亮相的新模型 o3,證明 openai 從 o1 中看到的規律——回答問題時花更多算力的 o3,在頂尖編程競賽 codeforces 中,得分比 o1 提升 44%,超過 openai 首席科學家,排進人類前 200;在前沿數學測試基準 epochai 中解決 25.2% 的問題,其他模型都沒有超過 2%。

o3 在頂尖編程競賽 codeforces 測試中的表現。

「當山姆和我們的研究人員說 agi 即將到來,不是為了推銷每月訂閱費達到 2000 美元的服務,也不是誘騙投資。」openai 的研究員約翰·霍爾曼(john hallman)說。

但 o3 的 agi 能力評測得分可能虛高。openai 稱,o3 在基準測試 arc-agi 中得分達到 87.5%,是 o1 的三倍。但根據 arc-agi 官方網站,openai 提前用了 75% 的 arc-agi 的公開數據集訓練過 o3。研究者 knight lee 說,其他 ai 模型沒有做過這件事。

此外,o3 成本高昂,高性能模式算一次上千美元。而且和 o1 一樣,o3 在數學、編程等理科場景表現突出,在處理文本方面大概率跟 gpt-4o 沒太大差別。

openai 還公布了一種針對 o 系列模型的微調方法,稱為 rft(reinforcement fine-tuning),開發者能用強化學習的方法提高 o 系列模型解決特定任務的能力。訓練 o 系列模型時,openai 就用了強化學習。他們最新的動作表明,強化學習在大模型領域會越來越重要。

降成本、做 agent,模型應用的迭代趨勢

12 月 20 日,google 推出類似 o1 的模型 gemini 2.0 flash thinking,表示他們的模型回答問題更快。此前幾天,google 也推出了新款基礎模型 gemini 2.0 flash。

google 這兩款模型,指向大模型更廣泛應用時的迭代方向:降低成本、提高 agent 能力。

正如 meta ceo 馬克·扎克伯格(mark zuckerberg)所說,「即使大模型不再改進,在現有技術上開發消費和企業產品,也有很大的空間。」

微軟早就看準這個方向,這個月推出第四代 phi 大模型,只有 140 億參數,但數學題推理等任務上要強過 google 的 gemini pro 1.5 等參數更大、算力消耗更多的模型。

google 推出 gemini 2.0 flash 時,還強調它專為 「agent」 開發。與其他大模型不同,google 訓練模型時,就嘗試提升模型調用 google 搜索、代碼執行和第三方定義函數等工具的能力。推出模型時,google 也發布了用於科研、編程等的多款 agent 應用。

我們在上期月報中提到,agent 是當前大模型行業的新趨勢,從 google 到微軟等大公司,openai 到 anthropic 等明星 ai 創業公司,以及新出現的創業公司都在探索這個方向。

矽谷孵化器 yc 的合伙人們認為,agent 會是新時代的 saas,市場空間要比當前的 saas 大 10 倍。

世界模型進展:李飛飛、deepmind 和 cmu 新做了什麼

openai 終於發布視頻生成模型 sora,底層技術沒有太大的更新,決定了它一發布就陷入包圍圈。10 個月過去,在 openai 帶隊訓練 sora 的研究者之一蒂姆·布魯克斯(tim brooks)都被 google 挖走了。

sora 放開後不久,google 就推出了新的視頻生成模型 veo 2,稱它可以生成解析度高達 4k、長度超過 2 分鐘的視頻,都超過 sora。不過 google veo 2 還是期貨,就像當時的 sora。

openai 在這一方向上面臨的壓力不止於此。他們在 2 月介紹 sora,說沿著視頻生成模型擴展,是開發物理世界模擬器的一條有前途的路徑。

現在已經有了多個團隊取得了成果,跟 openai 沒太大關係。以色列創業公司 decart 用大模型生成了名叫 oasis 的開放世界遊戲,就像 「我的世界」 那樣,已經吸引上百萬用戶。這個月,還有三個團隊發布新成果:

  • deepmind 推出 genie 2 模型,宣稱可以生成不同視角的、連貫的虛擬世界,大多數情況持續 10~20 秒,最長可以達到一分鐘。比如用戶輸入 「森林中的可愛人形機器人」,模型可以生成一個包含機器人角色、可以探索的動態場景。用戶可以用鍵盤或滑鼠操作角色在場景中行動、跳躍、游泳等。

  • 知名 ai 科學家李飛飛創辦的公司 world labs 推出首個項目,根據一張 ai 生成的圖片,加上提示詞,就可以生成類似 3d 遊戲中的場景。他們有 genie 2 模型那種可以交互的能力,並強調可以修改場景。

  • cmu、英偉達、北大等 19 個機構的團隊發布 genesis,稱其是一種新的開源計算機模擬系統,機器人可以在其中模擬、學習要在現實中執行的任務,比如撿東西、走路、操作設備等,速度比現實世界快 43 萬倍。他們展示了機器人迅速在 genesis 環境中學會後空翻,用到機器狗上的情況。他們在研究生成 「4d 動態世界」 的能力,然後利用 genesis 的能力創建世界。

world labs 推出的 ai 系統 demo。

deepmind 繼續更新天氣預報 ai

deepmind 沒有把所有的團隊都押注在大模型上,還在持續研究怎麼用 ai 研究量子計算、生物、核聚變、天氣預報等。

這個月,deepmind 發布新款的天氣預報模型 gencast,用 40 年的天氣數據訓練,宣稱只用一塊 tpu ,就能在 8 分鐘內生成 15 天的天氣預報,現有的天氣預報系統用超級計算機需要數個小時,準確率還不高。

差別在於,傳統的方法是計算複雜的物理公式,而 deepmind 的方法是從海量數據中尋找規律。deepmind 在《自然》雜誌發表的論文中寫道,他們的 ai 預測颶風的前進路徑的準確度,始終強過歐洲天氣預報中心,會有助於減少災害造成的損失。

競爭|google 支棱起來了,中國在開源社區存在感大增

google 霸榜大模型競技場

12 月,除了發布兩款 gemini 2.0 flash 模型,google 還上線了一個名叫 「gemini -exp-1206」 的基礎模型,它們一起把 openai 的模型擠出 chatbot arena 前三。

相比各個公司發布模型時強調的 mmlu、gpqa 等基礎測試,chatbot arena 讓用戶對匿名的大模型回答評分,更偏向用戶實際感受。

2023 年 4 月,加州大學伯克利分校的兩名研究者推出 chatbot arena 以來,openai 的模型長期在榜首。如果被擠下來,openai 也會更新模型衝上去。

過去這個月,openai 推出了正式版 o1,但在聊天機器人這個大模型最主流的應用場景中,它的評分還比不上 gpt-4o,以及 google 發布的同類模型 gemini 2.0 flash thinking。

9 月,google 推出更新版的 notebooklm,用戶可以根據上傳的文檔等資料,與大模型自由問答,甚至生成播客內容,引發了好評。再加上這個月的進展,google 終於有了一種支棱起來的感覺。半年前,它還因為自己的大模型建議人吃石頭、在披薩上塗膠水受到嘲笑。

據媒體報道,2024 年 google ceo 桑達爾·皮查伊用了多種方法提升員工的戰鬥力:

  • 與員工交流時,經常提到兩位創始人,提醒創業艱難。兩位創始人目前在 google 活躍,參與 ai 研究;

  • 把 ai 團隊正在研發中的大模型技術放開給一些員工,讓他們提前開發合適的產品。兩年前,google 還會擔心這些技術會帶來負面影響,遲遲不願發布;

  • 親自參加 ai 研發團隊的會議,推動員工快速推出類似 notebooklm 這樣的產品等,簡化公司組織架構,比如裁掉 10% 的中層。

google 的 2025 年戰略會議上,皮查伊提出新目標:確立 gemini 的領導地位,重點是擴大 gemini 的用戶規模——這也是 openai 關注的焦點。

hugging face ceo:重視中國的開源大模型

12 月最後一天,deepseek 的新模型 deepseek-v3 在 chatbot arena 上的評分上線,僅落後於 openai、google 近 3 個月發布的新模型,在開源模型中排名第一。

deepseek 是中國量化私募基金公司孵化、支持的 ai 公司。相關論文顯示,他們只用 578 萬美元——這是 meta 訓練 llama 3.1 不到 1/10 的 gpu 資源——就取得了更好的效果,多個基準評測得分逼近大模型 gpt-4o、claude 3.5 sonnet,迅速走紅。

「資源受限條件下令人印象深刻的研究和工程工作。」openai 創始成員、特斯拉前自動駕駛負責人安德烈·卡帕斯 (andrej karpathy) 說。

就算 deepseek 不推出 deepseek-v3,中國公司在大模型開源社區中的存在感也明顯提升。在 chatbot arena 中,deepseek 開源的上一代模型、阿里開源的 qwen2.5-plus -1127 的得分都超過了 meta 發布 的 4050 億參數 llama 3.1。

「因為在 ai 開源中取得了領先地位,中國將在 2025 年開始引領 ai 競爭。」ai 社區 hugging face ceo 克萊門特·德蘭格 (clement delangue) 預測。他 12 月在一檔播客節目中說,要警惕中國的開源大模型,「不應該有任何一個或兩個國家的 ai 模型比其他國家強大得多」。

但 hugging face 的聊天機器人應用 huggingchat,默認模型就是阿里的 qwen2.5-72b-instruct。

供應鏈|新的大模型數據源出現,第三家萬億美元市值晶元公司誕生

如何用 o1 生成的數據訓練模型

用 openai 等公司的模型生成數據,拿去訓練大模型,在大模型行業中已經是公開秘密。

有媒體報道,截至 2024 年 3 月,位元組跳動還通過 tiktok 找微軟調用 openai 的模型,每個月花費 2000 萬美元。比如用戶問 deepseek 最新的模型自己是誰,它會說自己是 openai 開發的大模型。

隨著 openai 發布 o1 模型,許多公司也換了基礎設施,改用它生成數據訓練模型。

雖然 openai 在公開版本中隱藏 o1 的思維鏈(思考如何解題的過程),這並沒有難倒其他公司的開發者:他們拿著 o1 吐出來的答案,讓其他大模型預測 o1 回答問題的原始思維鏈,然後再拿這些數據訓練模型。

因為 openai 也在用 o1 等模型生成數據訓練模型,這意味著其他公司與 openai 的差距,或許比之前更小了一些。

大公司自研晶元,推動博通市值突破萬億美元

12 月,晶元公司博通公布 2024 年的 ai 收入,增長 220% 達到 122 億美元。在這個消息的推動下,博通的股價一天上漲超過 24%,成為晶元行業第三家市值突破萬億美元的公司。之前兩家分別是英偉達和台積電。

博通市值上漲的推力和英偉達一樣,都是大型科技公司大力投資 ai 算力中心。區別在於,英偉達出售 gpu,博通出售自研 ai 晶元方案,正幫助 google、meta、位元組跳動、蘋果、openai 等公司開發 ai 晶元,以擺脫對英偉達的依賴。位元組跳動曾否認與博通合作。

博通 ceo 陳福陽(hock tan)接受媒體採訪說,他們在矽谷的客戶正在匆忙地制定未來 3、5 年的 ai 基礎設施投資計劃,到 2027 年會有客戶建設百萬 ai 晶元的集群。

英偉達迅速迭代,跟著 o 系列模型推出 g300

博通 2024 年的市值漲幅還是比不上英偉達,它漲了 110%, 英偉達是 171%。

12 月,英偉達也沒有停下來。根據 semianalysis 報告,隨著 openai 在 3 個月內接連發布 o1、o3 推理模型,英偉達跟著推出 gpu b300,適應最新的風向。此時距離英偉達推出 b200 不過半年。

與 b200 相比,b300 的算力、顯存分別提高 50%,功率也上漲到 1.2 kw,消耗的更多的電力,可以減少 o1 這類推理模型的延遲和計算成本,也能支持更長的思維鏈。目前,許多公司已經把原本採購的 b200 訂單換成 b300。

還有許多公司表現出對英偉達 gpu 有旺盛需求:

  • 馬斯克旗下 xai 宣布,很快就要把原本 122 天建成的 10 萬張 h100 算力中心拓展到 20 萬張。馬斯克說,未來會增加到 100 萬張。

  • 媒體報道,位元組創始人張一鳴與東南亞等地區的數據中心運營商談判,以便明年投入 70 億美元租用英偉達 blackwell 系列 gpu 的算力。

  • 媒體報道,google、meta 各自訂購了超過 40 萬個預計 2025 年交付的 gb200 晶元,包括伺服器在內的投入可能超過 100 億美元。

應用|大模型加速嵌入原有的行業生態

openai 的 12 場發布活動,想盡辦法讓更多人用 chatgpt

借著 o1 模型和 sora 正式發布,openai 把 chatgpt 訂閱費用推高到了每月 200 美元,他們還打算用 o3 推高到每月數千美元,在 chatgpt 中加廣告。

openai 在 12 月的發布活動,大都是圍繞 chatgpt 這個周活用戶突破 3 億的超級應用,給它增加新功能、降低它的使用門檻或者吸引更多用戶花更多錢買會員:

  • 第一天,正式推出 o1。每月付 20 美元的 chatgpt 用戶,可以限量使用新模型 o1;如果每月付 200 美元,可以 「無限」 使用 o1 和 gpt-4o,還能用一個特供版的 o1,能調更多算力解決複雜問題。

  • 第三天,正式推出 sora。每月付 20 美元的 chatgpt 用戶,每個月只能生成 50 個解析度 480p 或數量更少的 720p 視頻;每月付 200 美元的用戶,用量擴大 10 倍,可以生成 1080p 解析度、20 秒的視頻,還能去掉視頻水印。

  • 第四天,正式推出 chatgpt 的 canvas 功能。它可以編輯審閱文檔,批註修改意見,也可以幫助程序員寫代碼、找 bug 等。所有的 chatgpt 用戶(包括免費用戶)都可以使用,差別在於付費的用戶可以調用更多次數的 gpt-4o 或 o1 模型。

  • 第五天,宣布把 chatgpt 集成到蘋果的系統中。蘋果用戶可以通過 apple intelligence 功能直接調用 chatgpt。這一合作在 2024 年 6 月的 wwdc 上就已經宣布。

  • 第六天,升級 chatgpt 的語音功能。部分地區的 chatgpt 的付費用戶可以使用,用戶將手機攝像頭對準物體或人,chatgpt 可以近乎實時地給出反饋。chatgpt 還可以讀取屏幕上的內容,實時與用戶交互。

  • 第七天,推出 chatgpt 的 projects 功能。它可以幫用戶整理與 chatgpt 交互情況,比如其中涉及的文件和數據等,目前只給付費的用戶使用。此前 openai 的競爭對手 anthropic 已經在 claude 中上線了類似的功能。

  • 第八天,拓展 chatgpt 的搜索功能。免費的用戶也可以使用,並提升了響應速度。

  • 第十天,把 chatgpt 接入電話網路和 whatsapp。美國用戶撥打 1-800-242-8478 可以與 chatgpt 通話,每個用戶有 15 分鐘免費通話時間。全球用戶可以通過 whatsapp 使用這一號碼與 chatgpt 交流(僅限文字)。

  • 第十一天,把電腦版 chatgpt 集成到編程等生產力工具中。只有付費用戶可以使用。chatgpt 與 warp(文件共享應用)、xcode(編程應用)、notion(筆記應用)等打通。這並不是一個全新功能,我們在 11 月的 ai 月報中就介紹過。

發布活動之外,openai 如何拓展企業市場

舉辦 12 場發布活動之前,openai 在官網發布一篇文章,介紹他們拓展企業客戶時的合作夥伴,讓外界有機會更進一步了解其如何運作。和微軟一樣,這些公司也幫 openai 銷售模型的 api、chatgpt enterprise、chatgpt edu、chatgpt team 等企業服務,只是環節不同:

  • 微軟,雲計算計算設施,在美國、澳大利亞、加拿大等 12 個國家處理數據

  • cloudflare,內容分發網路,在距離用戶最近的數據中心處理數據

  • snowflake,數據倉庫,在美國處理數據

  • taskus,客戶支持、內容審核、gpts 審核,在菲律賓處理數據

  • intercom,客戶支持,在美國處理數據

  • 埃森哲,客戶支持,在加拿大、菲律賓處理數據

  • fivetran,etl(數據集成)供應商,在美國處理數據,它只負責 openai 的 assistants api 業務

  • confluent,基礎設施管理,在美國處理數據

  • cinder technologies,內容審核平台、gpts 審核平台,在美國處理數據

  • workos,跨域身份管理,在美國處理數據

  • okta,用戶身份驗證服務(via auth0),在美國處理數據

除了這些合作商,openai 還與美國國防創業公司 anduril 和 palantir 談判,要一起組建財團,競標國防合同。

salesforce vs. 微軟,創業公司也想做 notebooklm

不論是吸引更多個人消費者用 chatgpt,還是開拓企業客戶,openai 的方法有一個共性:嵌入到已有的行業生態中去。這個月,我們也看到在已有的行業生態中佔據優勢地位的公司採取積極行動。

salesforce 將招聘 2000 人賣 ai 軟體。其 ceo 馬克·貝尼奧夫 (marc benioff) 一個月前的計劃是招 1000 人,現在翻了一倍。他說,salesforce 能夠開發和操作 ai agent(智能體)的技術將在 2 月上線。過去一年,salesforce 積極向大模型應用轉型,市值增加了 28% 到 3100 多億美元。

貝尼奧夫還順口評價了一下微軟,在他們網站上,「你是找不到(ai 軟體)的」。在企業服務市場上,他們是競爭對手。

微軟在這個月也提出了一個推廣大模型應用的新口號:「如果你使用它們(ai),你就不需要雇那麼多人了。」 他們也在用自研的大模型和第三方大模型驅動核心產品 365 copilot,目標是減少對 openai 的依賴,降低成本。

還有創業公司與這些大公司們競爭,比如 ai 語音公司 elevenlabs 推出對標 notebooklm 的播客生成功能。目前 google 的 notebooklm 只能生成英文播客,而 elevenlabs 宣稱支持 32 種語言。上個月,這家 ai 公司以 30 億美元的估值融資 2 億美元。

(還有更多新公司的應用嘗試,我們會在下文的融資部分重點介紹。)

ai 硬體探索,大公司們存在感變強

蘋果機器學習和 ai 策略高級副總裁約翰·吉安南德雷(john giannandrea)本月接受採訪,談到蘋果開發 apple intelligence 的策略:首要目標是改進產品體驗,就像此前把人臉識別技術用來解鎖 iphone 中那樣。他說,蘋果對 agi 不感興趣,認為 agi 不切實際,甚至有些 「荒謬」。

12 月,行業對 ai 硬體的探索還在繼續。靠著與雷朋眼鏡合作推出 ray-ban ai 眼鏡的 meta,計劃 2025 年在這款產品上增加屏幕,用於顯示 meta ai 助手的通知或回復。

這樣與 ai 的交互形式,在此前的 ai 硬體探索中都已經存在。比如 2024 年初正式發售的 ai pin 想用激光投影當屏幕,rabbit r1 乾脆是造了個帶屏幕的硬體。但它們都沒有說服用戶,為什麼一定要再買個新產品,而不是用手機。meta 用 ray-ban ai 眼鏡驗證了市場需求,現在希望更進一步。

ray-ban ai 眼鏡的火熱,也刺激了中國 ai 眼鏡市場。我們在 12 月發布的一篇 ai 眼鏡報道中寫道,2025 年會是 ai 眼鏡元年,會有近百個品牌發布產品,掀起 「百鏡大戰」。

ai 硬體的探索也不只在消費者市場。臨近月底,有媒體報道,openai 重新組建了四年前解散的機器人軟體團隊,考慮開發一款人形機器人。在此之前,openai 已經投資 figure、1x 兩家人形機器人公司和研發機器人 ai 模型的 physical intelligence。

投融資|21 家單筆融資超過 5000 萬美元的 ai 公司

openai 在 12 月正式啟動轉型成一家營利公司的計劃,把原來監督、控制 openai 的非營利機構變成一個股東,理由是方便融資,研發 「造福人類的 agi」。

之前,他們在官網上公布創始團隊早期與馬斯克溝通的郵件,論證轉型合理。加上馬斯克公布的郵件,我們整理、翻譯了 75 封 openai 內部郵件,你可以在這裡看到。

許多公司的融資消息上月就已經被媒體報道。比如馬斯克旗下的 xai 融資 60 億美元;ai 搜索產品 perplexity 以 90 億美元估值籌到 5 億美元;ai 編程應用 cursor 拿到 1 億美元融資等,這個月不再重複提到。

在本月獲得大額融資的 ai 公司中,大多數都在 chatgpt 上線前已經成立,尤其是應用公司,它們長期針對一個行業提供 ai 解決方案。

模型:不只有 transformer 架構,不局限於 gpt

智譜 ai 融到 30 億元,估值達到 200 億元人民幣。智譜稱,2024 年公司的商業化收入增長超過 100%,新資金將會用於研發解決複雜推理、多模態任務的基礎大模型。

階躍星辰完成一輪融資,總融資額達數億美元。主要用於基礎模型研發,提高模型多模態和複雜推理能力——跟智譜一樣。但階躍星辰也想擴大 c 端產品的用戶規模,與月之暗面接近。

sandboxaq 融資超過 3 億美元,估值超過 56 億美元。sandboxaq 之前是 google 母公司 alphabet 旗下的公司,2022 年分拆獨立。它專門為生物、醫學、化學、材料等領域開發 「大型定量模型」。他們用感測器中獲得數據或者根據方程生成的數據訓練模型,宣稱精確到 「一個分子的一億次微小的改變」。他們計劃未來不只用 gpu 跑模型,也會引入量子晶元。

liquid ai 融資 2.5 億美元,估值超過 20 億美元。它成立於 2023 年,開發一種從蠕蟲大腦結構發現的 「液態神經網路」(lnn)架構,宣稱與 transformer 架構相比,新架構需要的數據和算力都更少。liquid ai 說,他們正在把技術用到消費電子和金融服務行業。

愛詩科技(pixverse)融資 3 億元人民幣,它成立於 2023 年,開發對標 sora 的文生視頻模型。新一輪的投資方主要是螞蟻集團、北京市人工智慧產業投資基金、國科投資及光源資本。

12 月還有至少 9 家 ai 模型公司獲得超 1000 萬美元融資,中國開發多模態大模型的智象未來、開發端側大模型的面壁智能、開發具身智能模型的穹徹智能等都宣布獲得數億元人民幣融資。

基礎設施:晶元公司的上下游多,競爭對手少

databricks 計劃單輪融資 100 億美元,估值達到 620 億美元。它成立於 2013 年,主要業務是為企業提供數據和 ai 雲服務。目前 databricks 已融到 86 億美元。databricks 稱,他們計劃將這筆資金用於 ai 產品研發、收購公司以及國際擴張。databricks 預計 2024 年四季度收入將突破 30 億美元,自由現金流轉正。

tenstorrent 融資 7 億美元,估值達到 26 億美元。它成立於 2016 年,基於 risc-v 架構開發 ai 晶元,是市場上少有的挑戰英偉達的創業公司。創始人是半導體先驅吉姆·凱勒 (jim keller) ,此前在蘋果、特斯拉、amd 工作,給這些公司的晶元業務打下基礎。

nebius 融資 7 億美元。它前身是俄羅斯搜索引擎公司 yandex,2024 年轉型為 ai 雲服務供應商,利用專有的雲軟體架構和內部設計的硬體,為 ai 開發者提供算力、存儲和託管服務。

crusoe 融資 6 億美元。它成立於 2018 年,之前主要用被浪費的天然氣為挖礦的數據中心供電,現在轉型給 ai 算力中心供電,已經與甲骨文、微軟和 openai 建立合作。

vultr 融資 3.33 億美元,估值 35 億美元。它成立於 2014 年,可以按小時出租 gpu 算力。這輪投資方主要是 amd。amd 也開始像英偉達那樣扶持一批 ai 雲公司。

nscale 融資 1.55 億美元。它成立於 2024 年,主要用 amd 的晶元建設 gpu 雲服務,計劃未來三年部署 3 萬塊 gpu。

ayar labs 融資 1.55 億美元,估值 10 億美元。它成立於 2015 年,開發利用光傳輸數據的方案,這輪的投資方是 amd、英特爾、英偉達三家晶元公司。

axiado 融資 6000 萬美元。它成立於 2017 年,開發一個名為 tcu 的安全晶元,用於防範針對雲數據中心、5g 網路和關鍵基礎設施的網路攻擊。

12 月,還有兩家 ai 基礎設施公司獲得超過 1000 萬美元融資。一家是 stainless,把 openai 、 anthropic 和 meta 等公司模型的 api 自動生成 sdk,簡化應用程序的開發速度;另一個家是 cake,把開源 ai 技術整合成一個可以投入使用的工具。

應用:從垃圾回收到會計,把 ai 嵌入各行各業中

zest ai 融資 2 億美元。它成立於 2009 年,原本叫 zest finance,主要為金融機構提供大數據和機器學習信用評分方案,2019 年改名為 zest ai。之前百度、京東都投資過它,在自家業務中引入其技術。

tractian 融資 1.2 億美元。它成立於 2019 年,利用感測器、邊緣計算硬體和 ai 模型監控工業設備,預測可能的故障,減少停機時間。

aiwyn 融資 1.13 億美元。它成立於 2019 年,用 ai 技術把會計的工作自動化,主要的客戶是註冊會計師事務所。

cleerly 融資 1.06 億美元。它成立於 2017 年,最新的動向是用 ai 技術分析心臟 ct 影像識別早期冠狀動脈疾病等。

precision neuroscience 融資 1.02 億美元。它成立於 2021 年,主要開發 「第 7 層皮層介面」(layer 7 cortical interface),一種不深入腦組織就能捕捉神經信號並將其轉化為數字指令的產品。

amp robotics 融資 9100 萬美元。它成立於 2014 年,開發了機器人分揀系統,用 ai 識別、分類垃圾和回收物。

speak 融資 7800 萬美元,估值 10 億美元。它成立於 2016 年,主要用 ai 幫人學習新語言。它不像多鄰國那樣把學習過程變得遊戲化,而是強調培養用戶真實場景中的口語能力。speak 宣稱,目前公司收入達到千萬美元級別。

sublime security 融資 6000 萬美元。它成立於 2019 年,聚焦電子郵件安全防禦場景,用 ai 技術檢測和防禦網路釣魚、惡意軟體等電子郵件攻擊,客戶有 spotify、reddit 等。

anybotics 融資 6000 萬美元。它成立於 2016 年,是蘇黎世聯邦理工學院(eth zurich)孵化出來的公司,主要開發用於工業巡檢的機器狗 anymal。

9fin 融資 5000 萬美元。它成立於 2016 年,原本用 ai 分析債務資本市場情報數據,現在用大模型技術搜索最新的數據。

12 月,還有 24 家 ai 公司拿到了超過千萬美元的融資,他們的特徵與上述公司類似:chatgpt 火熱之前就已經成立,把 ai 技術用到特定行業的場景中,比如客服、物流、律師、會計、運維、市場調研、製藥等。

最後|科學家歡迎大模型的幻覺

大模型一直存在 「幻覺」 問題,即一本正經地胡說八道,給出不符合事實的信息。能不能避免這些錯誤,也成為衡量一家公司大模型好壞的指標。google 就因為大模型給出的回復不對勁,市值一度下挫千億美元。

這個月,aws 推出了一個工具對抗大模型幻覺,主要原理是,大模型給出答案前,工具會調用客戶提前上傳的資料交叉驗證是否準確。此前微軟、google 都推出過類似的功能。

但幻覺並不是一無是處。nyt 發布的一篇報道採訪了多位使用大模型的科學家提供了另一種視角:

  • 計算機科學家艾米·麥戈文 (amy mcgovern)說:「它實際上給科學家帶來了新的想法。讓他們有機會探索原本可能不會想到的點子。」

  • 麻省理工學院教授詹姆斯·柯林斯(james j. collins)說,他要求模型提出全新的分子,「幻覺」 加速了他們研究新型抗生素。因為 ai,科學領域曾經要花費多年時間解決的事情,現在幾天、幾小時和幾分鐘內就可以完成。

  • 華盛頓大學的生物學家戴維·貝克 (david baker),因為快速創建自然界中未發現的全新蛋白質種類,獲得了 2024 年的諾貝爾化學獎。貝克將 ai 的想像力爆發視為自己從頭開始製造蛋白質的核心。他說這項技術已經幫他的實驗室獲得了大約 100 項專利。

他們認為,大模型的想法不虛幻,反而會有前瞻性——有一定的機會實現。他們將其比作科學研究早期階段的猜想,認為 「幻覺」 這個詞並不準確,會避免使用它。

題圖由 ai 生成