將短期回報置於長期創新之上!中國人工智慧道路或許並不平坦

中國科技公司急於匹配 Stable Diffusion 和 DALL-E 2,但艱難擺在面前

機器學習模型在過去幾年中展現出的巨大技術飛躍讓每個人都對人工智慧的未來感到興奮——但同時也對其令人不安的後果感到緊張。在 Stability AI 和 OpenAI 的文本轉圖像工具成為熱門話題後,ChatGPT 進行智能對話的能力成為各行各業的新寵兒。

OpenAI CEO 發推警告稱 AI 工具 ChatGPT 存在明顯局限性

中國科技界一直密切關注西方的進步,企業家、研究人員和投資者正在尋找在生成人工智慧領域取得進展的方法。科技公司正在設計基於開源模型的工具,以吸引消費者和企業客戶。個人正在從 AI 生成的內容中獲利。一系列管理規定迅速做出反應,定義了文本、圖像和視頻合成的使用方式。與此同時,美國的技術制裁引發了人們對中國能否跟上人工智慧進步的擔憂。

隨著生成式人工智慧在 2022 年底席捲全球,讓我們來看看這項爆炸性技術如何在中國掀起波瀾。

中國特色

得益於像 Stable Diffusion 和 DALL-E 2 這樣的「藝術」創作平台,生成式 AI 突然出現在每個人的嘴邊。中國的科技巨頭也以其同類產品吸引了公眾,為迎合中國的品味增添了新意。

百度在搜索引擎中名聲大噪,近年來一直在加強其在自動駕駛領域的競爭,運營著ERNIE-ViLG,這是一個在 1.45 億個中文圖像文本對的數據集上訓練100 億參數的模型。這款模型與美國同行相比如何?以下是在Stable Diffusion模型中搜索「kids eating shumai in New York Chinatown」的結果,與在ERNIE-ViLG模型中搜索(紐約唐人街小孩子吃燒賣)的結果。

Stable Diffusion

對於上面兩個結果,結果可以說是平手,都沒有吃到正確的燒賣,快速測試反映了當所使用的數據集存在固有偏差時捕捉文化細微差別的困難——假設穩定擴散將有更多關於中國僑民的數據,而 ERNIE-ViLG 可能接受了更多種類的燒麥圖像的訓練,這些圖像在中國以外更為罕見。

另一個引起轟動的中國工具是騰訊的二次元生照片成器:. 「異次元的我」,它可以將人物照片變成動漫人物,但人工智慧生成器表現出自己的偏見:它面向中國用戶,在南美等其他喜歡動漫的地區出人意料地走紅。但用戶很快意識到該平台無法識別黑人和大碼個體,這些群體在日本動漫中明顯缺失,導致人工智慧生成的結果令人反感。

除了ERNIE-ViLG,另一個大型中文文本到圖像模型是Taiyi,它是IDEA的心血結晶,IDEA 是由著名計算機科學家 Harry Shum 領導的研究實驗室,他與他人共同創立了微軟在美國以外最大的研究分支 Microsoft Research。開源 AI 模型在 2000 萬個經過過濾的中文圖像文本對上進行訓練,具有 10 億個參數。

與百度和其他以利潤為導向的科技公司不同,IDEA 是近年來由地方政府支持的少數幾個從事尖端技術研究的機構之一。這意味著該中心可能享有更多的研究自由,而沒有推動商業成功的壓力。總部位於深圳的科技中心,並得到中國最富裕城市之一的支持,這是一家值得關注的嶄露頭角的公司。

人工智慧規則

中國的生成式人工智慧工具的特點不僅僅在於它們從國內數據中學習,它們也受當地法律的約束。正如《麻省理工科技評論》指出的那樣,百度的文本轉圖像模型過濾掉了部分關鍵詞,這是預料之中的。

對這個新興領域的未來更重要的是針對所稱的「深度合成技術」的一套新監管措施,它指的是「使用深度學習、虛擬現實和其他合成演算法生成文本、圖像、音頻、視頻和虛擬場景。」,與中國其他類型的互聯網服務一樣,從遊戲到社交媒體,用戶在使用生成的 AI 應用程序之前被要求驗證他們的名字,提示可以追溯到一個人的真實身份這一事實不可避免地對用戶行為產生限制性影響。

Deepfake進行人臉偽造

但從好的方面來看,這些規則可能會導致更負責任地使用生成式人工智慧,它已經在其他地方被濫用,以製造 NSFW 和性別歧視的內容。例如,中國的法規明確禁止人們生成和傳播人工智慧製造的假新聞。但是,如何實施取決於服務提供商。

「It』s interesting that China is at the forefront of trying to regulate [generative AI] as a country,」 said Yoav Shoham, founder of AI21 Labs, an Israel-based OpenAI rival, in an interview. 「There are various companies that are putting limits to AI… Every country I know of has efforts to regulate AI or to somehow make sure that the legal system, or the social system, is keeping up with the technology, specifically about regulating the automatic generation of content.」

「有趣的是,中國處於試圖規範 [生成人工智慧] 作為一個國家的最前沿,」,總部位於以色列的 OpenAI 競爭對手 AI21 Labs 的創始人 Yoav Shoham在接受採訪時說。「有各種各樣的公司正在限制人工智慧......我所知道的每個國家都在努力規範人工智慧或以某種方式確保法律體系或社會體系跟上技術的發展,特別是在規範自動化的內容。」

但是對於應該如何管理這個瞬息萬變的領域,目前還沒有達成共識。「我認為這是我們共同學習的一個領域,」,「這必須是一種協作努力。它必須讓真正了解該技術及其能做什麼和不能做什麼的技術專家、公共部門、社會科學家、受技術影響的人以及政府,包括商業和法律部門共同努力。」

人工智慧貨幣化

隨著藝術家們擔心被強大的人工智慧所取代,中國許多人都在利用機器學習演算法以多種方式賺錢,他們不是來自最精通技術的人群。相反,她們是機會主義者或尋找額外收入來源的兼職人員。他們意識到,通過改進提示,他們可以使得 AI 製作富有創意的表情符號或令人驚嘆的壁紙,他們可以將其發布在社交媒體上以增加廣告收入或直接收取下載費用,真正熟練的人也會向其他想加入賺錢遊戲的人出售他們的提示——甚至收費培訓他們。

像世界其他地方一樣,中國工作者正在他們的正式工作中使用人工智慧。例如,輕小說作家可以廉價地為他們的作品製作插圖,這是一種比小說更短且通常以插圖為特色的類型。一個可能會顛覆製造業領域的有趣用例是使用 AI 設計 T 恤、美甲和其他消費品的印花。通過快速生成大批量原型,製造商可以節省設計成本並縮短生產周期

現在了解生成式人工智慧在中國和西方的發展有何不同還為時過早。但是企業家們已經根據他們早期的觀察做出了決定。一些創始人告訴我,企業和專業人士普遍樂於為 AI 付費,因為他們看到了直接的投資回報,因此初創公司急於開拓行業用例。一個聰明的應用來自紅杉中國支持的Surreal(後來更名為 Movio)和高瓴資本支持的 ZMO.ai,這兩家公司致力於開發生成各種形狀、顏色和種族的時裝模特的演算法。

但一些企業家不相信他們的人工智慧 產品會像西方同行(如Jasper和Stability AI)正在享受的估值飛漲和飛速增長。多年來,無數中國創業公司有同樣的擔憂:中國的企業客戶普遍不如發達經濟體的企業客戶願意為SaaS付費,這就是為什麼他們中的許多人開始向海外擴張的原因。

中國 SaaS 領域的競爭也是激烈的。「在美國,你可以通過構建以產品為主導的軟體來做得很好,這種軟體並不依賴人工服務來獲取或留住用戶。但在中國,即使你有一個偉大的產品,你的競爭對手也可能在一夜之間竊取你的源代碼並僱傭數十名客戶支持人員來超越你,這些員工的成本並不高,」中國一家生成人工智慧初創公司的創始人說。

銷售智能初創公司 FlashCloud的創始人兼首席執行官施毅同意中國公司通常將短期回報置於長期創新之上。「在人才培養方面,中國科技公司往往更注重應用技能和快速賺錢,」他說。一位不願透露姓名的上海投資者表示,他「對今年生成人工智慧領域的重大突破都發生在中國以外感到有點失望。」

前方的障礙

即使中國科技公司想要投資訓練大型神經網路,他們也可能缺乏最好的工具。2022年9月,美國對中國實施高端人工智慧晶元出口管制雖然許多中國 AI 初創公司專註於應用領域,不需要處理海量數據的高性能半導體,但對於那些從事基礎研究的人來說,使用功能較弱的晶元意味著計算時間更長、成本更高,好消息是,從長遠來看,美國制裁正在推動中國投資先進技術。

百度執行副總裁兼人工智慧雲集團負責人表示,作為一家自稱為中國人工智慧領域領導者的公司,美國晶元制裁對其人工智慧業務的影響在短期和長期內都是「有限的」 ,這是因為「很大一部分」百度的 AI 雲業務「並沒有過多依賴高度先進的晶元」。在它確實需要高端晶元的情況下,它「實際上已經有足夠的庫存來支持我們在短期內的業務。」

未來呢?「從中長期來看,我們其實有自己研發的AI晶元,取名崑崙。」,「通過在大型語言模型中使用我們的崑崙晶元 ,在我們的 AI 平台上執行文本和圖像識別任務的效率提高了 40%,總成本降低了 20% 至 30%。」

時間會證明崑崙和其他本土人工智慧晶元是否會給中國在生成人工智慧競賽中帶來優勢。