本文來源:時代周報 作者:馬歡
deepseek風暴席捲全球,印度人也在狂喜。但這不僅僅是因為印度人喜歡用它。
據彭博社報道,自1月20日deepseek-r1模型正式發布以來,deepseek僅18天內累計下載量已突破1600萬次,其中,印度下載量占所有平台下載總量的15.6%,成為deepseek新用戶增長的最大來源。
分析認為,這反映出新興市場對智能工具的旺盛需求——印度作為全球增長最快的移動互聯網市場,其用戶更傾向於嘗試高性價比的ai工具。並且,這一現象也成功印證了「ai應用下沉」趨勢,即技術普惠帶來的市場擴張效應。
更重要的是,deepseek讓印度人看到了一線曙光——在人工智慧領域,別的國家也有機會。
受此啟發,印度政府表示,計劃在未來10個月內開發本土大語言模型,挑戰deepseek與openai。
「我們國家發射月球任務的成本只有別的國家的一小部分。為什麼我們不能也建立一個低成本的ai模型?」2月5日,印度信息技術部長阿什維尼·維什瑙與到此訪問openai的聯合創始人兼ceo奧特曼會面。維什瑙說,人工智慧的發展可以在世界任何地方落地生根。
就在上周,維什瑙稱讚中國人工智慧初創公司deepseek以其低成本的人工智慧助手,撼動了人工智慧行業,並將這種節約的做法與印度政府建立本地化人工智慧模型的努力相聯繫。
那麼,印度若想創造出自己的人工智慧模型,有可能嗎?
奧特曼被打臉
時間回到2023年6月,彼時,風頭正盛的奧特曼在印度參加一場活動。有印度投資人問他:「一個擁有1000萬美元預算的小而聰明的團隊,是否可以在ai領域做出實質性的成果?」
當時,奧特曼的回答是:「我會告訴你,想在訓練基礎模型方面與我們競爭,完全是沒希望的。你能做的也就是嘗試而已。我覺得你不應該嘗試。」
如今,這段視頻被媒體和網友們挖出,並熱烈討論。
路透社稱,來自中國的deepseek引發世界轟動後,奧特曼的這番言論也成為了社交媒體上的焦點話題。法國企業家阿諾德·貝特朗不僅轉發分享了這段視頻,還重複寫下了奧特曼的回答,並寫道:「回想起來,這真是太滑稽了。」
法國企業家阿諾德·貝特朗的回復。(圖源:社交媒體截圖)
deepseek以相對低廉的訓練成本以及開源的部署方式,得到了世界ai產業界的極高評價,也讓印度人看到了希望。
「有人質疑印度政府在ai方面的投資規模。你們看看deepseek做到了什麼?僅用了550萬美元,就開發出一個非常強大的模型。這就是頭腦的力量。」維什瑙說。
日前,奧特曼訪問印度時與維什瑙展開了一場對話,他也首次回應了當年那段視頻以及ai成本爭議。
奧特曼改口強調,稱他之前在視頻里的話是被「斷章取義」的。他認為印度會成為ai革命的領導者之一,因為他看到了「印度正在擁抱技術和構建整個ai生態方面所做的努力,是非常了不起的」。
至於研發成本,奧特曼認為:「對於ai的前沿性研究成本依然會持續性呈指數級別上漲,當然,單位智能成本會在未來一年內下降大約10倍,這個數字要超過了摩爾定律,目前半導體行業每年的成本下降大約在50%。」
10個月內,能準備好嗎?
1月30日,維什瑙放出消息稱,印度的大語言模型將在今年之內準備好。
維什瑙透露,隨著基礎工作已完成,印度政府目前正專註於打造一個符合印度獨特需求的人工智慧系統。他還稱,預計該模型將「在未來10個月內準備就緒」,其基礎框架已經到位。
據印度媒體報道,印度政府已經批准了18項提案,旨在加速農業和氣候變化等關鍵領域的ai解決方案落地。這些支持措施包括提供算力、數據和資金。
維什瑙還透露,預計到今年年底,將有6家主要開發商推出基礎ai模型。為使相關開發更加「經濟且易於獲取」,印度政府將補貼40%的計算成本,降低ai計算單元的平均費用,將目前每小時1.29美元的費用降到更低。
其實,近年來,印度政府在ai方面的投資並不少。
就在2023年,印度才成立國家級「印度ai使命」(india ai mission)項目,旨在實現「讓ai在印度紮根」和「讓ai為印度服務」兩大目標,預算達1037.192億盧比(約合人民幣86億元)。
印度ai使命的負責部門(圖源:該部門官網)
印度也努力成為世界領先的人工智慧中心。包括微軟、英偉達、亞馬遜在內的大型科技集團都有計劃在印度投資數十億美元,建設雲計算和ai基礎設施。印度本土的阿達尼集團和信實工業公司也正在進行大規模數據中心投資。
甚至連貝萊德這樣的資產管理集團,也計劃招募近1200人,擴大在印度的兩個支持中心,並在該國搭建ai能力。
作為衡量ai算力的一個重要指標,在超大規模數據中心數量上,截至2023年,印度只有大約18個超大規模數據中心,而中國的公開數據是有接近100個。差距背後,是支撐和維繫數據中心運作的一系列配套設施,包括了電力、網路、冷卻系統等。
對此,《日本經濟新聞》稱,印度顯然仍有很大的發展空間。
印度還差什麼
近段時間,印度媒體和專家們不斷在討論,印度離一個本土的deepseek,還差些什麼呢?
印度人認為,差距並不是全方位的。甚至在硬體方面,印度還有優勢。
據了解,印度現有超過18600個高性能gpu,其中12896個為英偉達h100、1480個是英偉達h200、742個為mi325和mi325x。
相比較之下,deepseek是在2000個gpu上訓練完成的,chatgpt是在25000個gpu上訓練完成的,因而印度有超過18000個高性能gpu,可以說,印度的算力資源已經足夠強大了,足以支撐印度大模型的需求。
《經濟時報》和《第一郵報》還相信,印度在硬體和人力等軟體資源上並不遜於中美兩國。但仍然沒有在ai領域創建一個創新生態系統。
有學者認為,這與思維方式有關,印度並不重視基礎創新。
印度數據中心巨頭yotta的母公司ceo希蘭南達尼認為,印度並不缺乏先進晶元,「但我們還沒有創建一個創新的生態系統,這是一個思維方式問題」。
印度前電子和信息技術部國務部長拉吉夫·陳德拉塞卡爾同樣稱:「deepseek ai模型的出現表明,印度的計算能力永遠無法成為長期的護城河……希望印度的人工智慧初創企業能夠在未來帶來顛覆。」
印度專欄作家拉布羅也指出,印度應改變思維,敢於與世界領先企業競爭。「僅僅試圖把別人創造的東西做好,並不能讓我們成為一個突破性的國家。我們需要投資於有助於自身利益的尖端研究。」
還有觀點認為,印度政府干預的缺位以及受保護市場的缺乏,也是印度企業怯於參與ai競爭的原因之一。
印度諮詢公司tracxn和印度人工智慧協會的數據顯示,過去4年,印度ai初創公司激增70家。但在ai大模型領域的公司不到10家,且業務主要集中在對話ai、智能助手等,基本不涉及基礎模型的研發,只能解決相對初級的問題。
例如,印度獨角獸公司krutrim的自研模型krutrim ai在使用時僅允許輸入424個字元。而openai的gpt-4,字元數上限已達到了32768個。
《第一郵報》認為,印度政府干預並為企業創建一個「受保護的市場」至關重要。