以前提到「智能」或者「人工智慧」,無論是廠商還是用戶,似乎沒有人能夠通俗易懂地告訴你「它是什麼」以及「它有什麼用」。所謂智能,更多的是隱藏在軟體交互界面身後的一行行代碼,像視頻平台採用的智能推薦、手機採用的智能省電演算法、拍照時用到的智能識別/智能優化功能等等。
2023年,隨著chatgpt的出現,ai技術在大模型的加持下,終於從那個隱身幕後的冰冷演算法走向前台,通過文字、語音來展示通過自身學習能力帶來的更多有趣玩法。進入2024年,包括ai 手機(也稱ai smartphone)、ai pc等智能硬體以及大模型人工智慧與剪輯軟體、繪圖以及語音助手的結合,ai正成為提升生產效率、創作能力的有效工具。
聯發科技計算與人工智慧技術事業群副總經理陸忠立博士(圖片來源:鈦媒體app編輯拍攝)
聯發科技計算與人工智慧技術事業群副總經理陸忠立博士向鈦媒體app介紹:「實際上手機與ai技術的結合早在2017年就已經實現落地了,只不過彼時的ai技術更多體現在拍照以及圖像的處理方面,而如今的ai技術(生成式ai)則更加顯性,同時也能夠為人們提供很多進階能力支持。」
從功能時代到ai興起,手機迎來第二次革命
很多人不知道的是,距離世界上第一台智能手機誕生至今已經超過了30年,而智能手機與其所替代的功能機相比,增加了兩個全新特性:更加智能的交互邏輯與具備智能屬性的系統加持。
前者很好理解,智能手機引入了屏幕的點觸、滑動等操作,交互反饋也實現了從視覺、聽覺到觸覺震動的多維度覆蓋。而所謂「智能系統」則是指用戶可以自行安裝軟體、遊戲等第三方服務商提供的應用程序,通過此類程序來不斷對手機的功能進行擴充。
換句話說,功能機時代,手機所有的能力都是「出場即巔峰」,打電話、發簡訊甚至軟體功能都是在出廠時設定好且不能更改的。與之相比,智能手機出廠時則是一塊普通的「磚頭」,主打一個「哪裡需要哪裡搬」,安裝遊戲軟體它就是遊戲機、安裝拍照軟體它就是相機、安裝視頻軟體它就是mp4播放器。
功能機向智能機進化(圖片來源:ai繪圖)
從功能機時代進化到智能機時代後,隨著晶元、軟體以及應用層面的技術與需求變化,智能手機也就逐步變成了今天我們所能看到的樣子,而且在前幾年中,ai技術實際上已經完成了與手機的接軌。
據陸忠立博士介紹,從2017年開始,ai技術在手機上的應用開始找到合適的落地場景並迅速實現了應用層面的普及,包括影像、遊戲、視頻等應用的運行中,都已經融入了ai技術。
陸忠立博士舉例說到:「用戶能夠感知到ai能力的最典型場景就是手機在攝影時的各類功能,一方面是圖像採集部分,另一方面則是視頻顯示部分,比如自動切換幀率模式以及對圖片、視頻的最終畫面效果進行動態範圍、智能降噪的優化,其中都已廣泛應用了ai技術。」
但具備此類功能的手機還不能被定義為「ai手機」,因為它更多地應用到的是「分析式ai」,這些ai技術更多地只是在某一特定應用或場景中實現了體驗層的升級而已。
ai手機的體驗將是千人千面
隨著2023年包括英偉達、聯發科技、英特爾在內的各個晶元廠商開始重視起邊緣ai算力並推出專為生成式ai打造的硬體架構,終端廠商也已開始在手機、pc等不同智能終端當中實現生成式ai能力的最終落地,ai手機與ai pc才算正式問世。
「與功能機演進為智能手機一樣,ai手機也帶來了兩項新特性,首先是交互層面的信息類型得到擴展,從觸摸擴展到可以用文本、自然語言甚至圖片與手機進行互動;其次則是ai開始圍繞每個用戶產生個性化服務能力,ai技術的出現將會推動手機實現第二次進化。大語言模型推動多模態智能體發展,會顛覆掉原來的或者既有的智能手機的使用。」陸忠立博士說到。
手機具備的ai功能
從智能手機到ai手機,大致可以這樣理解:智能手機讓產品更智能,ai手機讓體驗更智能。
chatgpt以及各類大模型加持的語音助手就是交互層面信息類型擴展的典型案例,過去語音助手只能通過文字或者語音溝通,而大模型的加持,讓它們不僅能夠聽懂說話、看懂文字,同時也能閱讀文檔、表格甚至圖片,並對這些內容進行理解歸納和加工創作。
此外,傳統的智能語音助手之所以被人戲謔為「智障助手」,死穴還在於它們對語義的理解力不夠,同時回答又只能基於固定演算法,沒有創造力和應變能力。不過,ai手機通過大模型的加持也正好解決了這一問題,通過不斷學習,語音助手被「問住」的可能性進一步降低,在交互過程中也會根據上下文或者問答對象來不斷改進自己的表達內容。
作為新一輪的技術革命,ai手機也不僅僅是變得更聰明而已,它還會變得更有「個性」。陸忠立博士進一步解釋到,ai手機基於大語言模型可以做到「千人千面」,通過持續學慣用戶的習慣、喜好來實現更加深度、精準的服務,比如可以根據你的生活、飲食習慣來幫你訂外賣或者購物等等。
apu是ai手機的重要算力基石
除了創造新的應用體驗,陸忠立博士認為生成式ai技術也會對已有的ai體驗進行革新,並且站在用戶體驗層面,現階段很多日常使用手機的高頻場景都將因此受益。
比如目前影像採用分析式ai主要用於優化圖像,而生成式ai則可以做到虛實結合,比如未來可以根據用戶創作意願進行生成式的天氣、拍攝背景的自由變換。另外,在4k視頻錄製應用場景下,聯發科技可以通過ai技術將30幀插幀到60幀,這樣整體的進光量和亮度可以得到保證,視頻在觀感上也會更絲滑流暢,用ai來做插幀這件事情,聯發科技在平台上跟客戶合作已經達成了不少合作。
既然生成式ai如此全能,為何沒有一下子普及開來呢?這就要提到現階段生成式ai發展所面臨的最大挑戰:算力和內存佔用。儘管依靠傳統的cpu或gpu提供的通用算力也能從事生成式ai運算,但在效率、功耗控制方面卻很難達到理想水平。
這對於伺服器等大型設施來說也許不是問題,但對於硬體高度集成且體積較小的手機而言卻充滿了挑戰。因此,想要實現端側生成式ai的部署,對手機soc的硬體層面也提出了新的需求。
第七代apu
陸忠立博士告訴鈦媒體app,2019年的時候,儘管當時業內還沒有所謂的生成式ai,但聯發科技已經在圍繞transformer模型進行apu層面的架構、演算法適配做預研了,尤其是在圖像和語音方面。而到了2022年,同樣的東西規模擴充,用於生成式ai。直到2023年,聯發科技已經將apu迭代至第七代,算力翻倍的情況下功耗能夠下降50%,終端也落地了生成式ai應用。
與此同時,在更多生成式ai應用的助推下,手機soc中的apu單元也會變得與傳統的cpu、gpu算力模塊一樣重要,並且由於它採用的是全新架構,其優化與迭代的速度也會更快。正如陸忠立博士介紹,作為ai算力基礎的apu,在行業「能見度」很高,也是各家投資的重點,因此一般來說相較於cpu、gpu性能增長更快,加上聯發科技對於ai低功耗的優化,未來也將有更好的能效表現。
ai手機正處在爆發的臨界點
ai手機的出現,不僅是對晶元等上游廠商的技術布局產生影響,對於終端手機品牌或者是應用開發者同樣意味著一次全新的洗牌機會。對於現階段的大眾消費者來說,如果想要接觸到生成式ai其實已經不存在什麼門檻,國內的文心一言、百川智能等大模型都已經通過雲端計算為基礎,建立了適合交互的網頁端ui,只需要進入網頁就能體驗。
只不過支持端側部署的「ai手機」目前還僅限於一小部分新品,像vivo最新發布的x100系列、iqoo neo9 pro、oppo find x7、redmi k70e等等,除了國內廠商,蘋果與三星也在近期透露了即將在手機上實現生成式ai功能的信息。此外,各個手機品牌同時也在加速生成式ai的應用部署,例如將大模型與現有的智能助手結合。
oppo展示的aigc消除功能
與此前智能手機圍繞形態開發出的「全面屏」「摺疊屏」等創新相比,生成式ai雖然仍處於發展的萌芽期,但其所具備的應用潛力和輻射廣度顯然更大,尤其是當ai開始向更多品類賦能的時刻,生成式ai將會很快完成應用間的體驗串流並且在用戶不斷的訓練與使用下,催生出更多的高頻場景直到逐漸產生用戶粘性。
「在2023年,70億參數模型是平衡功耗和應用落地的區間。而2024年,130億參數和多模態模型會出現在端側支持更先進的ai應用。」陸忠立博士分享到。
隨著apu(或稱npu)能力的持續迭代,鈦媒體app預計,很快70億乃至130億參數的模型就會普及應用到ai手機當中,這也解釋了為何聯發科技自發布旗艦級的天璣9300後,迅速將端側ai處理能力下放到天璣8300更多產品中,因為ai手機作為新一輪的智能終端產業革命,不會也不能局限於「旗艦機」的專屬。
只有當用戶能夠以低門檻接觸到生成式ai,使其受眾面快速擴張,才能促進從內容生態、軟體應用和硬體層面的快速革新。不難預測,未來ai手機將成為人們手中新的生產力、社交、內容創作、娛樂工具,並擁有更多身份。(本文首發鈦媒體app 作者/鄧劍雲 編輯/鍾毅)