2 月 8 日年三十,oppo 召開了一場相當短暫且特殊的發佈會,宣布他們正式進入 ai 手機時代,開啟了「千萬用戶 ai 升級計劃」,並為旗下的眾多機型進行了全新的 ai 新春版系統更新,將 ai 功能帶到用戶手中。
轉眼來到年後,oppo 也召開了一場更詳細的 ai 戰略發佈會,我們也受邀來到了會議現場,與 oppo 首席產品官劉作虎、oppo ai 中心產品總監張峻以及現場的眾多友媒一同,就「oppo ai 戰略」這一話題,進行了深入的溝通與交流(訪談內容有精簡)。
問:大年三十 oppo 公布了 ai 戰略,all in ai 似乎是今年手機轉型的一個方向,但在剛剛的圓桌論壇上,似乎大家對於 ai 手機的概念並不是特別明確,摒棄傳統的 app 界面似乎是一個共識,通過語音交互似乎又是一個共識,具體 ai 手機在您的心目中應該是什麼樣,能描述一下嗎?
劉作虎:剛剛在發佈會上,我講了 oppo 對 ai 手機的定義,也發佈了 oppo ai 白皮書,這是目前 1.0 的 ai 手機版本。
未來是什麼樣?我們也希望整個生態一起去探索中國的 ai 手機,不能簡單地只說手機形態的變化,或者手機交互界面的變化,這只是很表層的東西,核心 oppo 一直思考的是 ai 手機帶來的行業變化和對用戶的價值。
今天講的這四個能力,是 oppo 對 ai 手機的定義,未來只有具備這四種能力的手機,才叫 ai 手機。你剛才問到的反而是 ai 手機給用戶帶來的交互體驗變化,我舉一些讓大家更有感受的例子。
今天你說訂機票,要打開攜程;要訂餐,打開美團,每一個 app 都是獨立的孤島,並不是以用戶為中心。而未來的 ai 手機會像一個超級助理,真正變成一個以人為中心的手機。它會把手機裏面的「孤島 app」連在一起,通過自學習,越來越聰明,進而提供一站式的服務。
其實用戶對於手機,需求的是服務,手機就應該以用戶為中心,提供用戶需要的一站式服務。拿這個問題展開來說,未來 ai 手機交互的界面可能會改變,比如說語音可能是一個入口,視覺也是一個入口,這些入口可能都會存在,用戶使用手機的習慣會出現變化,但核心在於 ai 手機的使用體驗會完全不一樣,以後不用再複雜地打開每一個 app。
回到比較官方的關於 ai 手機定義的回答,就是發佈會講的 oppo 關於 ai 手機的定義,必須要具備那四個功能,才能叫 ai 手機。但是ai手機可以帶給用戶的使用體驗,還會有很多其他的方式。比如說你是年輕的帥小伙,你想從手機里找你女朋友的一張照片,你今天的做法是不是要不斷地去翻手機相冊?翻起來太麻煩了,以後不就是一句話就能實現嗎?這些體驗,我覺得是很快就能實現的,大家以後就能感受到。
問:我們知道現在所有的智能手機都是基於 gui(圖形用戶界面),現在有些人提出能不能慢慢弱化,甚至是脫離 gui,就像現在比較火的 regie,或者像比較早的類似 ai pin 這樣的產品,直接用自然語言輸入,然後機器直接給我們自然語言輸出;相比於現在所有智能手機廠商都在走的那種,還是基於 gui,但是用 ai 的力量給它加持,這兩種路線,您覺得哪種更符合您心中對於未來人機交互終極的形象?
劉作虎:我有一個觀點。首先,不管什麼時候,人跟世界的聯繫無非就是眼睛、耳朵、觸覺,類似這些東西。但是人獲取信息最主要的渠道是什麼?這個大家肯定看過那個數據,一定是眼睛,所以視覺是人從這個世界獲取信息的最主要來源。基於這個觀點,是不是存在只需要一個聲音或者聽覺去跟它交互就可以呢?我不能說這種場景不存在,在一些差異化的場景或者特殊的需求下,肯定會有這樣一些創新產品存在,但視覺還是人獲取信息最主要的渠道。
基於這個底層的邏輯,再看理想的交互方式應該是什麼,這個時候大家可能會說有屏幕,還有投影,還有 vr 這樣的產品,但是我自己的判斷,手機至少在 10 年之內肯定是一個人最不可離開的一個設備,它的形態有可能會發生一些變化,但我認為不會發生根本性的變化。我的意思不是說其他類似 ai pin 那種產品不會存在,可能它也會差異化存在,但是我認為手機還是一個最主要的載體。
手機的交互跟現在相比會有變化,從輸入的角度來講,語音會不會成為更直接、更高效的輸入?但也不能排除其他文本的輸入,比如在電梯裏面不好意思用語音去輸入,在不同的場景下,用戶會有不一樣的交互需求。
從整體看,gui 還是一個非常重要的交互方式。
張峻:我接着補充回答,大家想問的其實是這個問題:ai 手機作為一個新概念,它相比於現在的智能手機到底有多大區別?其實今天我們跟 idc 的霍總在做白皮書的時候,我們也探討過一個問題。一個能支持 ai 功能的智能手機和一個 ai 手機,它的區別到底是什麼?這就是為什麼 oppo 今天拋出了 ai 手機的四個特點。每一個特點,都可以跟支持 ai 功能的智能機對比一下,智能機現在是不是具備。
第一,它具備自主學習能力。自主學習能力不僅是意味着模型本身,而是意味着交互體驗的變化。
第二,它具備高效利用計算資源的能力。現在各家都在談大模型端側化部署,大模型端側化意味着對手機硬件算力資源的再分配,無論是叫 xpu,還是 npu,當然也會涉及到其他的 pu,還是內存的使用,還是功耗、底線佔用的資源分配原則,這些都會相應地發生變化。這是底層的,用戶感覺不到,但是這些變化的目的是為了可以把大模型裝進手機里,這就意味着將來真正把模型裝進手機了以後,不換 ai 手機用不了這些功能。
第三,它具備創作能力。也就是生成,現在大家看到的還是比較單點的生成,比如說 ai 消除,把圖片中的行人消掉,生成缺失的背景,這件事情本身你覺得跟手機沒關係。但是今後手機提供給用戶的服務可能都是生成的。大家現在看我桌面上這張泛在卡的,它是事先做好的,只是說沒有提前給到用戶。但是當我真正需要的時候,比如說要出門,ai 就會把航班信息、天氣預報、打車信息全部生成在一張卡上,那個時候就是手機的 ai 在生成,而不只是在手機裏面加載那個 ai 功能,所以這也就是說這個手機本身是有生成的能力,但是它生成的是什麼,其實有很大的想像空間,卡片也只是一種可能性而已。
最後,是它具備更強的感知能力。這種感知能力是基於這些傳感帶來的手機全方位體驗的智慧化。打比方說,你現在用的麥克風、揚聲器,因為它有傳感能力,能感覺到你環境的內容,而帶來不一樣的音量,這就是手機本身的 ai 化,所以 ai 手機其實現在確實坦白講,這個概念聽起來有點抽象,但是事實上在我們看來,它是一個全棧 ai 化演進的革命。
問:剛剛有提到一個真實世界感知的問題,我想了解一下目前你們覺得手機本身的傳感器是不是已經足夠來做這些關於真實世界的感知,比如剛才提到的麥克風、攝像頭,是不是還可以感知一下溫度、濕度什麼之類的?我不太了解,手機廠商方面有沒有其他的想法?
張峻:首先傳感器這一部分,存在即合理,現在手機上存在的一系列傳感器都有它們目前的傳感價值,而且我們也認為它的傳感價值可以進一步深化。但是你要說在上面會不會疊加新的傳感器,我覺得一定會。因為隨着技術的演進,甚至包括化學的技術和其他相關技術的演進,傳感的方向、傳感的數據類型、傳感的靈敏度和精準度,這些都一定會進步。隨着這些進步,我覺得一定會有新的傳感。但是它現在是什麼,我沒有辦法回答你,如果我們真的要做了,那就是敬請期待。
問:oppo 認為制約手機上的 ai 因素有哪些?目前有做哪些提前布局嗎?
張峻:這個問題挺大的,其實這個是在問 ai 手機本身的關鍵要素。從 ai 手機本身的布局來講,我們認為是是全棧。
第一層是從硬件平台開始,oppo也確實在跟芯片廠商聯合探究怎麼樣更好地去適配ai的部署、ai的算力、異構計算、資源分配、高效利用等方面的這些問題,包括傳感器。
第二層,從 os 的角度來說,是多元化的。第一個是最接近硬件那一部分的底層軟件架構,它本身就會因為 ai 的變化進行適配,它的資源需要重新分配,考慮它的重新分配策略,比如說功耗、比如說算力、比如說內存管理。那麼再往上,就是智能體,今天發佈會上有提到,它可能是智慧os的核心了,這部分基於各種大模型的能力,包括智能體本身的這種能力。今天可能講得比較抽象,我再舉一些例子。
比如說智能體,我們講它有規劃、記憶和工具能力。到底是什麼意思呢?就是我們正常在用手機的時候,一系列的動作是我們自己做的,比如說我們真的要出去玩,訂機票、訂酒店、查景點、規划行程等等,這些是我們自己做的。但是智能體,它有規劃能力是意味着它有複雜任務自動化的規劃能力,你告訴它,我要出門了,國慶節想去新疆,它會把這個行程生成出來,當然你可以去讓它修改。修改後,它會幫你去規劃,修改完這個行程是你認可的,它告訴你可能在哪些平台上有什麼合適的機票,哪些平台上的景點有合適的門票。所以它是有複雜任務自動化規劃能力的,這是智能體的第一個特點。
第二個特點,記憶,它就像真的是一個助理一樣,因為它是你個人的,所以它會有長期記憶,你跟它聊過天,你這個人的風格比較幽默,可能你讓我生成朋友圈文案的時候,我就會生成得好玩一點。這個人可能平常總是跟我聊一些特別嚴肅的事情,我生成朋友圈文案可能就會嚴肅一點,那麼這些它是基於不斷地跟你交互的記憶帶來的。
第三個能力就是工具能力。是因為智能體不是無所不能的,我相信有一段時間,大家在講大模型好像計算不太行,後來它修復好了,但確實它不是無所不能。有很多垂直領域,比如說今天你問它一個金融問題,明天你問它一個法務問題,後天算匯率了,大後天可能又是什麼,它並不是什麼都會。但是它有去選擇調用合適三方工具的能力,就是當你問它這件事情,它知道該找誰,該用什麼來幫你解決這個問題,這是智能體的能力。
這三個能力加在一起其實就很強了,因為這是一個很強的助理。所以這三個加在一起的智能體其實就是這個智慧 os 的核心。在這個基礎上,我們談多模態交互,大家肯定想聽一些更具象的交互模式,我只能透個底說我們確實在做,敬請期待,它會跟現在的交互不一樣。
劉作虎:我補充回答你剛才的問題。ai 對手機的挑戰是什麼?事實上 ai,我覺得最大的幾個挑戰,一是如何精準感知這個真實世界;二是要有足夠強的算力;三是要有算法的先進性。我覺得這個不管是對手機也好,對任何的ai設備,這幾個都會是挑戰。
首先對手機算力的要求,現在最大的瓶頸是 cpu 跟內存之間的帶寬,這個傳輸的速度是現在大家都在探索的,解決這個問題需要理解芯片。oppo 有相應的團隊在這方面也在持續探索,甚至會涉及到整個硬件平台架構的變化,這會是一個相對長期的探索。
談到感知,現在攝像頭或者麥克風達到了真正感知真實世界的標籤嗎?肯定沒有。科技的進步是一步一步的,永遠是在往前走,我相信未來硬件的感知能力一定會比現在的要強很多。
至於算法的先進性,oppo 在這方面肯定要投入很多,怎麼樣真正地去理解用戶,這個模型怎麼去建, oppo也 在訓練自己的大模型。
以上 3 個是 oppo 目前比較重要的能力投入方向。
問:大家在宣傳出發點可能會用「自研」這樣的字眼,無論傳播上可能會有更好的效果,但 oppo 沒有出於這樣的角度用「自研」這樣的字眼,在傳播上或者表述上是怎麼去做的決策或者怎麼看待這個事?
劉作虎:實事求是,我們肯定有自研的大模型。未來大模型也不會說全世界只有一個模型,它也會有多個模型,甚至包括還有一些基於我們的大模型,就像你是電子專業的,那個是計算機專業的,在某個垂域更好的這種模型,實際上我們可能在一些知識和百科裏面,我們自己自研模型訓練的效果也很好。但是可能在某個領域裏面,你不一定是最好的,我們就是大家一起去合作,在這方面一起去訓練一個模型。畢竟今天沒有誰的模型是完全每一行代碼都是自研,所以我覺得這個客觀表述就行。
問:oppo 這邊是怎麼看待全新的硬件形態的,有沒有可能做?做的話,會是什麼時候?
劉作虎:我覺得未來 10 年,手機還是一個最核心的終端形態,但是其他的也會有,我們會保持關注。如果說另外一種形態的產品是一個非常小眾的或者是在某個特定場景的,則必要性不大,影響用戶每天日常生活的我覺得我們才會去關注。我舉個例子,我們 vr 也一直在做,但是一直沒有產品上市,它還是一直處在一個探索階段,在沒有想清楚的時候就不會去把它量產上市。但是我們會關注其他的產品,要客觀、冷靜地去看它是否是一個用戶長期使用的東西,所以我說回到底層,就是視覺,視覺是人獲取信息的主要渠道。如果未來我用一個很簡單的方式,比如就戴一個眼鏡可以分辨率很高,也許會有那一天的,但是現在我還沒有看到一個自己滿意的形態。
問:虎哥怎麼看友商喊 all in 這件事呢?
劉作虎:這只是一個態度吧,我覺得也沒什麼問題。
作為一項新潮的概念,ai 大模型終於在近幾年迎來了爆發。向上,它獲得了更多的能力,並且能更精準地理解用戶的意圖,給出更符合需求的反應和回復;向下,ai 大模型變得更加精簡,可以在智能手機這樣的終端設備上端側搭載,隨身隨時即可調用,降低了使用的門檻。
顯然,這樣的發展勢頭還只是一個開始。隨着硬件對 ai 能力的進一步磨合與適配,未來終端設備上自然也會出現更多的 ai 發展空間,自然也就為終端的 ai 能力提供了更加肥沃的土壤。我們也期待,像 oppo 這樣的手機廠商們能深入開發,讓這些新銳的能力優化我們的日常使用體驗,實現「智能手機」到「ai 手機」的奇妙轉變。而從他們在這一場群訪之中的答覆來看,這並非奢望,甚至那樣美好的未來或許還會來得比我們所想的更快。