對話高途聯創羅斌:教育公司要想在應用AI層改變格局,至少需要3-5年的周期

2025年02月14日11:10:29 教育 4026

對話高途聯創羅斌:教育公司要想在應用AI層改變格局,至少需要3-5年的周期 - 天天要聞

「不要期待有了ai之後就能一劍封喉。」


來源|多知

作者|徐晶晶


奮。


未知。


這是高途聯合創始人羅斌面對當下deepseek引發的這一輪ai技術浪潮時的心境。


興奮,是因為看得見的確定性,拉長周期來看,deepseek帶來了巨大的變數,創造了新的可能性。


不過,這份確定性又是模糊的、未知的。大致方向是能看得見的,但是整個路徑、節奏是模糊的、非共識的,這其中存在很大的不確定性和未知性。這也意味著,一種壓力。


2月12日,高途正式宣布接入deepseek大模型,不過,其對deepseek的關注要比後者大範圍步入公眾視野更早。


高途透露了接入deepseek後帶來的一些顯著變化:


比如,內部協同工具ai助手在接入後,截至目前,日訪問量提升了200%,預計在2月中旬完成內部業務系統和協作平台全面打通之後,訪問量將會進一步增加。


再比如,在用戶產品側,以deepseek為技術核心的高中數學測評準確率提升了15%,而後高中ai選科規劃服務藉由ai助力實現了服務質量提高


在高途官宣接入的當天,多知就deepseek相關話題對話了高途聯合創始人羅斌。


羅斌嚴謹地給出了一些判斷和預期:


1.deepseek-r1大模型的準確率已達到在教育場景相對可用的狀態。


2.今天的大模型還處在整個ai能力進化的相對早期階段,如果成熟狀態是100分,那麼今天的這些大模型最好的狀態也就是5-10分的水平,離終態還很遙遠。


3.在基座模型不斷迭代時,對每家公司來說,更重要的是要找到一種機制,以便在大廠的基座模型快速迭代的過程中,能及時跟上這一波變化,並在每次變化的過程中,能及時把新的能力結合進來,為自己所用。


4.回到教育這個場景,至少在我們現在能看見的一個周期內,ai能力本身是一個關鍵要素,但不是一個決定性的要素。不要期待有了ai之後就能一劍封喉。


5.如果有了更強大的大模型能力,過去拍搜的這種模式就會發生變化,就不需要提前去生產積累自己的題庫,現在是一種實時解答的方式,通過大模型就能夠達到一個非常高的準確率了。


6.教育ai的iphone時刻一定會發生,但時間、形式不確定。教育公司要想在應用ai層面改變格局,至少需要3-5年的周期。


7.眾多學習環節里,ai能替代的,其一,是一個相對簡單的學習任務。其二,ai更適合於學生主動來發起、ai來接聽響應的場景。而需要由我們來主動地管理和影響學生的這個部分,今天的ai還做不到。


8.小型的創業公司,在某些單點上、在某些形態的產品上,有可能獲得一波特殊的機會。但是如果回到重交付、端到端、以學習結果為導向的領域裡,這裡的機會對於創業公司而言,挑戰還是非常大的。


01

deepseek-r1大模型的準確率已達到「在教育場景相對可用的狀態」


多知:deepseek將如何影響教育行業未來的發展?會帶來哪些顛覆性的改變?


羅斌:第一個變化,deepseek這波算是完成了一次比較好的市場教育提升了大眾對於ai能力的關注度,也讓普通用戶使用ai工具的滲透率得到了提升。


第二個變化,結合公開信息和我們內部驗證來看,deepseek-r1的模型做了一些創新(包括引入了更強的推理能力)後,在一些教育場景下的應用效果確實有很大的提升。這種提升意味著,從應用的角度來說,它的準確率已經達到了一個相對可用的狀態。


教育行業的容錯率比較低。原來,大模型的準確率並沒有達到可用狀態。但是今天,以deepseek-r1為代表的這些模型的能力迅速提升,讓整個可用性變得更高,也讓更多的場景引入這一大模型的能力變得更加可行。


舉例來說,在我們內部高中數學的一個題庫上,之前我們用原有模型測試,準確率最佳情況是能做到74%。我們現在拿deepseek-r1結合內部級數據測了一下,經過調優之後,準確率大概能到90%。這還是其在高中數學的知識體系里的表現。如果知識點下沉到初中、小學,deepseek-r1的準確率會提升得更顯著,可能接近於真人的狀態。


第三個變化,讓更多企業堅定了對ai的投入之前很多企業對ai還沒有形成很好的共識,畢竟ai的投入成本比較高,也需要專業人才。但今天很多企業意識到了,必須要擁抱ai。


回到教育場景下,它可能會帶來的變化主要是在兩個方向:


一個方向是為學生創造更好的價值。


從產品的角度來講,目前行業里的教學環境,大部分還是通過以真人老師為主來跟學生進行交付。有了deepseek能力的輔助後,老師和學生在整個教學過程中的反應的速度、平均的專業度、效率、服務群體的規模,都能得到大幅提升。


這帶來的一個變化是,原來必須要由專業的真人老師來提供一些教學服務,今天通過大模型的輔助,不管是教學、練習還是答疑,直接通過ai to c或者通過ai輔助老師來to c這兩種情況下,整個效果和效率都能夠有顯著的提升。


另一個方向是改善企業內部的運營效率。不管是市場營銷、銷售轉化或服務的環節,效率都會有顯著提升。


必須要明確的是,雖然以deepseek為代表的大模型現在很火,但是總體來講,它們還是在整個ai能力進化的相對早期階段,如果成熟狀態是100分,那麼今天的這些大模型最好的狀態也就是5-10分的水平,離終態還很遙遠,在短周期內,我們還不能對它的節奏和價值期待過高。


0
2

在基座模型快速迭代的過程中,教育公司也要讓自有模型及時跟上變化


多知:市面上很多教育公司已經有自研的大模型,同時接入了deepseek,怎麼看其未來的路徑?


羅斌:如今,deepseek是一個更強大的基座模型,無論是把自己原有的模型或數據和deepseek結合,還是以deepseek模型作為基座,重新去訓練新的自有模型,每家公司會用不同的路徑來做。


但我的基本觀點是,今天大模型的底層生態,如果只是5-10分的水平,那麼在未來的半年、一年、兩年、三年,底層的大模型還會有突飛猛進的變化。


今天各家在這樣的場景下構建起的自有模型的能力提升速度,跟大廠的模型提升速度相比,完全不在一個量級。


在這種情況下,對每家公司來說,更重要的是要找到一種機制,以便在大廠的基座模型快速迭代的過程中,能及時跟上這一波變化,並在每次變化的過程中,能及時把新的能力能結合進來,為自己所用。


03

不要期待有了ai之後就能一劍封喉


多知:當教育公司普遍擁抱deepseek,大家的差異化、本質區別將體現在哪裡?


羅斌:不管是以deepseek為代表開源的基座模型,還是一些大廠的閉源模型,它都會有某種方式開放給整個社會使用。所以在底層的基礎的能力上,是相對標的、是平等的,大家在這個地方不會有明顯的差異。


但可能會存在差異的地方是什麼呢?


第一個維度就是在模型的本身。


各家根據自己的需要,嘗試建垂直模型、小模型或者專屬模型,這樣能更好地適配不同應用場景。比如高途有考研業務,也有公考業務,可能用於考研業務的模型和用於考公業務的模型就不太一樣。這裡可能存在差異化的模型的版本。


各家在專屬模型的建設能力和水平上實際上是有差異的。


第二個維度是在應用層。


關於基座模型,教育公司們不會有顯著的差異。但在應用層,可能變化會更多一些。現在的模型,更多的還是偏系統1的這種模型,還不具備非常強的推理、調度或者真正意義上的智能。


未來,大家也在提,比如大套型套小模型的方式,或者是通用模型嵌套專有模型的方式,包括未來有市面上有這麼多的模型,怎樣做混用,不同的場景下可能調用不同的模型,另外,包括人機怎麼結合,老師和ai怎樣協作,讓整個過程能夠變得更加高效和專業,這個地方可能各家的做法會有差異。


還有一個就是怎樣做運營。同樣的一個能力,在不同的團隊裡面,你的推廣、宣傳、運營,可能會導致最終的使用的廣度、深度、效果上,也會有明顯的差距。


第三個維度是在產品層。


站在學員的角度,學員需要的產品是一個解決方案。他並沒有那麼在意你提供的是真的ai還是別的什麼。


所以結合ai的能力後,每家提供的解決方案,是不一樣的。但是從學員角度看,他需要更好的體驗,更好的效果和更好的性價比。因此,在產品上,變化會更大。


最後一個維度是組織能力。


同樣的一種ai能力,隨著時間的演進,大家的迭代方向和迭代速度是會有差異的。


拉長周期來看,不管是從產品層面還是從運營層面,都會形成更加明顯的差異。


這裡面,人才的影響是比較大的。


總結來講,底層能力、標準化的這些能力,大家是類似的。但是回到教育這個場景,至少在我們現在能看見的一個周期內,ai能力本身是一個關鍵要素,但不是一個決定性的要素。更重要的還是在產品、在應用等方面,可能需要結合ai來做重新的思考設計。面向未來的一個周期(3-5年)來做這樣的布局和迭代,可能是更加重要的。


不要期待有了ai之後就能一劍封喉,這件事情不太會發生。


04

大模型實時解答,正在消解拍解題產品的題庫門檻


羅斌:原來學生有一道題不會做,他要麼問老師,要麼就用拍搜工具。拍搜工具內部是要做大量題庫的生產和累積的,但今天看起來,如果有了更強大的大模型能力,過去拍搜的這種模式就會發生變化,就不需要提前去生產積累自己的題庫,現在是一種實時解答的方式。


所以我的感覺是,未來在解題的這個部分,你問ai一道標準化的題,ai給你進行解題這件事,會變得比較標準化了,通過大模型就能夠達到一個非常高的準確率了。相當於拍搜題庫這件事不會有絕對的門檻了。當然可能每一家自己做出來這個模型,通過不同的數據和調優以後,可能還會有一定的準確率的差異。但這個差異就沒有那麼大了。


原來可能你手裡有一億的題庫,人家手裡可能只有一千萬的題庫,差異可能會特別大。但有了更強大的大模型能力,以後可能的差異是,你的準確率可能是93%,人家的準確率可能是91%。可能只是這種層面的一個區別。但是在覆蓋率上,可能大家都能夠做到非常高的覆蓋率。


05

學習環節里,相對簡單的任務和交互,更容易被ai替代


多知:deepseek會不會取代一些現有的學習產品?


羅斌:如果把整個學習進行拆解,不管是面向學生,還是站在企業內部的角度,有很多環節。


哪些環節受到ai的影響更大呢?可能是相對簡單的任務,相對簡單的交互,在這種邏輯下,更容易發生。但如果它是一個長周期的、多任務的、複雜的鏈條,ai在裡面產生很大作用的難度會比較大一些。


所以,第一個,ai替代的應該是一個相對簡單的這種學習任務。第二個是,它更適合於學生主動來發起、ai來接聽響應的場景。而需要由我們來主動地管理和影響學生的這個部分,今天的ai還做不到。這是因為,ai的能力還不夠,也很難讓學生真正遵從ai的指令。


所以從這兩個角度來講,ai能夠在裡面發揮作用的一些環節還是可以羅列的:


第一種場景,在企業內部的一個場景下,通過ai來輔助做一些內容的生產,做一些知識庫的建設,包括做一些內部的問答平台搭建,這是可以做得到的。


第二種場景,一些簡單的對話場景,比如像客服、拍搜學生問一個問題,你要給他一個答案,這種就是用戶過來之後就去尋找一個答案的這樣一種邏輯,跟標準化的deepseek的用法類似。你給一個輸入,它會反饋你一個輸出,提供一些專業的內容解答)這種類型的場景下,ai的能力會越來越強。


第三種場景,在一些特定的練習場景下,ai是可以承擔這樣一個角色的。舉個例子,英語對話練習,市面上有很多的產品在做類似的一個事情,這也是比較簡單的對話性的任務,或者是你需要他給你針對一個特定的題目做一下講解,講特定的一道題,簡單的教學或者是對練,是可以通過ai來做一定的替換的。


但是除了這三種情況以外,對於其他的比較複雜的這種任務,以及這種需要老師和學生進行強互動,強引導,甚至帶有一定的管控屬性的任務和場景,ai在裡面更多的只能起到一個簡單的輔助的作用,也很難真的替代真人來完成這些邏輯。


06

教育ai的iphone時刻一定會發生,但時間、形式不確定


多知:隨著ai的快速發展,未來教育行業的格局會發生怎樣的大變化?


羅斌:教育行業格局如果要發生大的變化,一定要有一個重要的變數——會不會有真正意義上新形態的產品出現。教育+ai里會不會有一個iphone時刻,像當年iphone橫空出世一樣,帶來根本性的產品的變化和升級?


關於這件事,我的觀點是,一定會發生,但是它發生的時間點和發生的形式,是不確定的。因為明顯從現在的整個教育市場來看,如果以客戶為中心,現在這個市場上提供的教育產品,從學習體驗、學習效果、學習效率、個性化程度來看,離客戶的理想的期望還是有明顯差異的。


可以設想一下,學員需要的一個理想教育產品是什麼樣的?大概率就像我們去醫院,從進門那一刻開始,一切環節都交給這家醫院了,診斷、分析、化驗、治療、複查,是一個端到端的解決方案。


如果按照理想的狀態來對比,在教育場景下,我們的客戶需要的是這種方案。但受限於很多因素,今天市場上提供的教育產品,離這個還有很大的距離。其中一個非常大的因素是真正優質的教育資源/老師的供給是有限的。優秀的老師,一方面是包括他的學科能力、專業能力,另外一方面上是包括他的教學能力,對於學生施加影響的能力。這兩方面能力都比較強的優秀老師是一個稀缺資源,另外,成本也不會低。


所以,有更強大的ai能力後,剛才講的這兩方面都會發生變化——一方面,成本會更低,因為ai成本未來是會快速下降的。另一方面,供給變得更加充裕了後,可以通過ai和真人老師的協作和配合,針對學員提供更加個性化的、更有針對性的、更加端到端的、體驗更加友好的學習解決方案。


這件事情如果真的達成以後,它相對於今天教育領域的模式來講,會有一種根本性的變化。所以我認為,這件事情的發生,對於未來教育生態的格局影響是會很大的。


除了這個之外,其他的,比如各家應用ai的能力改變格局等等,從應用層面,至少是一個3到5年的周期。也就是說,有的企業整體應用和迭代ai能力的綜合能力會更強,會導致這個企業顯著地從經營效率、規模、口碑等方面優於其他企業。但這件事情需要的周期是3到5年。


就像移動互聯網剛剛出來的時候,也很強大,但離諸如美團、位元組這種成熟品牌的出現,中間會有一個回歸周期。所以今天這個節點,最重要的是要全力擁抱這一浪潮。


同時,站在教育企業的角度,核心是要以客戶為中心的,真的想辦法幫客戶創造更好的價值,在過程中怎麼能把ai這個能力利用好,不能夠反過來拿著鎚子找釘子,不能拿著ai去找東西。


07

小型創業公司,在某些單點上、在某些形態的產品上,有可能獲得一波特殊的機會


多知:這種新變革的機會,是更可能出現在教育行業的創業公司方面,還是出現在現有的對ai應用更好的公司里?


羅斌:按照我們剛才講的邏輯推演,一個真正有效的符合客戶需求的學習解決方案,是一個複雜的學習解決方案。這個複雜的解決方案的背後,需要強大的組織能力、產品能力、運營能力、技術能力來作為整體的支撐。


小型的創業公司,在某些單點上、在某些形態的產品上,有可能獲得一波特殊的機會。但是如果回到重交付、端到端、以學習結果為導向的領域裡,這裡的機會對於創業公司而言,挑戰還是非常大的。


因為至少到目前為止,教育行業本質上更接近於服務業,是人力密集型行業。這個屬性沒有發生根本變化之前,這種簡單的通過技術改變這個行業的可能性不會發生。


但是如果到某一天,ai特彆強大,在各種維度上都很強,有沒有可能把它們組合在一起能夠產生完全有別於當下的業態的可能性呢?不能完全否定這種可能性。這就意味著,教育行業的iphone時刻發生了,那就是另外一種邏輯了。但是這件事情是不會在很短的時間裡發生。比如3-5年,甚至5年以上的周期,有沒有可能?不排除。但在那個時間點,當下這些教育頭部企業也在快速進行迭代,到那個時候他們的能力也不一定亞於新型的創業公司。


所以,一個是基於行業領域的能力,另外一個是基於更加強大的新型生產力,這二者之間到底哪個帶來的影響會更大?中間會是什麼樣的結合和演進方式?


今天,這一切都是未知的,大家都在快速往前奔跑。


end

作者:徐晶晶

教育分類資訊推薦

舉例說明定向醫學生能考研究生嗎? - 天天要聞

舉例說明定向醫學生能考研究生嗎?

定向醫學生能考研究生嗎?答案:能,但需跨過三道「關卡」一、政策紅線:服務期內考研=違約根據國家規定及多地協議,定向醫學生需在基層服務6年(含3年住院醫師規培),期間原則上禁止報考全日制研究生。例如:江西政策:違約需支付培養費用2-5倍的違約
116項主題活動等你來,南京林業大學第八屆生態文化節開幕 - 天天要聞

116項主題活動等你來,南京林業大學第八屆生態文化節開幕

3月25日,南京林業大學舉辦了第八屆生態文化節開幕式。本屆生態文化節以「生態文明·責任與使命——『綠』動南林,智匯未來」為主題,統籌舉辦綠色理念傳播、生態公益服務、生態社會實踐、生態智慧應用等116項主題活動,為廣大師生和市民奉上一份綠色文
梧州12355青少年服務站心理輔導服務開始預約啦(2025年第8期) - 天天要聞

梧州12355青少年服務站心理輔導服務開始預約啦(2025年第8期)

梧州12355青少年服務站是由共青團梧州市委打造的集熱線、網路、線下服務三位一體的一站式青少年服務埠。為幫助更多有需要的青少年疏導情緒、舒緩學習壓力、改善人際關係,梧州12355青少年服務站為我市青少年及家長提供線下公益心理輔導服務。名額
閔行·澤普千名學子共繪絲綢之路 - 天天要聞

閔行·澤普千名學子共繪絲綢之路

近日,一場跨越山海的藝術盛會——閔行區第二十二屆「信宏·莘松杯」中小學美術比賽在閔行教育學院附屬中學和莘庄實驗小學拉開帷幕,來自閔行區和新疆澤普地區160餘所中小學、1000多名學生共同參與。比賽以「山海同心 萬里同畫」為主題,寓意著上海閔
參賽對象含中小學生均應納入申報範圍 全國性競賽活動申報啟動 - 天天要聞

參賽對象含中小學生均應納入申報範圍 全國性競賽活動申報啟動

為加強面向中小學生的全國性競賽活動管理,近日,教育部啟動2025—2028學年面向中小學生的全國性競賽活動申報工作,該申報每3年受理一次。2022—2025學年面向中小學生的全國性競賽活動舉辦時間將於2025年8月31日截止。按照相關政策要求,只要參賽對象包括中小學生的,均應納入申報範圍。申報的競賽主辦方應為在中央編辦、民...
希望小學花14000元採購市價600多元相機?官方通報處理結果 - 天天要聞

希望小學花14000元採購市價600多元相機?官方通報處理結果

近日,有網民發消息稱,在2023年的一份《四川省石棉縣希望小學災後恢復項目設備設施採購及安裝中標(成交)結果公告》中,四川省石棉縣希望小學採購的「松典相機」中標價格14050元,而該相機網路售價僅631元,質疑其中標價格不合理。3月25日,石棉縣教育局針對此事進行了回復,現將有關情況說明如下:為滿足日常微課錄製等...
本科生,被降級! - 天天要聞

本科生,被降級!

近日,華南理工大學教務部門公布了2024-2025學年第二學期全校本科學生的學業警告名單。經評估,共有737名學生收到學業警告通知,134名學生首次被降級試讀,另有81名學生再次面臨降級試讀。本科生遭遇「降級」?