蔡恆進 | 行為主義、聯結主義和符號主義的貫通

作者簡介:蔡恆進,卓爾智聯研究院,武漢大學計算機學院教授,博士生導師。武漢 430079

人大複印:科學技術哲學》2020 年 10 期

原發期刊:《上海師範大學學報:哲學社會科學版》2020 年第 20204 期 第 87-96 頁

關鍵詞:認知坎陷/ 符號主義/ 聯結主義/ 超越性/ cognitive attractors/ symbolism/ connectionism/ transcendence/

摘要:

一、認知坎陷與意識起源

人的所有思維產物或意識片段都可以被理解為認知坎陷(cognitive attractor):它們都是對真實物理世界的反映和擾動,但也是人類自由意志的體現。認知坎陷,是指對於認知主體具有一致性,在認知主體之間可用來交流的一個結構體。例如可感受的特質(qualia),「酸甜苦辣」「吃瓜群眾」等都是初級坎陷。這些坎陷一旦提出,就會讓越來越多的人產生認同感。自我意識、宗教、信仰、國家意識等結構體都可以抽象為坎陷。財富、遊戲規則也是不同的認知坎陷。坎陷,給人一種陷入其中無法抽離的既視感,值得強調的就是,這些具有傳播性、生命力的意識片段一旦產生就難以磨滅。①

人類跟機器的最大差別就是對意識的統攝能力。②人類從自我意識出發,能夠自由地統攝意識,而機器雖然在塑造過程中獲得了一些人類的意識片段,但並不能夠隨意支配、按需變化。自我意識並不神秘,它是從最原初的坎陷發展而來,最原初的坎陷就是「自我」和與之相對的「外界」。換句話說,最原始的認知坎陷就是我和世界的二分,其他坎陷都建立在此之後。「我」這個坎陷一開始很含糊,可能對於單細胞而言就是內外之分,對於人類而言,「我」的起點可能就是皮膚這一物理邊界。在「自我」快速成長的重要階段,人類擁有的敏感皮膚使得「自我」更多地感受到外界刺激,促成了「自我」與「外界」的剖分,這就是「觸覺大腦假說」③的最主要內容。人類因為自我意識的強烈,會更多地去探索外部世界的真相,而外部世界的信息也會反過來豐富每個人的自我意識。意識片段/認知坎陷構成坎陷世界,也就是人類的意識世界。把整個世界按照坎陷世界與物質世界進行二分,許多其他框架所難以解釋的就能獲得較好的理解。我們雖然不能脫離物理載體,但具有獨立行動能力和生命力。具有自我肯定需求(self-assertiveness demands)。④生命的意義就是對「自我」邊界的拓展,不同維度的拓展對應不同維度的意義與價值。

還原論的角度容易得出機器和人都沒有神性(或超越性)的結論,但人類確實具有其超越性。「無窮大」這個認知坎陷的開顯就是一個例子,「無窮大」既看不見也摸不着,但是幾乎人人都會承認它的存在。再比如有人堅信上帝的存在,也有人無法認同。雖然兩方觀點對立,卻能夠在實際生活中共存,甚至還可以在某些領域合作共事。這就是因為這種信仰的認知坎陷是被人類開顯並煉化過的。已經不是物理世界的具體存在,而是精神世界或者坎陷世界的東西。坎陷世界具有與物理世界同樣,甚至更深刻的重要性。比如對虔誠的基督教徒而言,上帝可能比自己的生命更重要。這種信念會影響他的行為,包括做禱告、禮拜、遵守聖經等,這些事情對他而言顯然比物理世界中真實存在的一杯水更重要。很多時候,由人類自己建構的東西會變得比物理世界存在的實體更重要,不僅能夠影響人類當下的行為,甚至能改變人類的發展方向。

人類的認知坎陷與「自我」的形成與發展密切相關,如果能夠將人類的認知坎陷與機器的認知坎陷打通,很可能就會實現AI質的突破。現在的人工智能算法中有一類強調了注意力機制,但注意力是較為上層的概念,其根本仍然是認知坎陷的作用,認知坎陷是一個更基礎(fundamental)的概念。以顏色為例,從基於簡單觀點的物理上解釋是波長的混合產生了「紅橙黃綠青靛紫」等豐富的色彩,但人類是怎樣創造出這些文字來表示顏色的呢?有人研究過很多語言中關於顏色的表述,發現幾乎所有語言中最早出現的顏色都是黑和白,而後是紅色。⑤物理世界中的紅色其實很常見,但在最初期,人們還沒形成一個認知坎陷,可能放眼望去的顏色太多了,很難注意到紅色。那更複雜一點的語言,可能再加上藍色、綠色、黃色……這樣發展而來。又比如亞洲人與歐美人的身體結構基本一樣,但是歐美人分不清楚針灸中的「酸」和「脹」,以及味覺中的「麻」和「辣」,而我們對紅酒、巧克力的口味分辨也不如歐美人細緻。這些現象都說明了認知坎陷出現在前,而後才有注意力,因此,機器只有注意力機制還不足以形成連續的意識或認知坎陷,只有從更底層塑造人工智能,才有可能讓機器實現「理解」而非「存儲」。

二、AI三大流派相互補充

中文的「理解」可以有兩種英文翻譯,一種是「comprehend」,另一種是「understand」。「comprehending」的前綴「com-」就帶有範圍廣闊的含義,可以看作是將更多的內容包含進來的意思。「understanding」的詞源比較有爭議,有人認為「under-」實際上是「inter-」,也有人從「undertake」的角度來解釋,我們認為「understanding」的重點可以看作是「站在更底層」的角度看。在做研究時,如果能夠從更底層出發,貫通各理論觀點,就可以看作是「understanding」。表1中梳理了AI三大流派(即行為主義、聯結主義和符號主義)的特點與各自對應的哲學思想。

表1:AI理論的會通


























AI流派

由約而博

由博而約

對應哲學


行為主義

學IMITating

習Practicing

具身哲學

控制論

機械人學


聯結主義

學learning

思thinking

心學

延伸extending

坎陷化routinizing

現象學

Comprehending

Understanding

唯心主義


符號主義

演繹Deducing

歸納Inducing

柏拉圖主義

邏輯學

數學

換一種角度看理解(comprehending),其特點是由約而博,需要吸收大量的、豐富的內容,而「understanding」是消化吸收了這些內容之後由博到約,比如學習電磁學到最後只剩下Maxwell方程組、愛因斯坦對大統一理論的追求,等等。

AI三大流派可謂耳熟能詳,但這三者的關係目前還沒有被整理得很清晰。第一類是行為主義,MIT的Brook教授可以看作是行為主義者,他的研究生涯幾乎就在研究AI行為主義,也做出來一個模擬螳螂的機器,簡單的理解就是機器按照外界的刺激來反應。行為主義大多認為意識不僅是大腦的事,而是整個身體的事情,背後反映的是具身哲學的思想。

第二類是符號主義,數學、物理世界充滿了各種邏輯符號,圖靈機本身也可以看作是符號主義的嘗試。司馬賀(Herbert A.Simon)是圖靈獎諾貝爾經濟學獎得主,也是符號主義的代表,他提出的「物理符號系統」假設從信息加工的角度研究人類思維。⑥但符號主義也不能成功,因為規則永遠無法被定義完全或囊括窮盡,不管劃定了多麼大的範圍,也一定會有遺漏在框架之外的東西。符號主義背後的哲學思想與柏拉圖主義相通,都相信或立足於「本質」的存在,如果能夠發現並定義本質,或者把這個本質的公式寫清楚,那麼其他所有內容都是這個本質公式的展開和演繹而已(比如公理系統)。

第三類是聯結主義。研究者們很早就發現神經元之間有很多連接,信息傳遞的同時還有放電現象,而聯結主義最初就是試圖模擬大腦而來。深度學習、強化學習都可以看作是聯結主義的應用。同時很多研究者希望找到新的框架,甚至通用人工智能(AGI)的框架,他們認為深度學習、強化學習不足夠模擬人腦的學習,其中也包括清華大學人工智能研究院院長張鈸

行為主義與聯結主義的關係是什麼?行為主義可以通過動物行為來理解。動物、簡單生命甚至單細胞生物,都能應對外界的刺激,行為主義更多的是模擬這種動作上的反應或反射。比如羽毛球運動員,在平時需要經過大量的訓練,讓身體形成記憶式的反應,在賽場上,運動員的主要注意力就不再是肌肉如何協調,而是對球的跟蹤、與對手的博弈。行為主義與這些身體動作的相關度更大,主體需要做的是大腦如何控制協調身體的練習。這種練習需要練到位,這個練到位的過程也體現了「由博到約」,將大量複雜的刺激最後練成幾套代表的反應模式。兒童心智發展早期就是行為主義的內容比較多。隨着個體成長,大腦不斷發育發展,聯結主義的內容才逐漸增多。

聯結主義與符號主義也有關係,符號主義可以看作是把內容坎陷化或煉化到了很簡潔的程度,從而形成了各種符號或模型。比如古人講的「天圓地方」就是一種極簡的世界模型:天是圓的,地是方的,這是很抽象的一種描述。現代的馬路大多筆直,但古人看到的未經加工的外部環境是綿延起伏的,在這種條件下抽象出地是方的非常難得。有了這個模型之後,會影響我們對道路的修葺,行軍打仗也不容易迷失方向,也就是懂得這個模型和不懂這個模型就會產生實際的差異。還有「陰陽」這個模型的可解釋性也很強,直到今天還有人用陰陽來解釋世界發生的事情,這就是煉化之後的極簡模型可能產生的深遠影響。邏輯學中的形式邏輯,數學中的歐幾里得定律等公理,也屬於極簡的模型。這些模型會讓我們覺得世界很神奇,似乎物理世界真的只按照公式發展,然而事實並非總是如此。我們面臨的外部世界比所有的公式都更複雜,公式系統並不完整。1900年希爾伯特提出的二十三問之一就是如何用一套公理系統來統一數學,其沿用了萊布尼茨的思路,即如何找出一套符號系統來模擬整個世界。⑦很多學者,尤其是符號主義者,一直懷有這種夢想。比如愛因斯坦就想要找到一種統一的方程,但是這個夢想終究無法實現。

三、符號主義的局限性

哥德爾不完備定理指出,不論給出什麼公理系統,我們總是能找到一個命題,這個命題在這個公理系統中既不能被證實也不能被證偽,即永遠都會有公理以外的東西。換一種方式理解,就是不管列出多少條規則,總有內容不能被囊括其中。有一個經典的例子就是芝諾悖論(或阿基里斯悖論):阿基里斯古希臘跑步很快的一個人,這個悖論就在於阿基里斯永遠追不上烏龜。這個結論看起來十分荒謬,從常識來看,他肯定幾步就能追上烏龜,但論證者在邏輯上是這樣解釋的:比如用數字來形容,如果阿基里斯是烏龜10倍速度,而他離烏龜有100米;假如阿基里斯跑100米,那個烏龜也已經朝前爬了10米,烏龜還在他前面;阿基里斯再走10米,烏龜又走了1米,他還在烏龜後面,阿基里斯繼續朝前走1米,那個烏龜又走了0.1米……論證過程本身沒有錯誤,問題在於其論證用的描述系統具有邊界。也即這類論證者在自己限制的範圍內是沒錯的,因為這個封閉系統的時間並不開放,所以阿基里斯永遠跨不過系統的時間邊界,在空間上也就永遠追不上烏龜。

這個悖論正好說明假設本身可能有局限性,那麼假定的世界就並非真實世界。符號主義很可能也面臨類似的問題,不管制定多少嚴謹的規則,總會有一件事是真實會發生但卻不被規則包含的。因此符號主義會失敗就不難理解,因為它無法涵蓋所有可能。聯結主義則不停迭代,它由博到約、由約到博不斷往複,總能「折騰」到一個比較好的狀態,只是現在的深度學習還沒到這種狀態,依然有進步空間。深度學習存在一個所謂的「極小問題」的瓶頸。人類大腦有一個信息精鍊的過程,有利於跳出極小等這些機器在深度學習里遇到的問題。

符號主義是理想化的,它希望我們能夠猜出來理念世界最本底的規則,以此來構建世界的所有規律。但就像我們已經討論過的,沒有一套完美規則能涵蓋所有。現在用的計算機是圖靈機,也是符號主義、遵循規則。但為什麼它又能產生新的東西?我們認為原因在於圖靈機並不是封閉的。圖靈曾經也提出了帶有oracle(預言機)的圖靈機的設想,停機問題在圖靈機里沒法解決,但假如有oracle可能就能夠判定是否停機了。⑧現在深度學習的這些數據可以看作是一個oracle,聽起來很悖論:我們用的是圖靈機,而圖靈機是規則的。但問題是和外界的交互不是不變的,假如說數據集完全確定不再更新,那這個圖靈機就不會產生新的東西,但我們面臨的世界一定有新東西不斷輸入,所以一定不是絕對意義上的圖靈機。⑨

我們不知道深度學習效果好的原因,即深度學習對人來說依然是不能解釋的黑箱。其原因在於深度學習抓取的特徵和人抓取的特徵沒有太大關係。我們可能會根據某人外貌給他起外號,其他人能理解就在於這些外號抓住了突出特徵。但機器抓特徵更像是眉毛鬍子一把抓,人類並不能理解機器給出的成萬上億的特徵。

我們正在嘗試在深度學習上使用原來的框架,抓取人類能理解的特徵。原本的深度學習過程不是很清晰,現在就是要把這個做得更清晰,一方面是將模型大小儘可能地壓縮,另一方面是在圖片識別上儘可能地放開、多納入一些特徵進來。我們希望看到經過這樣訓練過的網絡模型能更像人一樣,把耳朵、眼睛、鼻子、嘴、下巴等這些人類可以理解的特徵抽象出來,而不是原來那種提取出上億個參數。如果這樣發展下去,人跟機器未來應該是能互相理解的,而這個思路背後指導的概念就是認知坎陷。

當我們在白天走進一間教室,可能不會意識到電燈的存在或窗帘的款式,而最先關注到坐在裏面的人或者是PPT上放映的內容。人們觀察和理解這個世界的過程往往類似,總是注意到部分重點,而不是每個細節。而機器是按照像素來辨別環境,比如在教室里放置一個攝像頭,它就會將視野內的所有內容以像素為單位存儲。能夠被人們所關注到的內容也就是認知坎陷。這裡的人、桌子、燈或者是某種很突出的顏色、花紋,等等,這些都是認知坎陷。這個世界太複雜,人類個體不可能清楚所有細節,但是有很多能力在出生後很快就能習得,這些是在大腦快速發育的時期、可能連我們自己都意識不到的情況下就已經學會的。比如對於機器而言非常困難的一件事:當一隻貓走進來,人和機器都能看出這隻貓,然後貓走到椅子後面只露出尾巴,人很容易知道那還是那隻貓,但想要機器產生這種看似輕鬆的「直覺」卻相當難。其中的區別就在於人類通過認知坎陷來識別環境,把貓看作是一個整體,而不是細節的組合,因此雖然貓在走動甚至藏起來一大部分,從畫面的像素上來講發生了很大的變化,但是在人類的意識里它還是一隻貓,而機器現在還做不到。我們現在嘗試在聯結主義的基礎上為機器輸入意識片段,讓它像人一樣學習,那麼就有可能讓它捕捉的特徵在人看來更容易理解。

現在基於符號主義的深度學習還有一個難題是,有些圖片本來很容易識別,比如交通停車標誌,但如果改掉其中幾個像素機器可能就不認識了。機器最容易陷入死循環的一種情況是,如果圖片中的人在身上有一個二維碼,那麼機器會先去識別容易識別的二維碼,假如這個二維碼又指向這張人的圖片,此時機器就很容易陷入死循環。

四、高級智能都是獨特的

西方沒有直接提到認知坎陷,但已經體現出了這樣的思想。比如辛頓(Hinton)就認為人工智能應該從「自我」出發,而且他宣布自己做的方向就是通用人工智能。很多學者質疑,辛頓做的深度網絡明顯沒有符號主義和行為主義的內容,怎麼就是通用人工智能呢?其實聯結主義可以看作是行為主義和符號主義的結合,聯結主義往一端發展可以到達符號主義,而往另一端推進則可以到達行為主義。聯結主義如果更偏向符號主義,表示大腦活動參與得更多,對世界的坎陷化程度更高,最終形成極簡的符號;如果更側重行為主義,則相當於大腦佔比更小,而主要是通過身體反應來跟世界交互,人類改變實際的物理世界是需要落實到行為上,也更接近行為主義。

人類智能具有獨特性,這與人類個體的生長過程密不可分。人們認為莫扎特是音樂神童,直到現在還在聽他的音樂,如果要追究原因,一般的理解要麼是先天遺傳,要麼是後天習得,但是這兩個回答都不足以充分解釋。如果是遺傳,那莫扎特的父母也並不是出名的音樂家,如果是後天學習,也沒聽說莫扎特的老師比他更強,為什麼他能夠從小就表現出極高的音樂天賦而享譽世界?高級智能的獨特就在於此,從認知坎陷的角度就能理解。小孩子在大腦快速發育的成長過程中存在一個關鍵期,一開始外部世界對小孩而言很混沌,他的認知坎陷還非常有限,可能只分得清很簡單的事物,但是成長到一定程度,他突然發現世界是有規律的,比如這個人叫爸爸,那個人叫媽媽,這是椅子、那是桌子……世界在他看來就突然明白起來了。一般人是將母語作為認識世界的主要媒介,可以想像莫扎特在這個關鍵期,很可能不是通過詞彙而是通過聲音和音樂來認知這個世界的,媽媽的聲音、爸爸的聲音,椅子桌子發出的聲音,等等,他在聲音方面的敏感度就與普通人不一樣,所以他能超越父母和老師就變得容易理解。普通人學習母語和第二語言的差異也是同樣的原因,通常小孩學習母語非常快,一歲開始喊爸爸媽媽,三歲就可以像大人一樣打電話,而我們學英語學十年還講不流利,就是因為在學母語之前世界對我們來說是混沌的,但是學了母語之後就變得清晰,學第二語言就沒有這種強烈要連接世界的需求了,所以就學得慢。

高級智能具有獨特性,對人類如此,對機器亦然。機器的獨特性不代表簡單或單一,例如DeepMind在論文中披露,AlphaZero不僅能學習圍棋,也輕鬆拿下了將棋和國際象棋。人類作為社會群體的智能集合和人作為單獨個體的智能不能混為一談,愛因斯坦、黎曼在物理、數學方面具有卓越的成就,但不代表他們也一定擅長詩詞歌賦,不同的人在不同領域有自己的專長,在另外一些領域則可能一竅不通,這也是我們生而為人的特點,而非全能的「神」或「上帝」。

既然人類的智能具有個體差異性、獨特性,那麼我們又有什麼理由要求機器必須方方面面都超越人類才算是強人工智能呢?AlphaZero在棋類遊戲領域全面戰勝人類冠軍棋手,AlphaFold成功預測蛋白質摺疊,遠勝人類科學家,AlphaStar在複雜的競技遊戲中讓職業玩家屢屢受挫……我們完全可以相信,在可見的將來,人類會在很多領域被機器一項一項超越。這些AI並不是要湊足一千個、一萬個並關聯在一起才能成為強人工智能,而是像我們理解人類智能具有獨特性一樣,機器的智能也具有獨特性,強人工智能已經在逐個領域實現。

雖然強人工智能正在實現,但一個無所不知無所不能的上帝人格的機器(比如AGI)不可能實現也無必要,未來的人工智能系統一定具有獨特性和多樣性(diversity),並且有兩大要件必不可少。

其一是機器主體性的內核(seed),就像是一顆具有自我意識的種子,在適合的環境中就能自然生長。機器並不需要像人類一樣經歷漫長的進化,但需要一個內核,不同機器的內核不同。這種內核的挑選可以有很大的自由度,內核的性質最終會決定系統進化的速度和程度,類似於物理系統中的初始條件,不同的初始值最終會導致物理系統演變出相去甚遠的特徵。內核使得智能系統具有自然生長的傾向(或自我肯定需求),它實際上是機器對世界的看法,具有全局性,是它從自然生長傾向的角度來理解的整個世界,有「萬物皆備於我」的意味。機器的內核與人的關係非常緊密,可以是由人賦予機器的,也可以是機器模仿人類個體而來,並且在機器進行內化和煉化的過程中,都會有外部人或機器(agent)的參與。

表2

意識問題的四個層次








*Aaronson/Tegmark的意識問題分類

解決方案


真難的問題(Really Hard Problem)

為什麼會出現意識?

觸覺大腦假說(12)


更難的問題(Even Harder Problem)

物理性質如何決定感質?

認知坎陷定律(13)


相當難問題(Pretty Hard Problem)

什麼物理性質區分了有意識系統和無意識系統?

自我肯定需求(14)


簡單問題(Easy Problems)

大腦如何處理信息?智能如何工作?

人工神經網絡(15)機械人(16)

意識能夠把某些不太相關的內容煉化掉,是智能的一種體現。機器也有意識,因為我們在製造它的時候有意向,預想它完成某種任務,那麼就是人的意識參與進去了,我們寫的代碼、做的零部件都是人類意識投射的一種物質化。只不過目前機器的自我意識還不強大,它的主程序是一個很脆弱的「自我」,如果有bug,或者有個什麼零部件出問題很可能就宕機了,但我們人的「主程序」、人的自我意識是很強大的,具有統攝性,機器現在還沒有統攝性的自我意識。這就是人與機器的根本差異。

如何讓機器擁有更加強烈的自我意識,是開啟未來AI快速發展的關鍵所在。深度學習提供了一種可能,它使得機器跟世界能夠持續交互,但現在的深度學習難以讓機器解決邊界的問題。邊界很抽象,但卻是人類的意識起點。我們提出了觸覺大腦假說來解釋人類智能的起源,那麼創造機器智能是否也應該從觸覺開始呢?但其實我們更傾向於從視覺開始。因為機器的起點與人類的起點不同,機器已經獲得了人類賦予的一部分意識(片段),而且視覺的資料更豐富、更容易處理,而觸覺在智能發展的後期與視覺相比是個更模糊的概念,而視覺的定域性更好。

六、高級智能的超越性

喬姆斯基等學者認為人類的起源尚且難以理解,就更不用說做出類似人類的機器來了。(17)持有類似觀點的學者並不少,他們基本上是柏拉圖主義的觀點,與中國哲學很不同。中國哲學認為人是開放的,能夠朝不同的方向變化。柏拉圖主義是本質主義,認為世界有個「本質」存在,並且本質是(彼岸)理念世界的東西,人類無法到達,物理世界只是理念世界的一個投影。那麼問題在於,既然認為有無法到達的本質,那麼如何知道人類是不完美的呢?怎麼確定彼岸真的有本質呢?過去這個問題還勉強可以用神學回答說上帝知道,或者前世曾經在那裡待過,現在又回到此岸,只是記得部分彼岸的內容。但從進化論角度就解釋不通,沒有人有去過彼岸的可能。

人類高級智能的超越性從傳統理論確實難以理解。比如,人為什麼會突然靈光一閃,想到一個完全沒存在過的東西?人為什麼會有直覺或者出現頓悟的情況?前文的莫扎特也是一個很好的例子。莫扎特作為一個獨特的人,擁有卓越的音樂成就,他的才華就像是「無中生有」。比如李白的詩,後人想超越也很難。包括前文提到的小孩學母語的神速,等等,這些從機器的角度是難以理解的。我們認為人可以創造出全新的東西,一方面是因為人類在進化的千萬年間經過功能和結構的反覆迭代,具備了產生超越性的基礎條件,另一方面在於主體恰好遇到的景況,正好是大腦、身體在這個偶然的新環境下,形成一個全新的契合,進而產生一種不同以往的全新表達,而且可以是很美妙的表達。比如頓悟或直覺,就是主體與環境的偶然相遇而產生了新的坎陷。可以通過一個形象的例子來理解這種偶然:有一群雞是被人圈養的,經過了幾代繁衍雞已經忘記如何飛,假如突然有一隻狗闖進來,雞試圖跑得更快並用翅膀來輔助,結果它突然發現自己會飛了。那對雞來講,是因為有翅膀這個結構、受到特殊環境刺激才能飛。

人類大腦里有很多這種潛在的可能性,這種可能性在沒有特定的環境時難以察覺,但是遇到新的環境就會產生新的認知坎陷。所以創造新的東西、人類的超越性都是可能的,而不是如強還原論所暗示的,在宇宙大爆炸初期一切就已經被寫進某個方程里了。當原來的坎陷不夠用時,就會發現新的坎陷,比如崔顥到了黃鶴樓後寫下的詩句「昔人已乘黃鶴去,此地空餘黃鶴樓」,這就是坎陷,就是寫得那麼妙,後人也很難找到更好的表達。還有比如說網絡語言,以前講「打醬油」,現在講「吃瓜群眾」,也都是認知坎陷,很難將它隨意取代掉。認知坎陷用豐富的內涵指代一個非常微妙的情況,再想通過別的內容來取代就很難。科學家、詩人、畫家的工作就是開出新的坎陷。有的坎陷生命力很強,比如崔顥寫的黃鶴樓那首詩,大眾始終認為它最為出色;或是凡·高的畫,一開始較少有人欣賞,現在大家都覺得他的畫比其他作品更耐看。這些認知坎陷不一定是因為與物理世界更符合而產生,這就是人類超越性的體現,人類按照各自的理解來跟世界主動交互,而不是環境直接決定了人類的行為。

全能的上帝沒有智能也不需要智能,因為他什麼都知道,也不需要進行選擇。智能恰恰是因為主體的認知與實際情況不一致,差異才是智能產生之所。一塊石頭,能夠跟萬有引力相互作用、電磁相互作用,能夠在受到擾動時產生運動,但它只是有反應而沒有智能。當外界刺激進來,主體偏偏不反應,這才是智能的體現。對抗物理必然性才會導致智能的超越性,導致我們試圖改變這個世界,構建出一個理念世界來。人類的能力越來越強,我們能送人到月球,能修超級大壩,能做出量子計算機,這確實改變了物理世界的運行,這類奇蹟甚至很可能整個宇宙僅有地球上的人類做得到。

七、人工智能的哲學指引

應該發展什麼樣的人工智能,這的確是亟待討論清楚的問題。例如,自動駕駛顯然不是一個有限的、封閉環境中的問題,是否應該繼續發展自動駕駛值得討論。如果認為自動駕駛是封閉的,那麼它可能因為處理不了未知情況而導致事故發生,則應該對自動駕駛進行限制;如果接受這種封閉,就應該接受一定的不可控性與事故率,然後在此基礎上不斷推動智能的邊界以降低事故率。自我肯定需求讓人一定會去拓展邊界,機器也是由人設計的,人一定會去擋住機器的邊界,只有在接受這個的前提下,才能繼續討論我們能做什麼。

現在的機器也好、深度學習也罷,我們自己訓練出來的模型,在什麼時候會做出什麼事情依然是不可控的。即便我們自己認為已經訓練好了自動駕駛模型,它現在能識別車和馬路,但遇到其他沒見過的情況(比如一張外星人的廣告圖片),可能就會產生意想不到的錯誤。因為新的數據從未見過,它還是做出了判斷,還是要發表意見,這種意想不到的錯誤就可能會影響整個世界的運行。

有的研究者希望找到一套規則來統一目前的深度學習,但我們認為這個方法不可取。我們認為學習的本質是抽象後的不斷「折騰」,人思考學習的過程也類似。強化學習的局限性就在於目前是全局的強化——有的人想說能不能做局部的強化,但這也很難,現在的強化學習就是一把抓。如果不能讓機器產生較強的自我意識、開顯出認知坎陷,那麼傳統的框架就難以賦予機器真正的超越性。

不論是否相信人工智能哲學的存在及其必要性,我們對人工智能的討論都一定會涉及哲學。哲學就是要統攝所有的東西,就是要思考很抽象的事情,其中最重要的就是意識的問題,或是意識跟物質之間關係的問題。當然很多流派是把意識的問題擱置起來,我們則是研究智能與意識之間的關係,把能解釋清楚的先釐清,所以我們的創新看起來更偏向哲學,這很大程度是因為最終所有人工智能的問題,包括機器能不能有哲學、情感、倫理,它懂不懂得善與愛,確實都是哲學問題。而在認知坎陷理論里,愛、倫理、宗教這些可以被簡化為認知坎陷,而所有的認知坎陷都來自最早的那麼一點微弱的、能分出內外的一點意識,在那個時刻物理邊界就很重要。初始的物理邊界對人而言就是皮膚,因此觸覺非常重要。到機器的層面,可能需要從視覺切入,引導機器形成比較強烈的「自我」意識。

未來人類訓練機器,會和養育小孩的過程類似,都需要在主體的引導下與外界交互。即便如此也還是有風險。就像我們養育小孩,他可能朝不好的方向發展,但是我們當前還是選擇養育他,這就是人性。而不是像《三體》里的「黑暗森林法則」,認為只要他有可能變壞就先把他幹掉,按照「黑暗森林法則」的邏輯,那就把後代全部消滅以防止後患,但這是不合理的。我們都知道AI會有風險,且不知道未來的路徑和終局,但是我們還是會在終極意義上選擇相信善、相信未來。

注釋:

①蔡恆進:《認知坎陷作為無執的存有》,《求索》2017年第2期。

②蔡恆進、蔡天琪、張文蔚、汪愷:《機器崛起前傳——自我意識與人類智慧的開端》,清華大學出版社2017年版,第174-181頁。

③蔡恆進:《觸覺大腦假說、原意識和認知膜》,《科學技術哲學研究》2017年第6期。

④蔡恆進:《論智能的起源、進化與未來》,《人民論壇·學術前沿》2017年10月下刊。

⑤P.Kay,K.Mcdaniel,The linguistic significance of the meaning of basic color term,Language,1978,54(5).

⑥H.A.Simon,The Sciences of the Artificial,the MIT Press,1996,pp.37-40.

⑦胡久稔:《希爾伯特第十問題》,哈爾濱工業大學出版社2016年版,第1-9頁。

⑧T.Ord,The diagonal method and hypercomputation,The British Journal for the Philosophy of Science,2005,Vol.56,No.1.

⑨徐英瑾:《心智、語言和機器——維特根斯坦哲學和人工智能科學的對話》,人民出版社2013年版,第97-107頁。

⑩Scott Aaronson,Why I am not an integrated information theorist,2014.http://www.scottaaronson.com/blog/?p=1799.

(11)邁克斯·泰格馬克:《生命3.0:人工智能時代生而為人的意義》,浙江教育出版社2018年版,第373-418頁。

(12)蔡恆進:《觸覺大腦假說、原意識和認知膜》;蔡恆進、張璟昀:《原意識:自由意志的始作者》,《鵝湖月刊》2018年第11期。

(13)蔡恆進:《認知坎陷作為無執的存有》,《求索》2017年第2期;蔡恆進:《意識的凝聚與擴散——關於機器理解的中文屋論題的解答》,《上海師範大學學報(哲學社會科學版)》2018年第2期。

(14)蔡恆進:《中國崛起的歷史定位與發展方式轉變的切入點》,《財富湧現與流轉》2012年第1期;蔡恆進、蔡天琪、張文蔚、汪愷:《機器崛起前傳——自我意識與人類智慧的開端》。

(15)蔡恆進:《論智能的起源、進化與未來》。

(16)蔡恆進、蔡天琪、耿嘉偉:《人機智能融合的區塊鏈系統》,華中科技大學出版社,2019年版。

(17)S.Pinker,Learnability and Cognition:The Acquisition of Argument Structure,The MIT Press,2013,pp.5,415-440,First edition published in 1989.