解密|人腦為什麼比AI學得更好|全景讀書會(互動有禮)

2023年03月18日20:54:14 科技 1235

作者:斯坦尼斯拉斯·迪昂

全世界具影響力的認知神經科學家之一,歐洲腦科學研究領域的領頭人,世界腦科學領域大師級的人物。

為什麼要學習

我們為什麼一出生就要學習呢?學習能力的存在本身就為我們提出了這 個問題。對我們的孩子來說,像雅典娜一樣生來就會說話和思考不是更好 嗎?相傳雅典娜是從宙斯的頭顱中躍出的,在躍出之時,她就已經完全長 大、全副武裝。為什麼我們不是編程軟體,預先被裝載了生存所需的知識 呢?連達爾文學派的學者都很疑惑,先天成熟、較其他物種擁有更豐富知識 的物種不應該最終獲勝並延續它的基因嗎?為什麼物種會首先演化出學習這 么一項技能呢?

答案很簡單:人腦先天擁有完整的神經「布線」既不可能也不可取。不 可能?這是真的嗎?是的,因為如果我們的基因組必須包含我們需要的所有 知識,它的容量會爆掉,根本沒有足夠的存儲空間。我們的23條染色體包含30億對鹼基對,其鹼基包括腺嘌呤(a)、胞嘧啶(c)、鳥嘌呤(g)和 胸腺嘧啶(t)。它們可以代表多少信息?若用二元決策0和1來分析,則 基因組的 a、c、g、t可以編碼為00、01、10和11,因此,我們的dna總共包含60億位信息。而在今天的計算機中,我們是以位元組來計算的,一 個位元組存儲8位無符號數,存儲的數值範圍為0~ 255。因此,人類基因組 的容量可以換算為大約750兆位元組,相當於一個老式cd或一個小型usb密鑰的容量!然而,這個基本的換算還沒有包含我們dna中存在的大量冗餘信息。

我們的基因組最初只存在於一個受精卵中,承載著從幾百萬年的進化中 繼承下來的少量信息,這些信息成功地勾畫了整個身體的藍圖:我們的肝 臟、腎臟、肌肉,當然還有我們腦中每個細胞的每個分子(860億個神經元,1000萬億個聯結)……我們的基因組怎麼可能確定它們中的每一個呢?假設我們的每根神經聯結只編碼一位,那麼我們的腦容量大約是100 太位元組,約1015 位。或者說這個容量是我們基因組的容量的十萬倍,而這還只是保守的估計。我們面臨著一個悖論:我們的腦是一座奇妙的宮殿,它包含的細節比「建築師」用來建造它的藍圖多出數十萬倍!唯一的解決方法是:按照建築師的指導方針(即我們的基因組)完成宮殿的結構框架,而細節則留給「項目經理」,他可以結合地形(即環境)調整藍圖。因此,將人腦的所有細節預先「布線」是完全不可能的,需要通過學習來補充基因組的工作。

然而,簡單為腦算一筆賬得出的結論並不能解釋為什麼學習在動物界如此普遍。即使是蚯蚓、果蠅和海參等沒有任何大腦皮層的簡單生物,也具備學習的能力。以線蟲( c. elegans)為例,在過去的20多年裡,這種幾毫米大的動物成了實驗室的明星,原因就在於它的結構幾乎完全受基因的控制,研究人員可以分析到最小的細節。大多數線蟲個體樣本顯示959 個細胞構成,包括302個神經元,它們的聯結路徑已被完全破解,並且是可再生的,線蟲會學習2。研究人員最初認為,線蟲是一種只能來回遊泳的「機器人」,但後來他們發現,它至少有兩種學習方式:習慣性學習和聯想學習。習慣性學習指有機體適應反覆出現的刺激(如動物生活的水中的某個分子)並最終停止對其做出反應的能力。聯想學習指發現並記住環境中的哪些因素可以預測食物的來源或危險的靠近。線蟲是聯想學習的能手。它可以記住與自己的食物(細菌)或厭惡的東西(如大蒜的氣味)相關的氣味或溫度水平,並利用這些信息來選擇它在環境中遊走的最佳路徑。

線蟲的神經元數量很少,因此,它的行為有可能是完全預設好的嗎?顯然,事實並非如此。線蟲適應自己的出生環境對它的生存是非常有利的,甚至是不可或缺的。即使是兩個基因完全相同的生物也很難有機會生活在相同生態的環境里。線蟲能夠根據出生地的水的濃度、化學成分和溫度快速調整它的行為,使它更高效地適應環境。更廣泛地說,每一種動物都必須迅速適應其當前生存環境的不可預測情況。這就是自然選擇( natural selection ),

達爾文的進化演算法。它成功論述了每個有機體為何能夠適應其所在的生態環境,但這個過程發生的速度出奇的慢。如果缺乏適當的適應性,整個生態的物種都註定會死亡,只有等到有利的基因突變出現才能夠增加物種生存的機會。然而,學習能夠加快這個過程,它可以在幾分鐘之內改變物種的行為。這就是學習的精髓:能夠快速地適應不可預測的情況。

這就是物種進化出學習能力的原因。隨著時間的推移,那些即使只擁有 基本學習能力的動物都比那些行為固定的動物擁有更好的生存機會,而且它們更有可能將自己的基因組(這些基因包括學習演算法)傳遞給下一代。因此,自然選擇驅使學習能力出現。進化演算法發現了一個很好的訣竅:讓身體的某些參數迅速改變,以適應環境中最不穩定的方面。

誠然,物質世界有很多因素是嚴格不變的,比如萬有引力是普遍存在的,光和聲音的傳播方式也不會在一夜之間發生改變。這就是為什麼我們不需要學習如何長出耳朵、眼睛,形成前庭系統迷宮般的結構,或記錄我們身 體的成長,所有這些特性都是基因層面已經編碼好的。然而,其他的許多參 數,比如我們雙眼的間距、手腳的重量和長度、聲音的音調都會因人而異,這就要求我們的腦必須適應它們。正如我們在後文中將看到的,腦是妥協的結果—我們從漫長的進化史中繼承了大量天生的神經迴路(我們將世間萬 物細分成廣泛而直觀的類別,並進行編碼:圖像、聲音、動作、物體、動 物、人……)。也許在更大程度上,那些高度複雜的、可以根據我們的經驗改進我們早期技能的學習演算法,也有生而有之的神經迴路。

教育智人

如果讓我用一個詞來概括我們人類的非凡才華,我會用「學習」來概括。我們不是簡單的智人( homo sapiens),而是教育智人( homo docens), 一種能夠進行自我教育的物種。我們對世界的大部分認知並不是由我們的基因遺傳給我們的,而是從環境或周圍的人那裡習得的。除人類以外,沒有任何一個物種能夠如此徹底地改變其生態環境,人類從非洲大草原遷移到沙漠、

山脈、島嶼、極地、洞穴、城市,甚至太空,所有這些都是在幾千年內完成的,學習為這一切推波助瀾。從發現火種到製造石器、發展農業、探索世界,再到發現原子裂變,人類的故事是不斷進行自我重塑的故事。所有這些成就的根源在於:我們的腦有著提出假設並選擇適合環境的假設的這種非凡能力。

學習是我們人類的創舉。在我們的腦中,數十億的神經元參數可以自由地適應我們的環境、語言和文化,以及我們的父母和食物……這些參數是經過精挑細選的:在進化過程中,達爾文的進化演算法仔細地勾勒出哪些神經迴路應該預先「布線」,哪些應該留給環境去決定。對人類這個物種來說,學習的意義重大,因此人類的童年時期比其他哺乳動物的要長得多。由於我們擁有獨特的語言和數學能力,我們的腦才能在廣闊的假設空間中暢遊,即使這些假設可能總是植根於我們從進化中繼承下來的固定不變的基因基礎之上,這些假設重新組合,形成潛在的無限可能的集合。

人類發現,在一種機構的幫助下,我們可以進一步提升這種非凡的能力,它就是學校。教育學是人類所獨有的,其他動物不會留出特定的時間去教導並監督後代學習的進步,幫助其解決遇到的困難,糾正其所犯的錯誤。學校的出現使所有人類社會中的非正規教育系統化,極大地挖掘了我們的腦潛力。我們發現,我們可以利用兒童的腦豐富的可塑性,向他們灌輸大量的信息,發展他們的才智。幾個世紀以來,我們的學校系統在效率上不斷提高,孩子上學的時間越來越早,教育持續時間更是長達15年,甚至更長。越來越多的人腦的發展受益於高等教育。大學是神經「精鍊廠」,我們的腦迴路在這裡獲得最優質的觸發。

教育是我們腦的主要加速器。不難證明,教育支出在政府支出中位居前 列是合理的:沒有教育,我們的腦皮層迴路就會像一顆未經加工的鑽石。我們的腦皮層在閱讀、寫作、計算、數學、音樂、空間、記憶等方面帶來的改善造就了社會的複雜性。你知道嗎,一個受過教育的人的短期記憶,即他能重複的音節數量,是一個從來沒有上過學的成年人的2倍左右。一個人每多接受一年教育,他的智商測試分數就會提升好幾分。

學會如何學習

教育增強了人腦已經相當強大的能力,但它還能表現得更好嗎?在學校 和工作中,我們不斷地改進腦的學習演算法,但我們是憑直覺這麼做的,而沒 有刻意學習。從來沒有人向我們解釋人腦記憶和理解事物的規則,或者遺忘 和犯錯的規則。這真的很可惜,因為這方面的科學知識已經很全面。英國教 育捐贈基金會( education endowment foundation,eef)創建的網站3  上列 出了最成功的教育干預措施,其中元認知教學(了解自己腦的能力和限制) 被給予了非常高的評價。學會如何學習可以說是學業成功的最重要因素。

幸運的是,我們現在知道了很多關於學習是如何運作的知識。30多年來,計算機科學、神經生物學和認知心理學的合作研究在很大程度上闡明了我們腦運作的機制,包括使用的演算法、涉及的迴路、調節其有效性的因素,以及唯有人類能高效使用這些資源的原因。在本書中,我將依次討論所有這些問題。當你合上這本書時,我希望你能更多地了解你自己的學習過程。在我看來,每個孩子和每個成年人都要了解自己的腦的全部潛力,當然,也要意識到它的局限性,這才是最重要的。當代認知科學通過系統地剖析我們的 腦演算法和機制,賦予蘇格拉底的名言「認識你自己」以新的含義。今天,學習的重點不再僅僅是加強內省,而是理解產生思想的微妙的神經元機制,使之能最佳地服務於我們的需求、目標和慾望。

當然,關於我們如何學習的新興科學對所有那些認為學習是一種專業活動的人,如教師和其他教育工作者都具有特別的意義。我深信,一個人如果不能對學習者的腦中正在發生的事情有一個或模糊或明確的心理模型,就不可能實施正確的教學。學生以什麼樣的直覺開始學習呢?他們必須按照哪些步驟學習才能有所進步?哪些因素可以幫助他們發展技能?

雖然認知神經科學並不能給出所有的答案,但我們開始了解到,所有孩子都擁有一個相似的腦結構:他們的腦都是智人的腦。它與其他類人猿的腦截然不同。當然,我不否認每個人的腦是不同的,我們基因組的瑕疵以及早期腦發育的無常性賦予了我們略微不同的學習強度和學習速度。然而,我們所有人的基本腦迴路都是一樣的,我們的學習演算法的架構也是相同的。因此,每一位教師都必須遵守一些基本原則,才能最有效地發揮其教學作用。

在本書中,你會看到很多例子。所有年幼的孩子在語言、算術、邏輯和概率領域都有抽象的直覺,這是高等教育立足的基礎。所有學習者都會從集中注意力、積极參与、錯誤反饋以及反覆進行每日訓練和夜間鞏固中受益。我將這些因素稱為「學習的四大核心支柱」,正如我們將看到的那樣,這些因素是所有人的腦中通用學習演算法的基礎,無論是兒童還是成年人都是如此。

同時,我們的腦確實表現出個體差異,在一些極端的情況下,腦可能會表現出病態,如閱讀困難、計算困難、運動障礙和注意力障礙等。幸運的是,隨著我們越來越了解產生這些缺陷的原因,我們也發現了很多應對策略來檢測和彌補這些缺陷。本書的目的之一就是傳播這些不斷更新的科學知識,讓每一位教師和家長都能採取最佳的教養策略。雖然孩子掌握的知識存在很大差異,但他們使用的是相同的學習演算法。因此,對正常孩子最有效的教學技巧也往往是對有學習障礙的孩子最有效的教學技巧,只不過教師和家長必須以更加專註、耐心、系統的方式加以應用,對他們所犯的錯誤更加寬容。

寬容很關鍵。雖然錯誤反饋很重要,但許多孩子因為他們所犯的錯誤受 到了懲罰,而錯誤本身沒有被糾正,因此喪失了學習的自信和對知識的好奇 心。在世界各地的很多學校,錯誤反饋往往是懲罰和恥辱的同義詞。在本書 的後面部分,我將談到學校對學習成績的過度關注助長了這種不良的風氣。負面情緒粉碎了腦的學習潛力,而為腦提供一個無須感到恐懼的環境會重新 打開神經元可塑性的大門。如果不同時考慮情感和認識對腦產生的影響,教 育就不會進步。在今天的認知神經科學中,這兩者都被認為是學習的關鍵。

機器的挑戰

今天,人類智力面臨著新的挑戰:我們不再是最會學習的物種,學習算 法正在各個知識領域挑戰人類這一物種的獨特地位。這些演算法讓智能手機可 以識別面孔和聲音、轉錄語音、翻譯外語、控制機器,甚至可以下國際象棋 和圍棋,而且比我們做得更好。機器學習已經成為一個價值數十億美元的產業,並持續受益於人腦的啟發。這些人工演算法是如何工作的?他們的工作原 理能幫助我們理解什麼是學習嗎?它們是否已經能夠模擬人腦,或者它們還 有很長的路要走?

雖然目前計算機科學的進步令人著迷,但它們的局限性也是顯而易見 的。目前機器的深度學習演算法只是模擬了人腦的一小部分功能,我認為,這 一部分對應到我們知覺加工的第一階段,即人腦以無意識方式處理信息的前 兩三百毫秒。當然,這種類型的加工絕不是膚淺的:我們的腦可以在幾分之 一秒內識別出一張人臉或一個單詞,並將它放在上下文中去理解,甚至把它 整合成一個短句子……然而,這個過程的缺陷是,它嚴格地遵從了自下而上的傳輸方向,沒有任何反思的機會。只有在更慢、更有意識、更具思考的後 續階段,我們的腦才會設法發揮其所有的演繹、推理和靈活性能力。這些都是今天的機器遠遠無法比擬的。即使是最先進的計算機體系也無法擁有任何人類嬰兒構建抽象世界模型的能力。

即使是在計算機的專長領域,例如對形狀的快速識別,現代演算法的效率仍然遠遠低於人腦。機器學習的最新前沿涉及在計算機上運行數百萬,甚至數十億次訓練嘗試。事實上,機器學習已經成為大數據的代名詞:沒有海量數據集,演算法很難提取並概括新情況中的抽象知識。換句話說,機器並沒有最高效地利用數據。

在這場比賽中,嬰兒的腦輕而易舉地獲勝了:嬰兒不需要超過兩次的重複就能學習一個新單詞。他們的腦可以最大限度地利用極其稀少的數據,這一能力在今天的計算機中仍然難以實現。神經元的學習演算法通常接近最優化的運算:它們設法從最細微的觀察中提取出本質。如果計算機科學家希望在機器上實現同樣的效能,他們的靈感只能來自腦中的許多學習技巧。例如,注意幫助我們選擇並放大相關信息,睡眠幫助我們的腦通過演算法整合前幾天學到的東西。具有這些特性的新機器正在開始湧現,它們的性能也在不斷提升,在不久的將來,它們無疑將與我們的腦競爭。

根據一項新興的理論,人腦之所以仍然優於機器,是因為它扮演著統計學家的角色,通過不斷關注概率和不確定性優化自己的學習能力。在進化的過程中,我們的腦似乎獲得了複雜的演算法,這些演算法不斷追蹤與所學知識相關的不確定性。從精確的數學觀點上講,如此系統地關注概率是最大限度地利用每一條信息的最佳方式。

最近的實驗數據支持了這一假設。即使是嬰兒也能理解概率。從出生起,概率理論似乎就深深地植根於他們的腦迴路中。孩子的行為就像初露尖角的小科學家,他們的腦中充滿了類似於科學理論的假設,通過生活經驗來檢驗這些假設。概率推理允許我們逐漸排除錯誤的假設,只保留對數據有意義的理論。而且,與其他物種不同的是,人類似乎可以利用這種對概率的敏 感從外部世界獲取科學理論。只有智人才能系統地生成抽象思維的符號,並 在面對新的觀察時更新這些思維的可能性。

創新的計算機演算法開始融入一種新的學習願景,即「貝葉斯演算法」。這種演算法以牧師托馬斯· 貝葉斯( thomas bayes)的名字命名,早在18世紀貝葉斯就勾勒出了這一演算法的雛形。我的預感是,貝葉斯演算法將引起機器學習的革命。事實上,它已經能夠以接近人類科學家的效率來提取抽象信息。

當代學習科學之旅由三部分組成。

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發布了控股股東「正在與其他國資央企集團籌劃重組事項」的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日 - 天天要聞

從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日

發布會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了「廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退「外敵」,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,捷豹路虎宣布暫停對美出口一個月,奧迪更是直接