今天介紹一個有趣的心理學實驗。斯金納是一位久負盛名的心理學家,堪稱行為主義之父。它發現,如果持續地給鴿子無條件的獎勵,鴿子會產生迷信行為,即自己假想一些行為,並認為是獲得獎勵的條件。
研究中食物分發器被設定為每隔15秒落下食物,稱為「強化」。也就是說,不管動物做了什麼,每隔15秒它將得到一份獎勵。8隻鴿子每天在實驗箱里待幾分鐘,對其行為不作任何限制。在這期間,每隔15秒強化自動出現。斯金納發現這8隻鴿子中的6隻產生了非常明顯的反應。一隻鴿子形成了在箱子中逆時針轉圈的條件反射,在兩次強化之間轉2-3圈;另一隻反覆將頭撞向箱子上方的一個角落;第三隻顯現出一種上舉反應,似乎把頭放在一根看不見的桿下面並反覆抬起它;有兩隻鴿子的頭和身體呈現出一種搖擺似的動作。鴿子們紛紛認為,自己這樣的行為,就會獲得食物獎勵。
上述的行為都是在建立條件反射前未曾觀測到的。實際上新的行為和鴿子得到食物毫無聯繫。然而,它們表現的就好像行為會產生食物似的;也就是說,它們變得迷信了。它們自己假想了一種會產生獎勵的條件,為得到獎勵的結果找到了某種解釋。
這個實驗顯然與「學習」和歸納推理緊密相關,因此也值得我們思考。有研究發現模式預測和迷信之間有着密切的關係,因為人類和動物都擅長在沒有結構的地方尋找結構。發現結構並將其壓縮為規則,對於預測未來狀態非常有用,這種能力通常被稱為演繹推論。然而,在許多情況下,預期的表現並沒有在未來體現出來,認知系統只會表現想像般的推論,也被稱為「迷信」。那麼什麼情況下,我們的認知系統會形成迷信的局面,而非演繹推論呢?一是我們的認知設備由於短期記憶有限,在解決問題時因片面的分析而產生了偏見。二是解釋實體和事件的方法過多,而推理計算的能力有限,不足以對各種關係進行分析[1]。
這也是我們在人工智能和認知科學領域所會面臨的問題。在一個龐大的解搜索空間中,我們只有依靠豐富的先驗知識和充足的特徵分析,才可以產生合理的因果推論。同時,還可以通過信息處理和信息構建的角度進行決策,以使得認知系統實現真正的模式檢測和預測,而非迷信。
Gerd Gigerenzer[2]認為,如果要確保人類的存活,即從人類本身來考慮,人類的決策必須具有適應性、快速性和節儉性。在人工智能領域,也出現了一種針對行為機械人類似的範式。它不依賴於對給定情況的先驗數學分析,而是依賴於考慮系統內部驅動的策略。它不是根據程序員語義世界定義的複雜表示來推斷的,即不從第三人稱的角度考慮,而考慮系統的第一視角本身,似乎這樣就可以避免鴿子的迷信行為。
為了理解人類,以及具有有限處理計算能力的認知系統是如何可以解決這個問題的,讓我們從動物王國中探索兩個例子:
(1)考慮一隻正在孵化的鵝的行為,它決定用嘴把從巢里掉下來的蛋滾回去。有趣的是,即使一位動物行為學家拿走了雞蛋,它也會繼續滾動[3]。看來,這種動物並沒有經常檢查環境變化。相反,環境狀態只在某些具有重要性的檢查節點才會被檢查,以判斷目前的狀態是否符合某個目標。人類解決問題也同樣受到類似的保守方案支配,人們反覆選擇一種曾經成功的策略,而不考慮其他更簡單的策略是否更適合新的問題。
(2)想像一下一隻蒼蠅在倫勃朗的畫作上爬行。它決不會處理繪畫中呈現的視覺信息,因為從它的角度來看,根本沒有繪畫。只有人類觀察者可能想知道蒼蠅為了忽略豐富的信息輸入而應用了哪些信息過濾器。這樣的差異來自,人類科學家和工程師從他們的第三人稱視角(並且缺乏觀察到系統的第一級視角,如蒼蠅)集中於系統的可感知輸出(例如蒼蠅的爬行,而非蒼蠅本身)。
結合這兩個例子,真正自主的認知系統可以被描述為試圖實現自我決定目標的系統。這也啟發了我們,在我們想通過計算的手段來模擬生物時,要更注意第一視角的反饋,而非第三視角的人為設定。
參考資料:
[1] Riegler, Alexander. "Superstition in the machine." Workshop on Anticipatory Behavior in Adaptive Learning Systems. Springer, Berlin, Heidelberg, 2006.
[2] Gigerenzer, G.: Adaptive thinking. Oxford University Press, Oxford (2000).
[3] Lorenz, K.Z., Tinbergen, K.: Taxis und Instinkthandlung in der Eirollbewegung der Grau- gans. Zeitschrift für Tierpsychologie 2, 1–29 (1939).
文字 | 李曉琦
圖片除標註外,來自網絡