霜降 | 鸽子的迷信行为

今天介绍一个有趣的心理学实验。斯金纳是一位久负盛名的心理学家,堪称行为主义之父。它发现,如果持续地给鸽子无条件的奖励,鸽子会产生迷信行为,即自己假想一些行为,并认为是获得奖励的条件。

研究中食物分发器被设定为每隔15秒落下食物,称为“强化”。也就是说,不管动物做了什么,每隔15秒它将得到一份奖励。8只鸽子每天在实验箱里待几分钟,对其行为不作任何限制。在这期间,每隔15秒强化自动出现。斯金纳发现这8只鸽子中的6只产生了非常明显的反应。一只鸽子形成了在箱子中逆时针转圈的条件反射,在两次强化之间转2-3圈;另一只反复将头撞向箱子上方的一个角落;第三只显现出一种上举反应,似乎把头放在一根看不见的杆下面并反复抬起它;有两只鸽子的头和身体呈现出一种摇摆似的动作。鸽子们纷纷认为,自己这样的行为,就会获得食物奖励。

上述的行为都是在建立条件反射前未曾观测到的。实际上新的行为和鸽子得到食物毫无联系。然而,它们表现的就好像行为会产生食物似的;也就是说,它们变得迷信了。它们自己假想了一种会产生奖励的条件,为得到奖励的结果找到了某种解释。

这个实验显然与“学习”和归纳推理紧密相关,因此也值得我们思考。有研究发现模式预测和迷信之间有着密切的关系,因为人类和动物都擅长在没有结构的地方寻找结构。发现结构并将其压缩为规则,对于预测未来状态非常有用,这种能力通常被称为演绎推论。然而,在许多情况下,预期的表现并没有在未来体现出来,认知系统只会表现想象般的推论,也被称为“迷信”。那么什么情况下,我们的认知系统会形成迷信的局面,而非演绎推论呢?一是我们的认知设备由于短期记忆有限,在解决问题时因片面的分析而产生了偏见。二是解释实体和事件的方法过多,而推理计算的能力有限,不足以对各种关系进行分析[1]。

这也是我们在人工智能认知科学领域所会面临的问题。在一个庞大的解搜索空间中,我们只有依靠丰富的先验知识和充足的特征分析,才可以产生合理的因果推论。同时,还可以通过信息处理和信息构建的角度进行决策,以使得认知系统实现真正的模式检测和预测,而非迷信。

Gerd Gigerenzer[2]认为,如果要确保人类的存活,即从人类本身来考虑,人类的决策必须具有适应性、快速性和节俭性。在人工智能领域,也出现了一种针对行为机器人类似的范式。它不依赖于对给定情况的先验数学分析,而是依赖于考虑系统内部驱动的策略。它不是根据程序员语义世界定义的复杂表示来推断的,即不从第三人称的角度考虑,而考虑系统的第一视角本身,似乎这样就可以避免鸽子的迷信行为。

为了理解人类,以及具有有限处理计算能力的认知系统是如何可以解决这个问题的,让我们从动物王国中探索两个例子:

(1)考虑一只正在孵化的鹅的行为,它决定用嘴把从巢里掉下来的蛋滚回去。有趣的是,即使一位动物行为学家拿走了鸡蛋,它也会继续滚动[3]。看来,这种动物并没有经常检查环境变化。相反,环境状态只在某些具有重要性的检查节点才会被检查,以判断目前的状态是否符合某个目标。人类解决问题也同样受到类似的保守方案支配,人们反复选择一种曾经成功的策略,而不考虑其他更简单的策略是否更适合新的问题。

(2)想象一下一只苍蝇在伦勃朗的画作上爬行。它决不会处理绘画中呈现的视觉信息,因为从它的角度来看,根本没有绘画。只有人类观察者可能想知道苍蝇为了忽略丰富的信息输入而应用了哪些信息过滤器。这样的差异来自,人类科学家和工程师从他们的第三人称视角(并且缺乏观察到系统的第一级视角,如苍蝇)集中于系统的可感知输出(例如苍蝇的爬行,而非苍蝇本身)。

结合这两个例子,真正自主的认知系统可以被描述为试图实现自我决定目标的系统。这也启发了我们,在我们想通过计算的手段来模拟生物时,要更注意第一视角的反馈,而非第三视角的人为设定。


参考资料:

[1] Riegler, Alexander. "Superstition in the machine." Workshop on Anticipatory Behavior in Adaptive Learning Systems. Springer, Berlin, Heidelberg, 2006.

[2] Gigerenzer, G.: Adaptive thinking. Oxford University Press, Oxford (2000).

[3] Lorenz, K.Z., Tinbergen, K.: Taxis und Instinkthandlung in der Eirollbewegung der Grau- gans. Zeitschrift für Tierpsychologie 2, 1–29 (1939).


文字 | 李晓琦

图片除标注外,来自网络