作者:斯坦尼斯拉斯·迪昂
全世界具影响力的认知神经科学家之一,欧洲脑科学研究领域的领头人,世界脑科学领域大师级的人物。
为什么要学习
我们为什么一出生就要学习呢?学习能力的存在本身就为我们提出了这 个问题。对我们的孩子来说,像雅典娜一样生来就会说话和思考不是更好 吗?相传雅典娜是从宙斯的头颅中跃出的,在跃出之时,她就已经完全长 大、全副武装。为什么我们不是编程软件,预先被装载了生存所需的知识 呢?连达尔文学派的学者都很疑惑,先天成熟、较其他物种拥有更丰富知识 的物种不应该最终获胜并延续它的基因吗?为什么物种会首先演化出学习这 么一项技能呢?
答案很简单:人脑先天拥有完整的神经“布线”既不可能也不可取。不 可能?这是真的吗?是的,因为如果我们的基因组必须包含我们需要的所有 知识,它的容量会爆掉,根本没有足够的存储空间。我们的23条染色体包含30亿对碱基对,其碱基包括腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)和 胸腺嘧啶(t)。它们可以代表多少信息?若用二元决策0和1来分析,则 基因组的 a、c、g、t可以编码为00、01、10和11,因此,我们的dna总共包含60亿位信息。而在今天的计算机中,我们是以字节来计算的,一 个字节存储8位无符号数,存储的数值范围为0~ 255。因此,人类基因组 的容量可以换算为大约750兆字节,相当于一个老式cd或一个小型usb密钥的容量!然而,这个基本的换算还没有包含我们dna中存在的大量冗余信息。
我们的基因组最初只存在于一个受精卵中,承载着从几百万年的进化中 继承下来的少量信息,这些信息成功地勾画了整个身体的蓝图:我们的肝 脏、肾脏、肌肉,当然还有我们脑中每个细胞的每个分子(860亿个神经元,1000万亿个联结)……我们的基因组怎么可能确定它们中的每一个呢?假设我们的每根神经联结只编码一位,那么我们的脑容量大约是100 太字节,约1015 位。或者说这个容量是我们基因组的容量的十万倍,而这还只是保守的估计。我们面临着一个悖论:我们的脑是一座奇妙的宫殿,它包含的细节比“建筑师”用来建造它的蓝图多出数十万倍!唯一的解决方法是:按照建筑师的指导方针(即我们的基因组)完成宫殿的结构框架,而细节则留给“项目经理”,他可以结合地形(即环境)调整蓝图。因此,将人脑的所有细节预先“布线”是完全不可能的,需要通过学习来补充基因组的工作。
然而,简单为脑算一笔账得出的结论并不能解释为什么学习在动物界如此普遍。即使是蚯蚓、果蝇和海参等没有任何大脑皮层的简单生物,也具备学习的能力。以线虫( c. elegans)为例,在过去的20多年里,这种几毫米大的动物成了实验室的明星,原因就在于它的结构几乎完全受基因的控制,研究人员可以分析到最小的细节。大多数线虫个体样本显示959 个细胞构成,包括302个神经元,它们的联结路径已被完全破解,并且是可再生的,线虫会学习2。研究人员最初认为,线虫是一种只能来回游泳的“机器人”,但后来他们发现,它至少有两种学习方式:习惯性学习和联想学习。习惯性学习指有机体适应反复出现的刺激(如动物生活的水中的某个分子)并最终停止对其做出反应的能力。联想学习指发现并记住环境中的哪些因素可以预测食物的来源或危险的靠近。线虫是联想学习的能手。它可以记住与自己的食物(细菌)或厌恶的东西(如大蒜的气味)相关的气味或温度水平,并利用这些信息来选择它在环境中游走的最佳路径。
线虫的神经元数量很少,因此,它的行为有可能是完全预设好的吗?显然,事实并非如此。线虫适应自己的出生环境对它的生存是非常有利的,甚至是不可或缺的。即使是两个基因完全相同的生物也很难有机会生活在相同生态的环境里。线虫能够根据出生地的水的浓度、化学成分和温度快速调整它的行为,使它更高效地适应环境。更广泛地说,每一种动物都必须迅速适应其当前生存环境的不可预测情况。这就是自然选择( natural selection ),
达尔文的进化算法。它成功论述了每个有机体为何能够适应其所在的生态环境,但这个过程发生的速度出奇的慢。如果缺乏适当的适应性,整个生态的物种都注定会死亡,只有等到有利的基因突变出现才能够增加物种生存的机会。然而,学习能够加快这个过程,它可以在几分钟之内改变物种的行为。这就是学习的精髓:能够快速地适应不可预测的情况。
这就是物种进化出学习能力的原因。随着时间的推移,那些即使只拥有 基本学习能力的动物都比那些行为固定的动物拥有更好的生存机会,而且它们更有可能将自己的基因组(这些基因包括学习算法)传递给下一代。因此,自然选择驱使学习能力出现。进化算法发现了一个很好的诀窍:让身体的某些参数迅速改变,以适应环境中最不稳定的方面。
诚然,物质世界有很多因素是严格不变的,比如万有引力是普遍存在的,光和声音的传播方式也不会在一夜之间发生改变。这就是为什么我们不需要学习如何长出耳朵、眼睛,形成前庭系统迷宫般的结构,或记录我们身 体的成长,所有这些特性都是基因层面已经编码好的。然而,其他的许多参 数,比如我们双眼的间距、手脚的重量和长度、声音的音调都会因人而异,这就要求我们的脑必须适应它们。正如我们在后文中将看到的,脑是妥协的结果—我们从漫长的进化史中继承了大量天生的神经回路(我们将世间万 物细分成广泛而直观的类别,并进行编码:图像、声音、动作、物体、动 物、人……)。也许在更大程度上,那些高度复杂的、可以根据我们的经验改进我们早期技能的学习算法,也有生而有之的神经回路。
教育智人
如果让我用一个词来概括我们人类的非凡才华,我会用“学习”来概括。我们不是简单的智人( homo sapiens),而是教育智人( homo docens), 一种能够进行自我教育的物种。我们对世界的大部分认知并不是由我们的基因遗传给我们的,而是从环境或周围的人那里习得的。除人类以外,没有任何一个物种能够如此彻底地改变其生态环境,人类从非洲大草原迁移到沙漠、
山脉、岛屿、极地、洞穴、城市,甚至太空,所有这些都是在几千年内完成的,学习为这一切推波助澜。从发现火种到制造石器、发展农业、探索世界,再到发现原子裂变,人类的故事是不断进行自我重塑的故事。所有这些成就的根源在于:我们的脑有着提出假设并选择适合环境的假设的这种非凡能力。
学习是我们人类的创举。在我们的脑中,数十亿的神经元参数可以自由地适应我们的环境、语言和文化,以及我们的父母和食物……这些参数是经过精挑细选的:在进化过程中,达尔文的进化算法仔细地勾勒出哪些神经回路应该预先“布线”,哪些应该留给环境去决定。对人类这个物种来说,学习的意义重大,因此人类的童年时期比其他哺乳动物的要长得多。由于我们拥有独特的语言和数学能力,我们的脑才能在广阔的假设空间中畅游,即使这些假设可能总是植根于我们从进化中继承下来的固定不变的基因基础之上,这些假设重新组合,形成潜在的无限可能的集合。
人类发现,在一种机构的帮助下,我们可以进一步提升这种非凡的能力,它就是学校。教育学是人类所独有的,其他动物不会留出特定的时间去教导并监督后代学习的进步,帮助其解决遇到的困难,纠正其所犯的错误。学校的出现使所有人类社会中的非正规教育系统化,极大地挖掘了我们的脑潜力。我们发现,我们可以利用儿童的脑丰富的可塑性,向他们灌输大量的信息,发展他们的才智。几个世纪以来,我们的学校系统在效率上不断提高,孩子上学的时间越来越早,教育持续时间更是长达15年,甚至更长。越来越多的人脑的发展受益于高等教育。大学是神经“精炼厂”,我们的脑回路在这里获得最优质的触发。
教育是我们脑的主要加速器。不难证明,教育支出在政府支出中位居前 列是合理的:没有教育,我们的脑皮层回路就会像一颗未经加工的钻石。我们的脑皮层在阅读、写作、计算、数学、音乐、空间、记忆等方面带来的改善造就了社会的复杂性。你知道吗,一个受过教育的人的短期记忆,即他能重复的音节数量,是一个从来没有上过学的成年人的2倍左右。一个人每多接受一年教育,他的智商测试分数就会提升好几分。
学会如何学习
教育增强了人脑已经相当强大的能力,但它还能表现得更好吗?在学校 和工作中,我们不断地改进脑的学习算法,但我们是凭直觉这么做的,而没 有刻意学习。从来没有人向我们解释人脑记忆和理解事物的规则,或者遗忘 和犯错的规则。这真的很可惜,因为这方面的科学知识已经很全面。英国教 育捐赠基金会( education endowment foundation,eef)创建的网站3 上列 出了最成功的教育干预措施,其中元认知教学(了解自己脑的能力和限制) 被给予了非常高的评价。学会如何学习可以说是学业成功的最重要因素。
幸运的是,我们现在知道了很多关于学习是如何运作的知识。30多年来,计算机科学、神经生物学和认知心理学的合作研究在很大程度上阐明了我们脑运作的机制,包括使用的算法、涉及的回路、调节其有效性的因素,以及唯有人类能高效使用这些资源的原因。在本书中,我将依次讨论所有这些问题。当你合上这本书时,我希望你能更多地了解你自己的学习过程。在我看来,每个孩子和每个成年人都要了解自己的脑的全部潜力,当然,也要意识到它的局限性,这才是最重要的。当代认知科学通过系统地剖析我们的 脑算法和机制,赋予苏格拉底的名言“认识你自己”以新的含义。今天,学习的重点不再仅仅是加强内省,而是理解产生思想的微妙的神经元机制,使之能最佳地服务于我们的需求、目标和欲望。
当然,关于我们如何学习的新兴科学对所有那些认为学习是一种专业活动的人,如教师和其他教育工作者都具有特别的意义。我深信,一个人如果不能对学习者的脑中正在发生的事情有一个或模糊或明确的心理模型,就不可能实施正确的教学。学生以什么样的直觉开始学习呢?他们必须按照哪些步骤学习才能有所进步?哪些因素可以帮助他们发展技能?
虽然认知神经科学并不能给出所有的答案,但我们开始了解到,所有孩子都拥有一个相似的脑结构:他们的脑都是智人的脑。它与其他类人猿的脑截然不同。当然,我不否认每个人的脑是不同的,我们基因组的瑕疵以及早期脑发育的无常性赋予了我们略微不同的学习强度和学习速度。然而,我们所有人的基本脑回路都是一样的,我们的学习算法的架构也是相同的。因此,每一位教师都必须遵守一些基本原则,才能最有效地发挥其教学作用。
在本书中,你会看到很多例子。所有年幼的孩子在语言、算术、逻辑和概率领域都有抽象的直觉,这是高等教育立足的基础。所有学习者都会从集中注意力、积极参与、错误反馈以及反复进行每日训练和夜间巩固中受益。我将这些因素称为“学习的四大核心支柱”,正如我们将看到的那样,这些因素是所有人的脑中通用学习算法的基础,无论是儿童还是成年人都是如此。
同时,我们的脑确实表现出个体差异,在一些极端的情况下,脑可能会表现出病态,如阅读困难、计算困难、运动障碍和注意力障碍等。幸运的是,随着我们越来越了解产生这些缺陷的原因,我们也发现了很多应对策略来检测和弥补这些缺陷。本书的目的之一就是传播这些不断更新的科学知识,让每一位教师和家长都能采取最佳的教养策略。虽然孩子掌握的知识存在很大差异,但他们使用的是相同的学习算法。因此,对正常孩子最有效的教学技巧也往往是对有学习障碍的孩子最有效的教学技巧,只不过教师和家长必须以更加专注、耐心、系统的方式加以应用,对他们所犯的错误更加宽容。
宽容很关键。虽然错误反馈很重要,但许多孩子因为他们所犯的错误受 到了惩罚,而错误本身没有被纠正,因此丧失了学习的自信和对知识的好奇 心。在世界各地的很多学校,错误反馈往往是惩罚和耻辱的同义词。在本书 的后面部分,我将谈到学校对学习成绩的过度关注助长了这种不良的风气。负面情绪粉碎了脑的学习潜力,而为脑提供一个无须感到恐惧的环境会重新 打开神经元可塑性的大门。如果不同时考虑情感和认识对脑产生的影响,教 育就不会进步。在今天的认知神经科学中,这两者都被认为是学习的关键。
机器的挑战
今天,人类智力面临着新的挑战:我们不再是最会学习的物种,学习算 法正在各个知识领域挑战人类这一物种的独特地位。这些算法让智能手机可 以识别面孔和声音、转录语音、翻译外语、控制机器,甚至可以下国际象棋 和围棋,而且比我们做得更好。机器学习已经成为一个价值数十亿美元的产业,并持续受益于人脑的启发。这些人工算法是如何工作的?他们的工作原 理能帮助我们理解什么是学习吗?它们是否已经能够模拟人脑,或者它们还 有很长的路要走?
虽然目前计算机科学的进步令人着迷,但它们的局限性也是显而易见 的。目前机器的深度学习算法只是模拟了人脑的一小部分功能,我认为,这 一部分对应到我们知觉加工的第一阶段,即人脑以无意识方式处理信息的前 两三百毫秒。当然,这种类型的加工绝不是肤浅的:我们的脑可以在几分之 一秒内识别出一张人脸或一个单词,并将它放在上下文中去理解,甚至把它 整合成一个短句子……然而,这个过程的缺陷是,它严格地遵从了自下而上的传输方向,没有任何反思的机会。只有在更慢、更有意识、更具思考的后 续阶段,我们的脑才会设法发挥其所有的演绎、推理和灵活性能力。这些都是今天的机器远远无法比拟的。即使是最先进的计算机体系也无法拥有任何人类婴儿构建抽象世界模型的能力。
即使是在计算机的专长领域,例如对形状的快速识别,现代算法的效率仍然远远低于人脑。机器学习的最新前沿涉及在计算机上运行数百万,甚至数十亿次训练尝试。事实上,机器学习已经成为大数据的代名词:没有海量数据集,算法很难提取并概括新情况中的抽象知识。换句话说,机器并没有最高效地利用数据。
在这场比赛中,婴儿的脑轻而易举地获胜了:婴儿不需要超过两次的重复就能学习一个新单词。他们的脑可以最大限度地利用极其稀少的数据,这一能力在今天的计算机中仍然难以实现。神经元的学习算法通常接近最优化的运算:它们设法从最细微的观察中提取出本质。如果计算机科学家希望在机器上实现同样的效能,他们的灵感只能来自脑中的许多学习技巧。例如,注意帮助我们选择并放大相关信息,睡眠帮助我们的脑通过算法整合前几天学到的东西。具有这些特性的新机器正在开始涌现,它们的性能也在不断提升,在不久的将来,它们无疑将与我们的脑竞争。
根据一项新兴的理论,人脑之所以仍然优于机器,是因为它扮演着统计学家的角色,通过不断关注概率和不确定性优化自己的学习能力。在进化的过程中,我们的脑似乎获得了复杂的算法,这些算法不断追踪与所学知识相关的不确定性。从精确的数学观点上讲,如此系统地关注概率是最大限度地利用每一条信息的最佳方式。
最近的实验数据支持了这一假设。即使是婴儿也能理解概率。从出生起,概率理论似乎就深深地植根于他们的脑回路中。孩子的行为就像初露尖角的小科学家,他们的脑中充满了类似于科学理论的假设,通过生活经验来检验这些假设。概率推理允许我们逐渐排除错误的假设,只保留对数据有意义的理论。而且,与其他物种不同的是,人类似乎可以利用这种对概率的敏 感从外部世界获取科学理论。只有智人才能系统地生成抽象思维的符号,并 在面对新的观察时更新这些思维的可能性。
创新的计算机算法开始融入一种新的学习愿景,即“贝叶斯算法”。这种算法以牧师托马斯· 贝叶斯( thomas bayes)的名字命名,早在18世纪贝叶斯就勾勒出了这一算法的雏形。我的预感是,贝叶斯算法将引起机器学习的革命。事实上,它已经能够以接近人类科学家的效率来提取抽象信息。
当代学习科学之旅由三部分组成。