当前位置: 100md首页 > 医学版 > 医学资料 > 资料下载2021
编号:1890
脑与阅读:破解人类阅读之迷.pdf
http://www.100md.com 2020年1月17日
第1页
第10页
第20页
第30页
第46页
第222页

    参见附件(6457KB,356页)。

     脑与阅读:破解人类阅读之迷是由斯坦尼斯拉斯·迪昂所著,信息化的时代,每一条信息都或许带来改变行业的变化,如果想要走向成功,就注定得不断的去学习和接受知识和信息。

    脑与阅读:破解人类阅读之迷作者简介

    斯坦尼斯拉斯·迪昂

    全世界极具影响力的认知神经科学家之一,欧洲脑科学研究领域的领头人,世界脑科学领域大师级的人物。

    虽然本科主修数学专业,但对神经科学抱有极大兴趣,继而跟随认知神经科学创始人乔治·米勒、转换生成语法理论创始人乔姆斯基、认知发展理论创始人皮亚杰三位大师的学生杰柯·梅勒学习。

    2014年,与其他两位科学家共同获得有“神经科学界诺贝尔奖”之称的大脑奖(The Brain Prize)。该奖项在脑科学领域,地位极高、分量极重,显示了迪昂在神经科学领域过人的天赋和巨大影响力。

    脑与阅读:破解人类阅读之迷内容介绍

    《脑与阅读》先为读者展现了人脑神奇的阅读能力,像拆解钟表的精密结构一样,揭示了阅读在脑中的认知齿轮,回答了“我们是如何阅读的?”这一问题。然后通过考察儿童是如何习得阅读的,向我们明示什么样的方法是科学有效的,对目前教育实践中错误的阅读学习方法进行了抨击,就“应该如何学习阅读?”给出了答案。同时,作者用科学研究成果论证了阅读的价值,揭示了“阅读是如何塑造我们的大脑的”。书中还讨论了拼写的隐藏逻辑、文字的发现、文化的诞生等话题,试图探究这样一个有趣的问题——“为什么只有人类创造出了如此精细而复杂的文化?”

    脑与阅读:破解人类阅读之迷目录

    1、我们如何阅读

    2、脑中的文字盒子

    3、猴子会阅读吗

    4、文字的发明

    5、如何学习阅读

    6、阅读障碍的大脑基础

    7、阅读与对称性

    8、神经元再利用与文化的诞生

    结语阅读的未来之路

    脑与阅读:破解人类阅读之迷截图

    本书纸版由浙江教育出版社于2018年11月出版

    作者授权湛庐文化(Cheers Publishing)作中国大陆(地区)电子

    版发行(限简体中文)

    版权所有·侵权必究

    书名:脑与阅读

    著者:斯坦尼斯拉斯·迪昂

    电子书定价:80.99元

    Reading in the brain: the new science of how we read.

    Copyright ? 2009 by Stanislas Dehaene.推荐序 开启阅读认知的新篇章

    唐孝威 中国科学院院士、核物理学家、浙江大学教授

    法国著名教育神经科学家斯坦尼斯拉斯·迪昂是国际公认的在

    阅读加工领域的研究中做出了卓越贡献的科学家。他是法国科学

    院院士、比利时皇家科学和艺术学院院士、美国科学院外籍院

    士,于2014年获得有“神经科学界诺贝尔奖”之称的大脑奖。长期

    以来,他一直从事阅读、数学认知加工以及意识等人类最复杂的

    高级认知活动的研究,在《科学》《自然》等世界著名刊物上发

    表了300多篇论文。本书是他在大量富有创造性的实证研究的基

    础上对人脑阅读能力的形成、发展与教育所进行的深入思考与总

    结。本书法文版于2007年获得“法国最佳科学书籍”的称号。

    迪昂在《脑与阅读》这本书中,运用大量的实证研究证据,雄辩地提出并论证了他的阅读是“神经元再利用”的假说。这是一

    种新的神经-文化相互作用的假说,是对历史上英国经验主义者

    提出的“白板说”的批判。他否认了人脑可以无限地适应环境、吸

    收文化的观点,认为人脑的结构会受到遗传的限制,同时神经回

    路又具有一定可塑性。

    人类天生具有习得语言的能力,能够在自然的环境中掌握语

    言,形成与人沟通的能力。而阅读能力的形成则需要经过后天的

    教育。良好的阅读教育能够使人拥有这种跨越时空、获得他人智

    慧的技能。但是在人类漫长的演化历史中,文字只存在了4 000多

    年,拼音文字产生得更晚,仅有3 800多年的历史。从进化的角度

    来看,人类之所以能够在这么短的时间里逐步形成识别符号和单

    词的能力,是再利用了脑中用于其他功能的区域,将其转而运用

    于阅读。其中,最为重要的是人类的视觉区域,该区域会持续地

    受到后天环境的影响,正是视觉区域的这种可塑性使阅读文字成

    为可能。通过有效的阅读教育,人脑将识别形状的功能进行了最

    少量的调整,来适应识别特定文字的活动,因此从这个角度来说,人脑是一种能够局部转变用途的精巧装置。阅读则是再利用

    了人脑视觉区域的局部功能。

    成长于不同文化的人都运用大脑中的同一个区域来识别书面

    文字,也就是本书中所说的视觉词形区。迪昂从史前符号追溯到

    文字的产生,他发现,在文字系统发展的每一个阶段,虽然各种

    文化会不断地交流融合,但是不同的文字系统都拥有一部分共同

    的文字特征。这些共同的文字特征与人脑中神经回路的功能具有

    一致性。由此可见,人类的文字识别能力的形成具有跨文化的普

    遍性。文字的演化则与人脑结构的发展密切相关,两者相辅相

    成。

    另外,“神经元再利用”假说不仅局限于阅读能力的形成,还

    适用于所有新文化能力的形成过程。从这个角度来说,教育将我

    们祖先的大脑中负责狩猎和采集的功能转变为加工新文化的能

    力,因此,教育对于大脑文化能力的形成具有重要的作用。21世

    纪,人类社会迈入了知识经济时代。知识经济时代的阅读能力就

    如同农业社会中的土地与工业社会中的人力一样,具有非常重要

    的作用。可以说,阅读是促进人类社会发展、提高人类智慧、增

    强国家竞争力的重要途径。

    本书由周加仙研究员及其团队翻译。周加仙研究员具有认知

    神经科学、教育学、语言学的学习背景,并致力于脑与语言、脑

    与教育等方面的研究,这为本书的翻译提供了有利的条件。目

    前,我国教育界和神经科学界正在积极推动教育神经科学的学科

    建设,本书的出版将有助于促进我国教育神经科学的发展。测试题

    1. 如果大脑的布洛卡区受损,人可能出现哪种表现:

    A 阅读能力和写字能力受到严重影响

    B 发音困难,说话缓慢、费力

    C 语言流畅,但说的话没有意义

    D 能说话,理解口语,但是不理解书面语

    2. 下列说法正确的是:

    A 拼写的作用仅是为语音提供忠实的文本转换

    B 人类大脑中只存在一条阅读通路

    C 一种语言的拼写透明度越高,同音异义词越多

    D 中文不是完全的表意文字

    3. 关于大脑的识别功能,下列哪种说法是正确的:

    A 在识别面孔时,大脑左半球发挥主要作用

    B 在识别单词时,大脑左半球发挥主要作用

    C 大脑左右半球在识别单词时作用相当

    D 大脑左右半球在识别面孔时作用相当

    4. 关于中文,下列哪种说法是正确的:

    A 与字母的解码过程相比,中文字符识别更加全脑化

    B 中文阅读者识别文字的相关脑活动位置跟英文阅读者相

    差很远C 大脑对中文字符的编码方式与对字母串的类似

    D 中文的书写系统中,字符与语音的对应关系不需要学习

    就能掌握

    小测验,帮你更好地了解大脑是如何阅读的。

    扫描二维码,下载“湛庐阅读”APP,搜索“脑与阅读”,获取答案。index_split_004.html

    退隐到这片沙漠的宁静中,带着几本书籍,不必很多,但却充满智慧。我住在这里,与亡灵对话,用我的双眼来倾听逝者的诉说。

    弗朗西斯科·德克韦多

    此时此刻,你的脑正在完成一件惊人的壮举:阅读。你的眼

    睛跳跃地扫视着这个页面,每秒钟会停四五次,让你刚好可以认

    清一两个字。当然,你根本意识不到这种跳跃的摄入信息的过

    程,只有字词的读音和意义进入你的意识。但是,白纸上的几个

    黑色符号是如何投射到你的视网膜上,并唤起脑中的整个阅读过

    程的呢?这种唤醒的活动正像弗拉基米尔·纳博科夫(Vladimir

    Nabokov)在《洛丽塔》的开头几行所写的那样:

    洛丽塔,我的生命之光,欲念之火。我的罪恶,我的灵

    魂。洛——丽——塔,发音分三步,舌尖向上,从上颚往

    下,轻轻落在牙齿上。洛——丽——塔。

    阅读者的脑拥有一套复杂的机制,这个机制能够恰到好处地

    适应阅读的需要。可是多少个世纪以来,人类的这种天赋一直都

    是难解之谜。现在,大脑这个“黑匣子”已经被打开,真正关于阅

    读的科学正在形成。近20年来,心理学与神经科学方面的研究进

    展已经开始揭示出阅读神经回路的基本原理。现代脑成像技术只

    需要短短的几分钟,就可以显示出我们在加工书面文字时大脑中

    有哪些区域被激活。科学家能够对文字投射到视网膜的每一个加

    工阶段进行追踪,这些阶段可以分别用一个基本问题来表示:这

    些是字母吗?它们看起来像什么?它们组成了一个词吗?这个词

    的发音是什么?怎么读出来?词的意义是什么?

    在这些实证基础上,一种阅读理论正逐渐成形。这种理论假

    定,灵长类动物进化而来的大脑神经回路可以用于识别书面单

    词。根据这种理论,阅读实际上是对神经网络的“再利用”。关于

    读写能力如何改变脑的研究正深刻地改变着我们对教育和学习障

    碍的看法。而新的矫正方案也正在构思当中,以期能适时应对不

    能解码文字的问题,即阅读障碍。我写本书的主要目的是与大家分享阅读科学领域近期取得的

    鲜为人知的研究进展。在21世纪,人们更了解汽车是如何运作

    的,对自身大脑的运作机制却知之甚少,这是一个非常奇怪且令

    人震惊的事实。教育系统的决策者们随着教育改革的浪潮左右摇

    摆,往往公然无视人脑是如何真正阅读和学习的。家长、教育家

    和政界人士经常会注意到,教育方案与最新的神经科学研究发现

    之间存在着巨大的鸿沟,但是通常来说,他们对于神经科学领域

    的发现如何促进教育发展的认识,只不过是从少数几张展示大脑

    运作的彩色图片中得来的。遗憾的是,这种将大脑活动可视化的

    脑成像技术目前还难以捉摸,而且偶尔还会误导他人。新的阅读

    科学的发展历程是如此短暂,而发展又非常迅速,相对而言,科

    学界之外的人对这一领域还不了解。本书的目的就是简要地介绍

    这个令人兴奋的领域,促进人们了解大脑神奇的阅读能力。

    从神经元到教育

    阅读的习得在儿童成长发展中是非常重要的一步。许多儿童

    从一开始就存在阅读上的困难。调查表明,10%的成人甚至不能

    掌握最基本的语篇理解技能。阅读能力背后的大脑运作机制如时

    钟般精巧,我们几乎意识不到它的存在,但是要达到自动化的熟

    练阅读水平,却需要多年的努力。

    为什么阅读如此难以掌握?大脑的神经回路在获得了阅读能

    力以后又会发生怎样的重大变化?是否存在一些能够更好地适应

    儿童大脑的教学策略呢?如果可能的话,什么样的科学能解释,为什么拼读教学法,即系统地教授字母与读音对应关系的教学方

    法,要比整体语言教学法的效果更好?尽管还有更多的问题有待

    解释,但是对于上述这些问题,新的阅读科学已经得到了越来越

    精确的答案。特别是,新的阅读科学揭示了早期的阅读研究错误

    地支持整体语言教学法的原因,以及近期有关大脑阅读网络的研

    究证明了这种错误之所在的机制。对阅读机制的理解还促进了阅读的病理学研究。在我们探索

    阅读者的大脑与思维的同时,本书还将介绍一些关于在中风后突

    然失去了阅读能力的患者的研究。同时本书也会分析阅读障碍的

    成因,人们正逐渐了解这类障碍的脑机制。目前能够肯定的是,阅读障碍者的大脑的确与正常人略有不同,人们已经识别出一些

    阅读障碍的易感基因,但是我们并不会因此气馁而放弃对阅读障

    碍的治疗。人们正在确定新的干预手段和治疗方法,对语言和阅

    读回路进行强化训练能大大促进儿童大脑的发展,且这种改善我

    们已经可以通过脑成像技术追踪到。

    神经元文化

    阅读的能力让我们认识到人脑的卓越非凡。为什么在所有的

    物种中只有人类能够主动地自我教学呢?为什么人类如此独一无

    二,能传播精细复杂的文化?突触和神经元的生物性世界又是怎

    样与人类文化产物的王国相通相连的呢?阅读,还有写作、算

    术、艺术、宗教、农耕和城市生活,无一不显著地提升了灵长类

    脑的天生能力。人类突破了生物性限制的条条框框,为自身打造

    了一个人工的文化环境,并教授自己阅读等新技能。然而我们对

    自身的这种非凡能力仍知之甚少,有待进一步的理论解释。

    神经生物学家的研究工具箱中,有一项基本技术叫“培养神

    经元”(putting neurons in culture,culture在此处为培养物的意

    思),即让神经元在培养皿中生长。在本书中,我把它再命名

    为“神经元的培养文化”(culture of neurons),这是一种全新的视

    角,从文化活动与神经网络的对应关系来看待人类文化活动。神

    经科学一贯致力于解释儿童和成人身上可观察到的行为规律,包

    括高级认知技能是如何在神经系统的基本结构中形成的。阅读

    为“神经元的培养文化”观点提供了最合适的试验台。我们正逐步

    了解汉语、希伯来语和英语等不同的文字系统是怎样印刻到大脑

    神经回路中的。在对阅读的研究中,我们能在先天的神经结构与

    后天的文化能力之间明确地建立起直接的联系。我们也希望将这一神经科学的研究方法拓展到阅读以外的人类文化领域。

    阅读的悖论

    如果重新审视脑与文化的关系,我们有必要探讨这样一个令

    人费解的问题,我称之为“阅读的悖论”(reading paradox):为什

    么人的灵长类脑会进行阅读呢?阅读作为一种文化活动仅仅出现

    了几千年之久,为什么人类的脑具有阅读的本能倾向呢?

    有充分的理由来解释,为什么这个看似简单的问题可以被称

    作悖论。研究发现,识字的脑具有专门的皮质机制来精巧地适应

    识别书面文字的活动。更令人感到意外的是,人类所共同拥有的

    这种机制竟系统性地存在于相同的脑区,就好像是个位于脑中的

    阅读器官一样。

    然而,文字系统在5 400年前才从新月沃土地带诞生,而且拼

    音文字本身也只有3 800年的历史。从人类进化的进程来看,这些

    时间跨度都是微不足道的。因此,在进化过程中,人类并没有充

    足的时间来形成专门的阅读神经回路。我们的脑是基于一种基因

    蓝图而建构起来的,这一蓝图让我们的祖先通过狩猎采集得以生

    存。也就是说,我们的灵长类脑原本是为了适应非洲大草原的生

    活而“设计”的,而如今我们却兴趣盎然地运用它来阅读纳博科夫

    和莎士比亚的作品。进化中并不存在任何因素帮助我们通过视觉

    来理解语言,但脑成像研究表明,成人的脑中确实存在着专门用

    于阅读的固定回路。

    阅读的悖论不禁让人联想到威廉·佩利(William Paley)神父

    旨在证明造物主存在的比喻。他在《自然神学》(Natural

    Theology, 1802)一书中假设了这样一个场景:在一片荒原中发现

    一块构造精密的计时手表。他认为,这不就明证了世界上存在一

    位灵巧的钟表匠人,有意制造出了这块表吗?同样,佩利断言

    道,在生物体中发现的种种精巧设置,比如人眼那令人叹为观止

    的神奇机制,都证明了大自然也是由一位超凡的匠人精心雕琢的杰作。

    达尔文证明了自然选择就能产生高度有序的结构,这有力地

    驳斥了佩利的观点。即使生物有机体看似是出于特定目的而设计

    出来的,但进一步的考察表明,这些有机体的组织结构并不完

    美,不像是出自一位万能的造物主之手。这种种欠缺都证明了进

    化并没有受到造物主的指引,而是顺应了生存竞争中的随机原

    则。举例来说,在视网膜上,血管和神经纤维位于光感受器前

    方,这样就阻断了部分摄入光线,从而导致了盲点的存在,这种

    结构设计就是十分粗糙的。

    斯蒂芬·杰伊·古尔德(Stephen Jay Gould)追随达尔文的足

    迹,搜罗了许多自然选择的缺憾样例,这其中包括熊猫的拇

    指1。英国的进化论者理查德·道金斯(Richard Dawkins)(1)

    也论

    证了为何眼或翅膀的精巧机制只能是自然选择的结果,或者说

    是“瞎子钟表匠”的手工作品2。这些都表明,达尔文提出的进化论

    似乎才是我们所见的自然“设计”的唯一源头。

    然而,在对阅读这一行为进行解释时,佩利的比喻则在另一

    层面上存在问题。从复杂程度和纯粹设计上讲,钟表般精密的大

    脑阅读机制和荒原上的手表相差无几。大脑阅读机制的整个组织

    结构都服务于又快又好地解码书面文字这一简明的目的。但无论

    是万能造物主的假说,还是通过自然选择进化的理论,似乎都没

    能对阅读的形成做出令人信服的解释。如果说用于阅读的神经回

    路是进化产生的,时间上又远远不够。那么我们的灵长类脑又是

    如何习得阅读的呢?在书写出现以前,我们的大脑皮质已经经历

    了上百万年的发展演化,我们的脑为何能应对书面文字识别所带

    来的挑战呢?

    生物统一性与文化多样性

    在社会科学中,鲜有人从生物学角度对阅读、算术或艺术的

    习得进行解读。直到最近,少数社会科学家才认识到脑生物学和进化论与他们的领域实际上是紧密相联的。即使是今天,大部分

    学者仍默默相信一种极不成熟的脑模型,认为脑是具有无限可塑

    性的器官,它的学习能力非常广,可以说人类活动是不受限制

    的。这并不是新出现的观点,我们甚至可以追溯其历史至英国经

    验主义者约翰·洛克(John Locke)、大卫·休谟(David Hume)

    和乔治·贝克莱(George Berkeley)的学说,他们认为人脑是一块

    白板,通过五种感官不断从所处的自然环境与文化环境中学习,由此在这块白板上刻下痕迹。(2)

    虽然这种“白板”的观点否认了人体生物基础的存在,但多数

    人仍毫无异议地接受。这一观点属于“标准社会科学模

    型”(standard social science model)3,这一模型受到了多数人类

    学家、社会学家、部分心理学家,甚至少数神经科学家的广泛认

    同,他们把脑皮质表面看作是“功能等势的、并不存在区域特异

    性的结构”4。他们还认为,是文化的浸润逐渐且灵活地塑造出了

    人性。根据这种理论,因纽特人、亚马孙雨林狩猎采集部落以及

    纽约上东区家庭的孩子应该是千差万别的,色彩感知、音乐欣

    赏、是非观念都随文化情境的改变而不同,因为人脑除了学习能

    力之外,几乎不存在稳定的结构。

    经验主义者们进一步断言,与其他物种不同,人脑能够不受

    生物特性的限制来吸收各种形式的文化。从这种理论观点来看,探讨阅读等文化产物背后的脑机制就好像分析莎士比亚戏剧的原

    子组成一样,是毫无意义的。

    在这本书中,我驳斥了脑可以无限适应文化这种过于简单的

    观点。有关脑阅读回路的最新研究证据表明,脑功能等势说是不

    合理的。可以确信的是,如果人脑不具备学习的能力,那么人也

    就无法掌握英语、日语或阿拉伯语的特定书写规则,但这种学习

    受到严格的限制,并且其背后的机制本身也是由基因严格决定

    的。人与人之间的脑结构类似,而且与其他灵长类动物的脑仅存

    在微小的差异。解码书面文字所激活的脑区四海皆同。无论是学

    习阅读法语还是中文,都是在由基因限定的神经回路中进行的。

    基于以上研究资料,我提出一种全新的神经与文化相互作用的假说,从根本上驳斥文化相对主义,从而有效解释阅读的悖

    论。我把这一假说称作“神经元再利用”(neuronal recycling)假

    说。这一假说认为,人脑结构遵循严格的基因限制,但仍有少数

    神经回路进化出了一定的可变性。例如,部分视觉系统并非与生

    俱来,而是持续地接受后天环境的塑造而形成的。正是在这样一

    个结构尚不完备的脑中,也正是因为视觉具有可塑性,原始文字

    才能够促成阅读能力的形成。

    总之,基因决定的一系列神经回路提供了一些“预表

    征”(pre-representation)5,或者说是一些预先假设,让大脑能够

    预想一些所处环境里未来的发展变化。在脑的发育过程中,学习

    机制选择最适合特定环境的预表征。文化素养形成于脑可塑性的

    基础之上。脑并不像一块白板那样吸收周围环境中的一切信息,而是根据不同的用途进行最少的调整,来适应特定的文化的。同

    样,脑也不是一片空地,可以随意地让各种文化建筑建在上面,脑是一种能够局部转变用途的精巧装置。学习一项新技能时,我

    们是再利用了原始灵长类脑中的某些神经回路。当然,前提是这

    些神经回路能够接受后天环境的塑造。

    本书讲什么

    在下面的章节中,我将解释神经元再利用假说是如何与读写

    能力关联的,以及这种“再利用”背后的脑机制和发展历史。开篇

    的三章中会对成年阶段的熟练阅读者的阅读机制进行分析。第1

    章为全书打下基础,从心理学视角探讨阅读:我们读得有多快?

    阅读行为的主要决定因素有哪些?第2章会着重讲解阅读时激活

    的脑区,以及如何运用现代的脑成像技术来对此进行直观显示。

    第3章我将深入到单个神经元的水平,探讨这些神经元是如何形

    成网络来识别字母和文字的。

    我以高度严谨有序的方式来进行资料分析。我有意揭示阅读

    者脑中的认知齿轮,就如同拆解佩利牧师所说的荒野中的钟表。然而,阅读者的脑中并没有呈现出钟表神匠所设计的那种精密结

    构。人们的阅读神经回路存在着不少缺陷,暴露出脑在阅读所必

    需的素质与现有生物机制之间达成的妥协。灵长类视觉系统的特

    征解释了阅读为何难以像扫描仪一样迅速高效。当我们的视线扫

    过页面时,一个个字符缓慢地进入视网膜的中央,被分解成无数

    信息碎片,之后又被脑整合在一起。通过多年的练习,这些过程

    变得高度自动化、无意识化,由此我们错误地认为阅读既简单又

    轻松。

    阅读的悖论也向我们呈现了一个不争的事实:人类的基因并

    没有出于适应阅读的目的而进化。我对于这一谜题的解释相当简

    单。如果脑没有为适应阅读而进化,那么实际情况就应该反过

    来:文字系统必须适应种种生理限制而演变。第4章从这个角度

    回顾了文字系统发展的历史,从最初的史前符号到字母的发明。

    在发展的每个阶段,都有证据显示文化在持续改变。几千年来,书写者们想方设法设计适合灵长类脑使用的字词、符号及字母。

    直到今天,世界上的文字系统仍然共有一部分设计特征,这些特

    征最终可以追溯至神经回路所具有的先天限制中。

    第5章延续了上述观点,即人脑并没有专为阅读而进化出特

    定结构,而是再利用了一部分回路来负责这种新的文化活动,我

    在这一观点基础上考察了儿童是如何习得阅读的。心理学研究的

    结论是,没有多少方法能使灵长类脑转变为熟练阅读者的脑,这

    一章从细节上探讨了可能存在的唯一一条发展轨迹。也许可以建

    议学校采纳这些研究结论来优化阅读教学,从而减少文盲和阅读

    障碍的问题。

    我会进一步展示神经科学技术如何揭示阅读习得的神秘特

    征。举例来说,为什么许多孩子最初学写字时总是从右往左书

    写?与现行观点相反,这种镜像翻转的错误并不是阅读障碍的先

    兆,而是视觉脑组织结构的正常表现。绝大多数孩子的阅读障碍

    与明显的语音加工困难有关。第6章会涉及阅读障碍的症状及其

    内在脑机制,以及关于其遗传基础的最新研究成果。而在第7章

    中,我将对镜像错误所揭示的正常视觉识别机制进行深入阐释。最后,在第8章中,我会回到开头提到的那个惊人的事实,即我们人类是唯一能够进行阅读等精细复杂的文化行为的物种,这是一项非凡的创举,也是任何其他灵长类动物都无法与我们相

    比的。标准社会科学模型认为文化是在白板似的脑中自由驰骋,而与此相反,阅读诠释了文化与脑的结构是怎样紧密关联的。在

    漫长的文化历史长河中,人类逐渐发现自己可以再利用视觉系统

    来进行语言输入,从而进行阅读和写作。我也将采用类似的分析

    思路简要地探讨人类的其他一些主要文化特质。我们也许可以将

    算术、艺术、音乐及宗教都看作是进化而来的机制,在多个世纪

    文化演变的塑造下,影响与调整了我们的灵长类脑。

    我们仍然留有最后一个谜题有待解开:假如学习能力为所有

    灵长类物种所共有,为何只有人类能从中脱颖而出,创造了如此

    精细而复杂的文化?尽管“文化”这一术语有时也用于黑猩猩,但

    它们的“文化”仅限于砸坚果、洗土豆或以木棍钓食蚂蚁这一类的

    小技巧,而人类能几近无止境地创造出环环相扣的习俗规则和符

    号系统,这其中包括语言、宗教、各种艺术形式、运动、算术和

    医药学等,黑猩猩的小技巧根本无法与此相提并论。非人类灵长

    类动物能够缓慢习得字母和数字等一些新异符号,但它们从未思

    考过如何去创造发明这些符号。

    对于人脑的独特性,我提出了一些初步的推测。人类物种的

    独一无二可能是以下两个因素共同造成的:心理理论(推测他人

    心理的能力)及全脑神经工作空间(脑中的一个的缓冲区,用于

    对各种想法进行重组)。我们基因中所包含的这两种机制共同促

    使我们成为唯一的文化性物种。人类文化看似具有无限可变性只

    是一种假象,其产生是因为我们困于这样一种认知的恶性循环:

    我们怎么能想象出脑构想范围之外的表现形式呢?虽然阅读是人

    类的一项新近的“发明”,但它已在大脑潜能的黑箱里沉睡了千

    年。在人类纷繁的文字系统背后,存在着一整套普遍的核心神经

    机制,就如水位警戒线一样,标志着人类先天生物基础的限制。目 录

    推荐序 开启阅读认知的新篇章

    导论 关于阅读的科学

    从神经元到教育

    神经元文化

    阅读的悖论

    生物统一性与文化多样性

    本书讲什么

    1 我们如何阅读

    眼睛不是扫描仪

    寻找恒常性

    将差异放大

    每一个单词就是一棵树

    字符转化为声音

    声音的局限性

    拼写系统中的隐藏逻辑

    拼写透明的梦想

    阅读的两条通路

    心理词典

    “魔鬼的集会”

    并行阅读

    主动的字母解码

    阅读中的协作与竞争

    从行为到脑机制

    2 脑中的文字盒子

    奇特的语言视盲

    纯失读症语言视盲的脑损伤

    发现“文字盒子区”

    脑成像技术揭开脑阅读的秘密

    脑阅读区的普适性

    加工文字的特定视觉区

    我们的阅读速度有多快

    记录颅内信号

    位置恒常性

    阈下阅读

    被文化塑造的脑

    中文阅读

    日语及日语的两种文字

    视觉识别之后发生了什么

    语音和语义

    从拼写到语音

    词义通达

    激活如涌潮

    文化多样性的限制

    阅读与进化

    3 猴子会阅读吗

    猴子与人类的共同脑区

    负责识别物体的神经元

    祖母细胞

    猴子的字母表

    原型字母

    形状的习得

    学习的本能

    神经元再利用文化的诞生

    阅读神经元

    双字母神经元假说

    神经元单词树

    负责阅读的神经元有多少

    模拟阅读者的大脑皮质

    阅读为何偏好左脑

    4 文字的发明

    文字系统的普遍特征

    视觉系统的加工层级

    人工符号和自然形状

    文字的史前雏形

    从计数到书写

    象形文字的局限性

    拼音文字:巨大的飞跃

    定义元音

    5 如何学习阅读

    从婴儿到儿童

    第一个阶段:图示阅读

    第二个阶段:音素觉知

    字素和音素孰先孰后

    第三个阶段:正字法

    阅读如何改变脑

    文盲的脑

    阅读让我们失去了什么

    将字母和颜色联系起来

    神经科学对教育的启示

    阅读教学之争打破整词阅读的神话

    实践检验整体语言教学法

    给教育工作者的几点建议

    6 阅读障碍的大脑基础

    什么是阅读障碍

    语音加工缺陷

    跨文化的阅读障碍

    首要怀疑区域:左侧颞叶

    神经元迁移

    患有阅读障碍的老鼠

    寻找阅读障碍基因

    利用神经科学克服阅读障碍

    7 阅读与对称性

    混淆左右的动物

    进化与对称性

    对称性知觉及脑的对称性

    对称视觉的大脑模型

    大脑对称的利与弊

    单细胞的对称性

    胼胝体与对称连接

    两个独立的视觉系统

    打破阅读镜像

    对称性是被破坏了还是隐藏了

    对称性、阅读和神经元的再利用

    镜像阅读障碍

    8 神经元再利用与文化的诞生

    破解阅读的悖论

    文化形式的普遍性神经元再利用与大脑模块

    文化恒常性初探

    为什么只有人类具有文化

    脑的可塑性并非决定因素

    传播文化的特殊天赋

    全脑神经工作空间

    结语 阅读的未来之路

    注释与参考文献

    致谢

    译者后记我们从眼睛开始对书面文字进行加工。只有视网膜中央的一

    块称为中央凹的区域才具有足够的分辨率,让我们能看清小

    小的铅字。因此,我们的眼光必须在书页上不断扫视。目光

    停下来时,我们只能认出一两个单词。而每一个单词又会被视网膜神经元分割成无数碎片,只有当这些碎片重新整合为

    一体时才能真正辨认出单词。视觉系统会逐步地提取字素、音节、前缀、后缀和词根。最终,两条平行的加工通路开始

    运转:语音通路将字母转化为语音;而词汇通路则从心理词

    典中提取词义。

    文字的存在是一种沉默的存在,他们沉默着,直到有人将它们读出。

    只有当智慧的眼睛与石板上的刻痕相遇的刹那,文字才真正拥有了生命。

    一切文字都仰仗读者慷慨的朗读。

    阿尔维托·曼古埃尔,《阅读史》

    初看起来,阅读简直就是魔术:我们的目光停留在一个词

    上,而脑毫不费力地提取出词的意义与发音。但请不要被这种表

    面现象迷惑,这个过程绝不简单。一个词进入视网膜时会被分割

    成千百万个视觉碎片,而每一个碎片都被不同的光感受器所识

    别。由于信息以这样的方式输入,我们面临的真正挑战就在于如

    何将碎片组合起来,使我们可以知道呈现的是哪些字母,还要认

    出这些字母出现的顺序,从而最终识别出这个单词。

    在过去的40年中,认知心理学在分析阅读机制方面进行了研

    究。研究的目标是解开单词视觉识别的“算法”之谜,即熟练的阅

    读者采用了怎样的一系列加工过程来识别书面文字。心理学家们

    像解释计算机科学问题一样来研究阅读。每一个阅读者就像一个

    带有两个摄像头的机器人,双眼和视网膜就相当于摄像头。而我

    们所看到的文字就像呈现在摄像头中的图画。起初,这些文字只

    是一堆光影的组合,不能直接被理解为语言符号。我们必须以一

    种可以理解的方式对这些视觉信息进行重新编码,才能提取出文

    字正确的发音、单词和意义。于是,我们必须利用一种解码的算

    法,或者说一种类似自动文字识别软件的处理机制,这种机制将

    一页纸上的一堆像素作为输入信息,而其输出信息则是识别出来

    的单词。为了完成这一“壮举”,我们的脑进行着一套看不到的精

    密解码操作,而对这些操作的原理我们只能算是初窥其秘。眼睛不是扫描仪

    阅读的过程始于书页反射的光子撞击视网膜的那一刻,而视

    网膜却不是一个匀质的感受器。只有名为中央凹的中心地带,才

    是视网膜中唯一拥有密集的、对光线高度敏感的、高分辨率的视

    觉细胞的区域,视网膜的其他区域只具有较低的分辨率。而这视

    野中占到大约15度视角的中央凹也是视网膜中唯一真正可以用来

    阅读的区域。如果因为某种原因,中央凹得不到视觉输入,例如

    因为视网膜损伤,或由于中风破坏了视觉皮质的中心区,或是实

    验人员选择性地阻挡了中央凹的视觉输入,不管是哪种原因,阅

    读都不可能完成了1。

    正因为需要把文字放入中央凹来阅读,眼球在阅读的时候需

    要不断地移动。我们必须通过注视点的移动,用视觉中最敏感的

    区域来“扫描”文本,因为只有这一区域的分辨率高到足够识别文

    字。然而,人的目光并不是匀速不停地在书页上移动的2。恰恰

    相反,目光总是一小步一小步地移动,我们称之为眼跳

    (saccade)。其实此刻在阅读本书的时候,你的眼睛也正在做着

    每秒钟4~5次的跳动,不断地将新的信息带入你的中央凹。

    即使是在中央凹中,视觉信息在不同位置的精细程度也会有

    所不同。在视网膜及之后位于丘脑和大脑皮质的视觉处理区域

    中,视觉场景中每一部分所分配到的细胞数也随着其与注视中心

    的距离变大而越来越少,这使得视觉精确度逐步下降。视觉精确

    度在视野中心最佳,向视野的外围平稳地下降。我们有一种错

    觉,认为自己是以一种固定的精确度看到整幅场景的,就好像是

    数码相机以均匀的像素阵列拍下照片一样。然而与相机不同,人

    的眼睛只对正落于注视中心的那一点有最精细的感知,而这一点

    的周围则越来越模糊(见图1-1)3。图1-1 视网膜严密地过滤着我们读到的信息

    图中的视觉刺激来自塞缪尔·约翰逊(Samuel Johnson)的《冒险家》(The

    Adventurer, 1754)中的一页,被用一种算法进行了过滤。这种算法还原了人类视敏

    度从视网膜中心向外下降的情形。无论字号多大,我们只能识别出注视点附近的字

    母。所以我们阅读时眼光必须不停地在书页上跳动游走。当目光停下来时,我们只

    能识别出一两个单词。

    也许你会认为,在这样的条件下,决定着阅读难易程度的因

    素是印刷字体的大小,小字会比大字更难辨识。然而奇怪的是,事实并非如此。因为字越大,字所占据的视网膜空间就越大。而

    当我们用大字号印出一个单词时,单词就会被扩展到视网膜的边

    缘,而在这个边缘区域,不论字有多大,辨认起来都是力不从心

    的。让辨认变得容易与不容易的两个因素几乎完全相互抵消,所

    以一个巨大的单词和一个微小的单词从视网膜感觉精度的角度来

    说,本质上并没有什么区别。当然了,前提条件是这个单词不能

    太小,至少大于人眼中央凹所能精细分辨的极限。而对视力减退

    的人,例如老年人,把字印大一点还是很有道理的。

    正因为眼睛是如此工作的,我们的知觉能力只与单词中有多

    少个字母有关,而与这个单词占据了视网膜上多大的空间无

    关4。实际上,以纯粹的距离来算,我们的眼跳幅度总是不断变

    化的,而如果以字母数量来计量,每次眼跳又都是等距的。当脑

    做好移动目光的准备时,它会依照字母大小来调整距离,以使注

    视中心每次都前进大约7~9个字母的距离。这个距离出人意料地

    小,我们注视一次所能处理的信息量大约也就如此。为了证明我们一次只能看清书本上很小的一块区域,乔治·麦

    康基(George W. McConkie)和基思·雷纳(Keith Rayner)研究

    出一套实验方法,我喜欢称之为“笛卡尔魔鬼”(Cartesian

    devil)。在他的《第一哲学沉思集》(Metaphysical

    Meditations)中,笛卡尔想象出一个玩弄我们感官的邪恶魔鬼:

    因此我要假定控制我的感官的,并非至善的神,那真理

    之源泉,而是一个邪恶的魔鬼,他强大、阴险,用尽一切手

    段来欺骗我;我要假定天、地、色、形、音及一切外物无非

    梦幻光影,皆为此恶魔欺骗我之陷阱。我将认为自己无手、无眼、无肉、无血,无一切观感,然而错信我拥有此等一

    切。

    正如电影《黑客帝国》中的超级电脑一样,笛卡尔所描绘的

    邪恶魔鬼用精细的人造信号冲击我们的脑,为我们制造出一个伪

    现实、一个真实的幻境、一个虚拟布景,而其后的真实景象则永

    远被隐藏。麦康基和雷纳的方法则相对温和得多,他们设计了一

    种电脑屏幕上的“移动窗口”,可以让人产生看到完整文本的错觉 5。他们的方法是给一名被试(参加实验的人)戴上特制的眼动

    捕捉装置,并实时地改变屏幕上的显示内容。这个装置可以经过

    编程设置,让电脑屏幕上只显示注视中心左右的几个字母,而整

    页文字的其他字母都用一串串的“x”来代替:

    眼睛一动,电脑就会偷偷地改变屏幕显示。其目标是只显示

    被试此刻注视点周围的字母,而把其他地方的字母都变成一串串

    x:

    利用这一装置,麦康基和雷纳向世人展示了一个充满争议的

    惊人发现。结果显示,被试根本没有发现这种实验操纵。只要注

    视点中心的两边呈现的字母足够多,阅读者就不会看穿这个把

    戏,他们以为自己看到的是一页正常完整的文本。

    这种让人称奇的“视而不见”现象之所以出现,是因为文本变

    化时眼睛恰好处在最高速的运动状态。这种换词的手法之所以难

    以觉察,就是因为换词的瞬间视网膜上的图像会因眼球的运动而

    模糊。而目光一停,一切看起来又都正常了:在中央凹,我们看

    到了想看的字母,至于视野的其他区域,也就是外围区的字母,反正本来也是读不了的。如此一来,麦康基和雷纳向我们证明

    了,人类只能对视觉输入信息中的一个小子集进行有意识的处

    理。如果电脑程序在我们注视点的左侧留下4个字母,右侧留下

    15个字母,阅读速度将不会受到影响6。简单来说,我们每次只

    能从书页上提取少得可怜的信息。笛卡尔的邪恶魔鬼只需要让我

    们看到20个字母,就能让我们误以为自己是在读美国宪法了!

    事实上20个字母都算是多说了。我们每一次眼跳只能辨别出

    10~12个字母:注视点左侧的3~4个,右侧的7~8个。在这个范

    围以外,我们基本上识别不出单词,只能感知到有无空格。空格

    可以为我们提供关于单词长度的线索,从而帮助我们做好眼跳的

    准备,并确保我们的目光落到下一个单词的中心。至于我们从下

    一个单词中到底能提取出多少信息,研究者中还存在着争议,也许我们只看到了单词的前几个字母。然而,学者们在某一点上达

    成了共识,那就是眼动的方向使视觉范围产生了不对称性。在西

    方国家,视觉范围更加偏向右侧,而对于阿拉伯语或希伯来语的

    阅读者来说,由于阅读时是从右向左扫视,他们的视觉范围则是

    向左边偏的7。在其他文字系统中,例如字符密度较大的中文,眼跳的距离更短,视觉范围也会相应地缩小。每一个阅读者都会

    根据不同的语言以及文本,调整他对文本区域进行视觉探索时采

    用的策略。

    利用同样的方法,我们还可以估计出识别每个词并对其进行

    编码所需要的时间。我们可以利用电脑程序,让屏幕上的所有字

    母在一定时间后都变成“x”,包括中央凹的字母。通过这样的实

    验,我们发现,呈现时间为50毫秒时,阅读速度还可以基本保持

    正常。但这并不意味着阅读用到的所有加工过程都可以在这50毫

    秒内完成。在本书后面我们就会看到,在单词呈现之后,有一系

    列的加工过程总共需要持续大约半秒。不过最初获取视觉信息可

    以在很短的时间内完成。

    总而言之,眼睛给阅读行为施加了很多限制。视觉感受器的

    结构决定了阅读时我们必须每0.2秒或每0.3秒就让目光跳跃,这

    样才能够对整个书页进行扫描。而阅读也只不过是把一系列对单

    个词的“抓拍”,通过内部加工过程重新组合起来。有时一些小的

    语法词,像“the”“it”“is”可以跳过,但几乎所有名词和动词这样的

    内容词,我们都必须至少注视一次。

    这些限制是视觉系统中固有的一部分,无法通过训练加以改

    善。我们当然可以通过训练来优化眼动的模式,然而大多数每分

    钟能读四五百词的优秀阅读者,其眼动方式已经没有什么提升空

    间了。考虑到视网膜的构造,我们很可能没法再去提升速度了。

    有一个简单的演示可以证明眼动是限制阅读速度的罪魁祸首8。

    如果我们一个词一个词地呈现一句话,让每一个词都精确地落在

    注视点上,就意味着不需要眼动,此时一个熟练的阅读者可以达

    到惊人的阅读速度——平均每分钟1 100个单词,而最优秀的阅读

    者甚至可以达到每分钟1 600个单词,差不多每一个单词只需40毫秒,这是正常阅读速度的3~4倍!这种方法叫作快速序列视觉呈

    现法(Rapid Sequential Visual Presentation,简称RSVP)。使用

    这种方法时,识别与理解单词的速度仍然让人满意,也就是说,单词识别与理解这些阅读的核心加工所需的时间并没有明显限制

    阅读速度。或许在屏幕逐渐取代纸张的将来,这种视觉呈现方式

    将成为阅读的新趋势。

    无论如何,只要文字还是一行行地写在纸上,通过注视来获

    取信息的方式就一定会减慢阅读的速度,形成一道不可跨越的壁

    垒。正因为如此,在看到那些声称可以让你的阅读速度达到每分

    钟1 000词的快速阅读法的广告时,就一定要持怀疑的态度了9。

    当然,我们肯定可以通过某种方式,在一定程度上扩展视觉范围

    广度,以减少阅读每一行时所需的眼跳次数,或者学会在阅读时

    不回跳,就是说不回头去看已经读过的词。然而,眼睛的生理极

    限不可能突破,除非你愿意跳过一些单词,并承担因此而误解文

    意的风险。伍迪·艾伦(Woody Allen)对这种情况的描述相当精

    彩:“我参加了一个快速阅读训练班,学会了如何在20分钟内读

    完《战争与和平》。不过读完我就只记得这本书跟俄罗斯有

    关。”

    寻找恒常性

    你认字吗,鲁宾

    认识,我认识印刷的字,但是我从来认不出手写字。

    莫里哀,《乔治·唐丹》

    阅读给我们出了一道知觉难题。无论单词以何种面貌出现,我们都必须能够识别它们,不论它们是印刷的还是手写的,大写

    的还是小写的,用的是大号字还是小号字。这就是心理学家们所

    说的恒常性难题:我们必须从字母成千上万种可能的变形中找出

    单词唯一不变的属性——字母顺序。之所以说知觉恒常性是一个难题,是因为单词并不总是呈现

    在同一位置,用同一种字体或同样的大小书写。如果这些属性都

    固定,我们只需简单地看一下视网膜上哪些细胞处于激活状态,哪些处于非激活状态,就可以对所见单词进行解码了,就像一幅

    黑白的图片可以用一序列像素来定义一样。然而现实是,依写法

    的不同,同一个词可能有成百上千种不同的视网膜图像(见图1-

    2)。因此在阅读的最初几个加工步骤中,就要对这些繁杂多变

    的表面形态进行修正。

    图1-2 视觉恒常性是人类阅读系统最重要的特性之一

    我们的单词识别机制满足了两个看起来相互矛盾的需求:哪怕字符的形状有再大的

    区别,这种无关的差异都会被忽略;而重要的差异哪怕再小,也会被放大。虽然我

    们还不知道其中的机制,但是,视觉系统会自动地对字号与字体上的巨大差异进行

    修正。然而视觉系统有时也会对微小的形状差异倍加注意。将“s”变成“e”,“sight”就

    变成了“eight”,一个符号的差异让单词的加工链发生巨大的变化,输出完全不同的

    发音与意义。

    有几种线索告诉我们,脑有一个应对知觉恒常性难题的高效

    的解决办法。当我们把报纸拿在眼前合适距离处时,既可以读标

    题也可以读分类广告。单词的大小可以变化50倍之多,而阅读速

    度却不受影响。就像我们可以识别出眼前60厘米处和将近30米远

    处的同一张脸或同一个物体一样,视觉系统对大小的变化有很强

    的耐受性。

    另一种形式的恒常性让我们可以不受单词在纸页上的位置的

    影响。当我们的目光扫过纸张时,视网膜中心通常落于单词中心

    略偏左一点。然而,这一动作还远不够精准,有时目光也会移动

    到一个单词的第一个或最后一个字母,但这并不影响我们对单词

    的识别。如果字母的大小相应地增大,能补偿视网膜分辨率的下

    降,我们甚至可以用外周视野来阅读。大小恒常性和位置恒常性的识别就是这样相互配合的。

    单词识别与字符形态基本无关。在文字处理软件无所不在的

    今天,普通大众也能学习一些原先只有少数专业排字工作者才掌

    握的技术。现在人人都知道字符有一套套不同的“字体”(font,该词源于铅印时代,那时印刷之前人们必须在铸造车间中用铅来

    铸字,font便来自于found,意为铸造)。每一种字体都拥有两类

    字符,即大写字符和小写字符(英文称大小写为“case”,大写

    为“uppercase”,小写为“lowercase”。原本case是指一种扁平的盒

    子,里面分成很多区域来码放铅字;而上面的盒子——“upper

    case”专门用来放大写字母,其他字符放在下面的盒子——“lower

    case”中)。最后,人们还可以选择字体的“重量”,即粗体还是正

    常字体;以及字体的倾斜,即斜体(斜体称为italics,因其最早

    是在意大利发明的);还有是否有下划线,或者将这些选项组合

    起来。然而,这些精准计量的字体变化跟手写体的无穷变化比起

    来,只能算是小巫见大巫了。手写体显然让文字的变化性与辨识

    难度又都上了一个台阶。

    在面对这些变化时,视觉系统到底是如何学会对字母的不同

    形态进行分类的?在某种程度上,这仍然是一个谜。这个难题中

    的一部分,可以用比较简单的方法来解决。例如元音字母“o”就

    可以很容易识别,多亏了它独特的闭合形状,字号、大小写和字

    体都难不倒我们。因此,建立一个针对“o”的视觉探测机制并不

    太困难。然而,其他字母就很困难了。比方说字母r,虽然看起来

    r、R、r和r显然代表了同一个字母,但仔细审视这个问题,我们

    就会发现这种思维联系是多么随意,例如,如果我们硬要用e这

    个形状作R的小写形式也不是不可以的。所以这种奇异的文化现

    象只能用历史的偶然性来解释了。

    于是,我们学习阅读的时候,不但要将字母对应到语言的发

    音上,还要了解同一个字母可能会写成完全不相关的不同形状。

    我们将会看到,我们之所以有能力完成这样的事情,很可能是因

    为我们拥有一些探测抽象字母的神经元,也就是说有一些神经元

    可以识别不同形态的字母。实验证明,只要经过少量的训练,我

    们就可以用正常的速度来阅读大小写字母相间的一句话:“ToDeCoDe, At An EsSeNtIaLly NoRmAl SpEeD, EnTiRe SeNtEnCes

    WhOsE LeTtErS HaVe BeEn PrInTeD AlTeRnAtElY iN uPpErCaSe

    aNd In LoWeRcAsE.”10在麦康基和雷纳的“邪恶魔鬼”般的电脑

    上,这种字母大小写的变化也可以在每一次眼跳时进行切换,而

    阅读者竟然完全不知情!11在我们的日常阅读经验中,从来不会

    看到一个单词用大小写字母相间的方法来写,然而我们对字母进

    行规则化加工的过程十分高效,可以轻松应对这种写法转换。

    顺带说一下,这些实验证明,单词的整体形状在阅读中并不

    起作用。我们之所以可以立刻识别

    出“words”、“WORDS”和“WoRdS”,是因为视觉系统并不关注单

    词的外轮廓,也不关注字母的高矮变化,而只关注单词中含有哪

    些字母。很明显,识别单词的能力并不依赖于对单词整体形状的

    分析。

    将差异放大

    虽然视觉系统可以有效地将与阅读无关的视觉差异过滤掉,例如“R”与“r”之间的差异,但是如果认为系统只是一味地抛弃信

    息、简化形状的话,也是不对的。相反,很多时候,对于那些可

    以区分两个相近单词的微小差别,视觉系统必须加以保留甚至放

    大。来看看这两个词:“eight”和“sight”。我们可以马上从大脑中

    提取出它们不同的意义和发音,而只有非常仔细地观察时,我们

    才可以发现两词之间的差异只有几个像素而已。我们的视觉系统

    对“eight”和“sight”之间的细微差异非常敏感,并会将这种差异放

    大,使得视觉输入传送到语义空间中完全不同的地方。同时,视

    觉系统又对其他一些更明显的差异几乎视而不见,如“eight”和“EIGHT”之间的差异。

    和视觉系统对大小写不敏感一样,这种对于重要的细节格外

    注意的能力也是多年训练形成的。一名英语阅读者,可以马上看

    出字母“e”和“o”之间的区别,同时认为“a”和“a”之间没有区别;但他可能不会注意到希伯来字母“?”和“?”之间的巨大差异,而这

    个差异对希伯来语的阅读者来说却是显而易见的。

    每一个单词就是一棵树

    视觉使用一种组织严密的系统来应对单词识别中的恒常性问

    题。我们将在第2章中详细了解到,进入视觉脑区的神经活动将

    一步一步被整理成有意义的分类。非常相似的形状,例

    如“eight”和“sight”,将通过一系列越来越精细的过滤,在这一过

    程中被逐渐区分开,并对应到心理词典中的不同词条上去。所谓

    的心理词典是一个虚拟的词典,它记录着我们看到过的每一个

    词。相反,像“eight”和“EIGHT”这样形状特征明显不同的图形,开始在初级视觉皮质由不同的神经元加工,但在不断重新编码的

    过程中,它们逐渐变得几乎不可分辨。探测特征的神经元

    从“i”与“I”之间找到相同点,也有更加抽象的探测字母的神经元

    将“e”与“E”归类为同一个字母的两种不同形式。不论最初的差异

    有多大,阅读者的视觉系统最终将对字母串“eight”和“EIGHT”的

    本质进行编码,而忽略它们的具体形状。视觉系统让这两个字母

    串指向了思维中相同的“地址”,所产生的抽象代码让脑的其他部

    分可以进一步提取这个单词的发音和意义。

    这种“地址”是什么样的?有一些模型认为,脑使用了一种无

    结构的列表,表中只是提供了E-I-G-H-T这一字母序列。也有的模

    型认为,脑使用了一种非常抽象、非常传统的编码方式,与随机

    密码表相似,例如1296是“eight”而3452是“sight”。然而,当代的

    研究支持的是另外一种假设:很可能每一个书面单词都由一个树

    形结构进行编码,在这个结构中字母被组合成稍大一级的单元,而这些单元则再组合成音节与单词,就像人体可以划分成下肢、上肢、躯干和头,而这每一个部分又可以进一步划分为更简单的

    单元。

    例如,我们可以看一下怎样将“unbuttoning”这个单词分解成相应的小单元。我们必须先将前缀“un”和熟悉的后缀“ing”(也可

    以把它看作由语法产生的结尾)拿掉。它们都是用来修饰这个词

    的中心元素,也就是词根“button”的,即词中词。而这三个组成

    部分统称为“词素”(morpheme),即具有语义的最小单位。在这

    个水平上,词素的组合方式就是一个单词的特征。将一个词分解

    为词素甚至可以帮我们理解从来没有见过的词,例

    如“reunbutton”或“deglochization”,我们能看出这个词指的是

    与“gloch”相反的动作,虽然我们不知道“gloch”是什么意思。在某

    些语言中,例如土耳其语和芬兰语,词素可以组成超级长的单

    词,这些单词可以承载的信息与整个英文句子一样多。在这样的

    语言中,当然在英语里也一样,将词分解为词素对于从视觉到语

    义的转换过程尤为重要。

    很多实验数据表明,视觉系统可以非常迅速地,甚至根本是

    无意识地从单词中识别出词素。例如,如果我们让“departure”在

    电脑屏幕上一闪而过,再给你呈现“depart”时,你就能更快地读

    出来。这是因为呈现“departure”对于词素“depart”进行了预激活,从而使你提取起来更容易了。心理学家称之为“启动”(priming)

    效应,即阅读一个词的时候会启动对其他相关词的阅读,就像是

    预先为水泵灌好水,让它更快地开始输送一样。

    重要的是,启动效应并不只是依赖视觉相似性:看起来差异

    很大但却拥有相同词素的词,像“can”和“could”也可以彼此启

    动;而那些看起来相像,但却没有共同词素的单词,像“aspire”和“aspirin”则不会彼此启动。启动也并不需要两词在语

    义水平上有相似性,例如“hard”和“hardly”,或“depart”和“department”也可以彼此启动,虽然它们的意义基本

    上是无关的12。将词分解为词素这一过程,对阅读系统似乎非常

    重要,因为我们有时甚至会去猜测单词的分解方法。阅读系统

    将“department”分解为“depart”和“ment”,以方便后续加工过程解

    码出这一单词的意义13。不过这种机制并不是完美的,一个无精

    打采(listless)的人并不是在等一份杂货清单(grocery list)的

    人,而你与室友同住一间公寓(apartment)也并不意味着你们将

    很快分离(live apart)。不过不要介意,这种解析错误会在单词分解过程的其他阶段中得到修正。

    如果进一步分解“unbuttoning”这个单词,就会发现词

    素“button”本身并不是一个不可分割的整体。它由两个音节

    [b?]和[ton]组成,而这两个音节又可以分解为单个的辅音和

    元音:[b][?][t][o][n]。这里,我们又看到另一个对

    阅读系统至关重要的单元:字素(grapheme),即对应目标语言

    中一个音素的一个或一系列字母。注意,在我们的例子中,双字

    母“tt”对应一个单独的音[t]14。实际上,由字素到音素的对应

    并不总是直接的。在很多语言中,字素可以由一组字母构成。英

    语中就包含了特别多的复杂字素,例如“ough”、“oi”和“au”。

    视觉系统学会了如何将这些字母组合看作真正的单位,甚至

    已经不再深究它们究竟是由什么字母组成的了。我们用一个小实

    验来证明这个观点。请观察下面一组单词,并标出包含“a”的单

    词:

    garage

    metal

    people

    coat

    please

    meat

    你有没有感觉到,在最后的三个单

    词“coat”“please”“meat”上,你的速度稍稍减慢了一点?这三个词

    都包含字母“a”,但是“a”嵌在一个复杂字素中,而这个字素的发

    音又不像“a”的发音。如果我们仅仅利用探测字母的神经元来探

    测“a”的存在,将单词划分成字素并没有意义。然而,实际的反应

    所用的时间清楚地表明,脑的加工并不止步于单字母水平。视觉

    系统会自动地将字母再分组为更高级的字素,这就让我们更加难

    以判断类似“ea”的分组中是否真的含有“a”的问题了15。接着,字素将被自动地组合为音节(syllable)。这里也有一

    个小例子来证明这一过程。你将看到一些由5个字母组成的单

    词。有一些用了黑体,有一些用了正常字体。请将注意力集中于

    中间的字母,试着判断出它是黑体还是正常字体:

    第一组 HORNY RIDER GRAVY FILET

    第二组 VODKA METRO HANDY SUPER

    你有没有觉得第一组比第二组稍稍难一点?在第一组中,黑

    体字符并不代表音节的边界,例如在“RIDER”中,“D”是黑体而

    其所在音节的其他字母都是正常字体。我们的思维倾向于将组成

    一个音节里的字母组合到一起,这与黑体对字母的分组形成了冲

    突,导致我们的反应明显变慢了16。这个现象说明视觉系统会自

    动将单词划分为基本组成单元,即使我们并不希望它这样做。

    单词组成成分的性质现在还是一个很热的研究课题。看起

    来,单词的分解存在不同的层次:最底层是单个字母,然后是一

    对字母,或者叫作双字母(bigram,这是一个重要的单元,我们

    后面还会讲到),双字母后是字素,再接着是音节、词素,最后

    才是单词。最终,视觉加工将一个单词解析成一个层级结构,即

    一个树形结构,其树枝为大小逐级递增的单元,而叶子则是字母

    (见图1-3)。

    图1-3 单词的树型结构单词串就这样被简化到极致,去掉了不相关的字体、大小

    写、字号信息,分解为基本要素,从视觉系统传至脑的其他区

    域,加工出单词的语音和意义。

    字符转化为声音

    书写是一种为眼睛绘制单词和言语的天才艺术。

    乔治·德布雷伯夫,法国诗人

    当奥古斯丁(Augustine)拜访米兰主教安布罗斯

    (Ambrose)时,他发现了一个奇怪的现象,写入了回忆录中:

    当安布罗斯阅读时,他的眼睛扫过书页,他的心找出文

    字的意义,但他的声音却未发出,他的舌头也静止不动。谁

    都可以随意地接近他,而客人们来时一般也不用通报。所以

    我们来拜访他时,经常可以看到他这样静默地阅读着,因为

    他从不读出声来17。

    在7世纪中叶,神学家塞维利亚的圣依西多禄(Isidore of

    Seville)也感叹:“字母有一种魔力,能够无声地将远方的人的话

    传递给我们。”在那个时代,通常的做法是将拉丁文大声地读出

    来。阅读时发出声音是一种社会习惯,但同时也是一种真正的需

    要,因为当时人们面对的情况是单词堆在一起,没有空格,而拉

    丁语又是一种不熟悉的语言,大部分阅读者都必须像小孩子读书

    一样边看边嘟囔。因此安布罗斯安静的阅读方式才让人这么惊

    奇。但对我们来说无声阅读已经是一种人人熟悉的经验,我们可

    以不发出声音就进行阅读。

    我们的思维是否可以直接从书面文字直达语义,而不需要经

    过发音呢?还是我们无意识地将字母转换成语音,然后才由语音

    转换到语义?这个问题一直有很多争论。在30多年的时间中,这种阅读内在通路的组织方式问题所引发的讨论使心理学界划分成

    了不同阵营。一些研究者认为从文字到语音的转换是必经的一

    步。他们认为,书面语言只不过是口语的一种副产物,因此我们

    必须通过一种语音通路(phonological route)将单词读出来,然

    后才有可能明白文字的意义。而其他人则认为,语音编码只是阅

    读初学者具有的特点。对于更成熟的阅读者来说,阅读的效率体

    现在一条直接的词汇通路(lexical route)上,这一通路直接将字

    符串转换成其意义。

    现在,研究者们基本上达成了共识:对成人来说,两条通路

    都存在,而且它们是同时运作的。我们都可以直接提取单词的意

    义,由此省掉先发音再理解的麻烦。然而,即使是熟练的阅读者

    也会利用单词的发音,即使他们并没有意识到这一点。并不是说

    我们必须真的将单词读出来,我们不必动嘴唇,甚至不必产生准

    备动嘴唇的意图。然而在更深层的加工中,我们会自动提取出单

    词发音的信息。词汇通路与语音通路并行运作,并相互支持。

    有充足的证据证明,我们在阅读时会自动获取语音。例如,可以设想一下,我们要从一列字母串中找出哪些是真正的英文单

    词,哪些不是。注意,你只需要确定这些字母是否可以组成一个

    英文单词。列表如下:

    rabbit

    bountery

    culdolt

    money

    dimon

    karpit

    nee

    你可能会在看到一些读起来像真单词的词时有所犹豫,例如

    看到读音像“demon”、“carpet”和“knee”的词时。这种干扰效应可以通过反应时间清晰地测量出来。这一效应表明,我们将每个字

    母串都转化成了与真单词比较相像的语音,虽然这一加工过程与

    我们所要求的实验任务相悖18。

    读一个新单词时,在脑中将单词转化为语音尤为重要,例

    如“Kalashinikov”(卡拉什尼科夫冲锋枪)这个词。一开始,我们

    并不能直接提取它的意义,因为没见过如此拼写的单词。我们所

    能做的,就是将其转化为读音,然后才能发现这个读音模式是可

    以识别的,并且通过这一间接过程来理解这个新单词。因此,当

    遇到一个新单词时,发音往往是唯一的对策。同样,在阅读那些

    拼错了的单词时,发音也一样重要。来看一下爱伦·坡的冷僻小说

    《离奇天使》(The Angel of the Odd)。在这篇小说中,一个神

    秘的人陌生人进入了故事中“我”的公寓,那是“一个没什么特点的

    人,不过也不能说完全无法形容”,他有着一口伦敦迷雾一样重

    的德国口音:

    “请问,你是谁?”我正色道,虽然还带着些许疑惑,“你

    怎么进来的?你想说什么?”

    “饿砸养晶爱的,”那人说,“扑管泥德师。资于饿相说西

    嘛,饿想说西嘛酒说西嘛。资于饿师碎,嘎嘎,饿酒师来样

    泥自技看一看饿师碎的……看饿!饿师离七天使!”(3)

    “Az vor ow I com'd ere,” replied the figure, “dat iz none of

    your pizzness; and as vor vat I be talking apout, I be talk apout

    vat I tink proper; and as vor who I be, vy dat is de very ting I

    com'd here for to let you zee for yourzelf....Look at me! Zee! I

    am te Angel ov te Odd.”

    “确实够离奇的。”我鼓起勇气说道,“不过我一直觉得天

    使是应该有翅膀的。”

    “吃旁!”他非常愤怒地大叫,“饿妖吃旁干西嘛?田哪!

    泥一为饿师一只寄嘛?”(4)“Te wing!”he cried, highly incensed, “vat I pe do mit te

    wing? Mein Gott! Do you take me vor a shicken?”

    在读这段文字时,我们回归到了一种早已被遗忘的阅读模

    式,即孩提时代的阅读模式:我们使用了语音通路,通过缓慢地

    将完全生疏的字符串转化为声音,从而神奇地读懂了这些文字,好像有人在对我们轻声朗读一样。

    那么那些日常的单词呢?那些我们已经看过成千上万次的单

    词呢?我们并不觉得需要通过脑海中的发音来缓慢地对其进行解

    码。然而,一些聪明的心理学测验让我们知道,我们仍然会在无

    意识水平上激活这些单词的发音。请看下面的例子,你需要指出

    下面哪些单词表示人体的组成部分。这些都是非常熟悉的单词,因此你可以专注于它们的含义而忽略它们的发音。来试一下:

    knee

    leg

    table

    head

    plane

    bucket

    hare

    也许你有一种对“hare”答“是”的冲动,因为它的发音

    与“hair”(头发)相似,那也是人体组成部分。众多实验表明,我们在遇到与目标分类中的某个词发音相近的词时,反应会变

    慢,错误也会变多19。如果我们没有先提取出了这些单词的发

    音,又怎么会注意到发音的相似性呢?要解释这种错误,我们只

    能认为存在一个内在的语音转换过程。脑忍不住要把“h-a-r-e”这

    几个字母转化为内在语音,然后才将这个语音与语义联系起来,而此时我们遇到一个偶发情况,发现我们读的这个字母串与另一

    个常见单词发音相似,这时这一联系过程就会出错。

    当然,这种不完美的脑设计也让我们可以享受生活中最有趣

    的东西之一:双关语,或者如幽默作家理查德·莱德勒(Richard

    Lederer)所说的“文字的乐趣”。如果没有这种天生的将字母转换

    为语音的能力,我们就无法对梅·韦斯特(Mae West)的自述露

    出会心的一笑(“She's the kind of girl who climbed the ladder of

    success wrong by wrong”(5)),也不会理解柯南·道尔的姻兄的揶

    揄:“There's no police like Holmes.”(6)

    没有奥古斯丁所说的“静默

    的声音”,有些双关语就难博得我们一笑了:

    一个仰慕者跟林肯总统说,“请允许我引见我的一家。

    我妻子,淫(殷)夫人。我女儿,淫(殷)小姐。我儿子,淫(殷)少爷。”

    “天啊!”总统说。20

    An admirer says to President Lincoln, “Permit me to

    introduce my family. My wife, Mrs Bates. My daughter, Miss

    Bates. My son, Master Bates.”

    “Oh dear!”replied the president.

    (7)

    有更多来自阈下启动(subliminal priming)的证据支持脑自

    动提取单词发音模式的理论。假设我先让“LATE”这个单词在你

    眼前闪过,然后马上给你呈现“mate”,并让你尽快地读出来。我

    们故意让单词的大小写不同,以避免出现低水平的视觉相似性。

    然而,当第一个单词的发音和拼写与第二个词相似时,就像这个

    例子中那样,我们发现阅读第二个词的速度大幅加快,比两个单

    词没有关系时(如先呈现BOWL后呈现mate)要快得多。这种加

    速效果中,一部分显然只与单词拼写的相似性相关。先闪

    过“MATH”后,识别“mate”变快了,虽然这两个字母串的读音非常不同。然而重要的是,当两个单词的发音存在共同点时,这种

    加速效应更加明显,如先“LATE”后“mate”,而这种以语音为基础

    的启动效应即使在拼写完全不同时也会起作用,如

    先“EIGHT”后“mate”。这样看来,发音似乎被我们自动地提取

    了。不过正如你所料,拼写与语音并不是在同一时刻进行编码

    的。脑只需要观看一个单词大约20~30毫秒,就可以激活单词的

    拼写,而要转换成语音,则还需要再多40毫秒,这一点从语言启

    动出现的时间上就可以证实21。

    由此看出,这些简单的实验为我们勾勒出了阅读者脑中一系

    列连续的加工阶段,从视网膜上的印记到转化为字母和语音。任

    何一个熟练的阅读者都可以无意识地、毫不费力地将字符串转化

    为声音。

    声音的局限性

    在阅读时,内隐地提取出书面文字的发音是一个自动的过

    程,然而这种转换也许并非不可或缺。语言到声音的转换通常又

    慢又没有效率。因此我们的脑经常会试着通过另一条更加直接的

    平行通路,来提取单词的意义,将字符串与我们心理词典中的条

    目直接联系起来。

    为了让我们对直接的词汇通路有一个更直观的感受,我们可

    以设想一个只能通过在脑海中读出文字发音来阅读的人所面临的

    窘境。对他来说,要区分同音的单词是根本不可能的,例

    如“maid”和“made”,“raise”和“raze”,“board”和“bored”,或

    者“muscles”和“mussels”。纯粹依赖声音的话,他也许就会以

    为“连环杀手讨厌玉米地”,或者认为“一克拉的钻石是某种橙色的

    奇怪形状”(8)。而实际上我们能够轻易地区分这些同音不同义的

    词,这表明我们并不是非要把它们的发音读出来。我们有另一个

    通路来帮助消除这种模棱两可,然后直达词义。

    纯粹以语音为基础的阅读理论还有另一个问题:从拼写到语音的过程并不是一条无障碍的高速公路。如果没有其他因素的作

    用,我们往往不可能单单从字母顺序中就提取出单词的发音。例

    如“blood”这个词。它看起来显然就应该读成[blud],并

    与“bud”或“mud”这类的词同韵。但我们是怎么知道的呢?为什

    么“blood”不跟“food”或“good”同韵?为什么它的发音一点也不

    像“bloom”或“bloomer”?即使是相同的词根,发音也有可能不

    同,像“sign”和“signature”。有一些词更特别,我们根本看不出它

    的字母组成与它的发音有任何的关联,如“colonel”“yacht”“thought”。在上述这些情况下,如果我们不事

    先了解这个词,我们就无法得知它的发音。

    英语中不规则发音的现象俯拾即是。实际上,书面语与口语

    之间的鸿沟已经存在了几个世纪,莎士比亚的《爱的徒劳》

    (Love's Labour's Lost)即是佐证。剧中的书呆子霍罗福尼斯

    (Holofernes)说道:

    我痛恨这种荒唐的妄人,这种乖僻而苛刻的家伙,这种

    破坏正字法的罪人:明明是doubt,好吧,他却说dout;明明

    是d-e-b-t,debt,他偏要读作d-e-t,det;他把calf读成了

    cauf,half读成了hauf;neighbour变成nebour;neigh的音缩作

    了ne。这简直是abhominable(令人憎恶),可是他说起来又

    是abbominable了。此类错误读音令人发疯。

    英语确实是一种让人憎恨的不规则语言。萧伯纳(George

    Bernard Shaw)曾指出,“fish”这个词的发音,用“ghoti”也可以拼

    出,只要取“enough”中的“gh”,“women”中的“o”和“lotion”中

    的“ti”就可以!萧伯纳痛恨英语的这种不规则性,他甚至在遗嘱

    中为一项竞赛提供了支持,竞赛的目标就是发明一种完全合理

    的“萧伯纳字母表”。遗憾的是,这项活动从来没有真正成功过,可能是因为这种字母表与现有的所有拼写系统都相距太远了22。

    当然,萧伯纳的例子有点极端,没有人会真的把“ghoti”读

    成“fish”,因为字母“g”放在单词的开头时永远读[g]。同样,尽

    管有莎士比亚的存在,在今天的英语中,“alf”在词尾时总是发音为[af],例如“calf”和“half”。放在特定的上下文中,通常还可

    以看出一些更高级的规律,让字母和声音的对应更加简化。但即

    使是这样,例外仍是数不胜数,像“has”和“was”,“tough”和“dough”,“flour”和“tour”,“header”和“reader”,“choir”和“chair”,“friend”和“fiend”。

    对于大多数发音不规则的单词来说,提取发音就不是理解单词的

    基础,更像是理解单词的产物:只有识别出“dough”这个单词,才可以提取出它的发音。

    拼写系统中的隐藏逻辑

    也许我们会奇怪,为什么英语会坚持使用这样一个复杂的拼

    写系统呢?实际上,意大利语就不会面临英语的问题。意大利语

    的拼写是透明的:每一个字母对应一个独立的发音,几乎没有例

    外。正因如此,意大利人学习阅读只需要几个月的时间。这给他

    们带来了巨大的好处,意大利儿童的阅读能力比英语国家的儿童

    高出几年的水平,而且他们在学校也不需要每周花大量的时间在

    听写和拼读上。除此之外,我们后面也要讨论到,阅读障碍对意

    大利儿童来说也不是那么严重的问题。也许我们应该向意大利学

    习,烧掉词典,设计一个新的拼写系统,让3岁的孩子也可以轻

    松阅读(9)。

    毫无疑问,英语的拼写可以简化。不过现有的这些奇怪的拼

    写里充满了历史的积淀。今天的学生应该哀叹黑斯廷斯战役(10)

    ,此战所带来的法语与英语的混合是形成这种让人头痛的语言的罪

    魁祸首,例如“c”被用作代表发音[s](如“cinder”)。而学术上

    几个世纪以来的保守主义,有时近乎迂腐,已经将我们的词典僵

    化。有些“好意”的学者硬要引入一些荒谬的拼写,如“island”中

    的“s”,因为一些误入歧途的文艺复兴学者想恢复拉丁词

    源“insula”。最糟糕的是,拼写没能随着口语的自然演变而演进。

    外来词的引入,以及英语发音的自然转变在英语的书写和口语之

    间制造了巨大的鸿沟,让英语国家的孩子们平白多受了很多年学习之苦。总之,理性的思考让我们认识到彻底简化英语拼写势在

    必行。

    虽然如此,在真正改革英语之前,全面理解拼写系统中隐含

    的逻辑是非常重要的。拼写中的不规则现象并不仅是约定俗成

    的,它们来源于语言的结构和脑的结构。两条阅读通路,不管是

    从拼写到语音的语音通路还是从拼写到语义的词汇通路,都对书

    写系统施加了复杂且无法协调的限制。英语、意大利语、法语和

    汉语之间的语言学差异,导致不可能有一种拼写系统能满足所有

    这些语言。因此,英语中这些让人憎恨的不规则性似乎是不可避

    免的。虽然英语急需拼写上的改革,但这一改革必须先与大量的

    限制条件斗争。

    首先,我们还不清楚英语是不是像意大利语一样,可以让每

    一个发音对应一个字母,而且每一个字母都有一个固定的发音。

    这件事做起来不简单,因为英语中所包含的发音数量比意大利语

    要多。根据说话者的不同及计算方法的区别,英语中音素的数量

    在40~45之间,而意大利语音素只有30个。英语的元音与双元音

    特别多:有6个简单元音,如“bat”“bet”“bit”“but”“good”“pot”中的

    元音;还有5个长元音,如“beef”“boot”“bird”“bard”“boat”中的元

    音;还有至少7个双元音,如“bay”“boy”“toe”“buy”“cow”“beer”“bear”中的元音。如果给每一

    个发音配备自己的书写符号,就必须发明新的字母,这又让孩子

    们学习起来更难了。可以考虑给已有的字母增加音标符号,如

    、?或ü。不过,如果认为有一种普适性的字母表可以用来书写

    世界上所有的语言,这个想法未免太过理想化了。这样的拼写系

    统确实存在,它叫作国际音标(International Phonetic

    Alphabet),在音系学和语言学的技术出版物中起到了重要的作

    用。然而,这种书写系统实在太复杂了,用在日常生活中效果并

    不好。国际音标有170个字符,其中有一些特别复杂(如?、?、?、?或?)。即使是专业人员,如果不借助词典,也很难流畅阅

    读。

    为了避免学习过多的符号形状,像英语和法语这样拥有很多

    音素的语言,都必须做出妥协。为了表示某些元音或辅音,这些语言要么必须使用ü这样的特殊字母,要么必须使用“oo”或“oy”这

    样的字母组合。特定语言中的这些特殊现象,并非无端出现的装

    饰品,它们在阅读中起到了关键的“节约脑加工”的作用,任何一

    种拼写改革都必须考虑到它们的存在。

    虽然英语没法简单地让一个单独的字母形状对应一个发音,但也许可以反过来进行尝试。如果能够系统地让每一个声音有固

    定的字母来代表,那么很多拼写错误就可以避免。例如,如果在

    写[f]这个声音的时候可以不必考虑是写“f”还是“ph”,那事情

    就变得简单多了。毫无疑问,我们可以轻松地去除这种多余的、耗费了大好童年时光的拼写规则。实际上,这正是美国小心翼翼

    的拼写改革所走的方向,他们把不规则的英式拼

    写“behaviour”和“analyse”简化成了“behavior”和“analyze”。沿着这

    个思路,还可以进一步向前。熟练的阅读者已经对英语拼写中的

    荒谬之处熟视无睹了,其实像“x”这样一个字母根本没有存在的

    必要,虽然这个字母很简单。因为“x”代表了[ks]这个发音,而

    这个发音已经有自己的拼写方法了。在土耳其,人们管出租车

    叫“taksi”。这个国家在一年内(1928—1929)采用了罗马字母

    表,大刀阔斧地简化了拼写,并且教会了300万人如何阅读,为

    拼写改革的可行性提供了绝佳的例证。

    不过还是要非常小心。我怀疑任何一种激进的拼写改革,如

    果其目标是建立一种一对一的语音-文本转换的话,都一定会失

    败,因为拼写的作用并不仅仅是忠实地转录语音。伏尔泰说

    过“书写是声音的绘画,越相似就越好”,这种说法虽然意境优

    美,却是错误的。书写的文本并不是一种高保真录音。它的目标

    并不是像我们发音一样对语音进行复制,而是对语音进行编码,要让编码达到一个足够抽象的水平,以使阅读者可以快速提取出

    语义。

    为了证明这个观点,我们可以试想一下,一个纯粹的表音文

    字系统会是什么样子,那是一种伏尔泰可能会认为是理想的书写

    系统。我们在说话的时候,一个单词的发音会因为它周围单词的

    不同而产生变化。假设拼写要反映这些说话者通常不会注意到的

    笨重的语言学现象,如所谓的协同发音(coarticulation)、同化(assimilation)和音节重划(resyllabification),那会非常糟糕。

    这样的话,上下文的不同就会导致同一个单词拼写不同。例如,我们是不是要用不同的书写方式来表示不同复数形式单词的发音

    呢?我们是不是要把“cab driver”拼写成“cap driver”,就因为[b]

    这个发音在[d]之前时通常发音类似[p]?还有一种极端的情

    况,我们是不是要把说话者的口音考虑进去(Do you take me vor

    a shicken)?这太荒唐了(apsurd,是的,我们说这个单词的时

    候发的是[p]这个音)。书写的首要目标是以最高效的方式来

    传递信息,而任何一种只刻板地记录语音的拼写都会偏离这个目

    标。

    英语拼写往往看重词根的透明度,而牺牲了语音的规则性。

    例如“insane”和“insanity”这两个词,在意义上关系密切,如果非

    要因为发音的一点差异就把它们拼写得不同,那就太傻了。同

    样,因为“column”“autumn”“condemn”这些词派生出

    了“columnist”“autumnal”“condemnation”,在这些词中保留原单词

    中不发音的“n”也是很符合逻辑的。

    这种凸显意义的拼写方式,至少也可以部分地解释英语为什

    么用很多不同的方式来拼写同一个发音。英语单词比较紧凑,并

    且多用单音节词,因此,同音异义经常出现,如“eye”和“I”,“you”和“ewe”。如果这些词用表音的方式书写,那么它们就无法区分了。拼写规范正是在这种限制中发展起来

    的。同音而拼写不同会使听写变得复杂,但是却给阅读带来方

    便,因为阅读者可以快速地掌握词义。学生们也许会抱怨同一个

    发音[u]有那么多种不同的拼法,像

    在“two”“too”“to”“stew”中,但是他们应该明白这些附加的规则对

    阅读速度至关重要。没有这些规则,任何书面文字都会成为生涩

    的字谜。多亏了这些拼写规范,书面英语可以直接通达语义。任

    何一种拼写改革都必须保持这种语音与语义之间的微妙平衡,因

    为这种平衡反映了一个更深层次也更严格的现象:我们大脑中存

    在两条阅读通路。拼写透明的梦想

    语音阅读和语义阅读的争论依然在全世界范围内进行着。每

    一套文字系统都必须以某种方式处理这一问题。依照语言的不

    同,最佳的折中方式也不同。如果英语拼写像意大利语或德语一

    样简单的话,那就轻松多了。然而意大利语或德语这类语言之所

    以能这么简单地进行从语音到拼写的转换,是受益于一些本身的

    特点。例如,在意大利语及德语中,单词通常比较长,由多个音

    节组成。语法的一致性在共振元音上得到了很好的体现。因此,同音异义词鲜有出现。由此可见,纯粹的表音拼写系统是可行

    的。意大利语和德语可以拥有一种透明的拼写系统,其中几乎每

    一个字母都与唯一的语音相对应。

    中文则是另一种极端。绝大多数中文单词只有一两个音节,而因为总共只有1 239种音节(如果不算声调的话只有410种),每一个音节都可以指向数十种不同的意义(见图1-4)。因此,一

    个完全表音的书写系统对于中文来说是没有用的,每一种拼写都

    可以用上百种的方式来理解!这就是为什么中文的几千个字符大

    多数都表示单词或它们的词素,即表达语义的基本单位。中文的

    书写系统同时也依赖几百个表音记号,来进一步说明一个特定的

    字根如何发音,以便阅读者更容易知道它所表示的单词是什么。

    例如“妈”这个字,意思是“母亲”,发音为[mā],由一个词

    素“女”(表示女人)加上一个音素标记“马”[mǎ]组成。因此,与人们通常所认为的不同,即使是中文,也不是完全的表意文字

    (ideographic script,文字符号代表概念),它同样不是一种纯粹

    的语素文字(logographic script,文字符号代表单个单词),而是

    一种混合式的“词素-音节”(morphosyllabic)文字系统,其中一

    些符号代表词义,另一些符号代表发音23。图1-4 石室诗士食狮史

    拼写的不规则性也并非毫无道理。虽然中文文字系统中用二三十个不同的字符来代

    表同一个音节,这种冗余也并非没有道理。相反,这对中文阅读者有很大帮助,因

    为中文中的同音词很多,也就是说,很多词发音相同但意义不同,就像英语中

    的“won”和“one”一样。本图中,你看到的整个中文小故事,只用到[shi]这一个发

    音!任何中文阅读者都可以理解这段话,而要是把这段话写成“shi shi shi shi……”的

    话就完全无法理解了。中文使用不同的字符来表示不同的意义,这一方法消除了声

    音上的模糊性。与此类似,同音词的存在也解释了为什么英语坚持用这么多不同的

    拼写方式表示相同的读音,如“I scream for ice cream.”。

    当然,学习阅读中文比学习意大利语要难得多。学习中文时

    必须学会几千个符号,而学习意大利语只要几十个就够了。因

    此,中文与意大利语分别位于书写透明性这一维度的两个极端,而英语和法语则分别占据了中间的某两个位置24。在英语和法语

    中,单词较为短小,因此同音异义词出现得就相对频繁,如“right”“write”“rite”。为了应对这一限制,英语和法语的拼写规

    则中掺杂着表音与表意的文字,这给书写者带来了困难,却方便

    了阅读者。

    简言之,我们才刚开始理解那些约束英语拼写系统的限制条

    件。我们最终有可能对英语进行改革吗?我个人对此的观点是:

    大幅度的简化势在必行。这是我们对子孙的义务,我们要帮他们

    免除这种浪费数百小时的残忍学习。此外,还有一些孩子可能永

    远无法适应这种学习,他们或是一辈子受困于阅读障碍,或者只

    是因为生在贫困家庭或多语种家庭。这些儿童是英语拼写系统的

    真正受害者。我希望我们的下一代将能因为手机与网络的使用,而非常熟悉简化的拼写,如此一来,拼写改革对他们来说就不再

    是禁忌的话题,由此能聚集足够多的人愿意理性地看待这一问

    题。然而,我们不可能通过简单地颁布一条法令,强制采用表音

    的拼写系统来解决这个问题。英语永远不可能像意大利语一样简

    单。规则化拼写的梦想可望而不可即,正如一本已在欧洲流行了一段时间的小册子中所写的:

    欧盟委员会宣布,他们已达成共识,确定英语为欧洲沟

    通的首选语言,而不是另一种备选语言——德语。作为协议

    的一部分,英国政府承认英语的拼写有改进的空间,并同意

    进行一项为期5年的计划,发展名为欧洲英语(Euro

    English)的语言,简称欧语(Euro)。

    在第一年,我们将弃用软音的“c”,而用“s”取代它。公

    务员们听到这个消息一定很高兴。同时,硬音的“c”将

    被“k”取代。这不仅可以减少混淆,打字机上也可以少一个

    字母了。第二年,我们要将讨厌的“ph”换成“f”,大众会因此

    热情高涨。这将使“fotograf”(photograph)这个词缩短

    20%。

    In the first year, “s” will be used instead of the soft “c.”

    Sertainly, sivil servants will resieve this news with joy. Also, the

    hard “c” will be replaced with “k.” Not only will this klear up

    konfusion, but typewriters kan have one less letter. There will be

    growing publik enthusiasm in the sekond year, when the

    troublesome “ph” will be replaced by “f.” This will make words

    like “fotograf” 20 per sent shorter.

    第三年,大众对这种新拼写方式的接受程度将会提高到

    一个新的阶段,令我们可以进行一些更加复杂的改变。政府

    将鼓励去掉双写字母,因为这降低了拼写的准确率。同时,大家也一致认为,英语中那些乱七八糟的、不发声的“e”非常

    讨厌,所以也要去掉它们。

    In the third year, publik akseptanse of the new spelling kan

    be expekted to reach the stage where more komplikated changes

    are possible. Governments will enkorage the removal of double

    letters, which have always ben a deterent to akurate speling.

    Also, al wil agre that the horible mes of silent “e”s in the languagis disgrasful, and they would go.

    到第四年,人们会乐于接受用“z”代替“th”,用“v”代

    替“w”这样的举措。在第五年中,不必要的“o”可以从那些包

    含“ou”的单词中去掉,而其他字母组合当然也可以采取同样

    的措施。

    By the fourth year, peopl wil be reseptiv to steps such as

    replasing “th” by “z” and “w” by “v.” During ze fifz year, ze

    unesesary “o” kan be dropd from vords kontaining “ou”, and

    similar changes vud of kors be aplid to ozer kombinations of

    leters.

    这5年过去后,我们的书写风格将变得非常合理,不会

    再有麻烦和困难,每个人都会觉得彼此之间更容易相互理解

    了。

    After zis fifz yer, ve vil hav a reli sensibl riten styl. Zer vil

    be no mor trubls or difikultis and evrivun vil find it ezi tu

    understand ech ozer.

    我们的梦想将最终得以实现!

    Ze drem vil finali kum tru!

    阅读的两条通路

    在继续探讨之前,我想总结一下到目前为止所提到过的内

    容。所有的文字系统都在精确表音与快速表意之间摇摆不定。这

    种困境在阅读者的脑中有直接的反映。当我们阅读时,两条信息

    加工通路共存并互相补充。当单词很规则,或很不常见,或是第

    一次看见时,我们会优先利用“语音通路”进行加工。我们先将字

    符串解码,然后将其转换为语音,最后尝试提取这种发音模式的

    意义(如果它有意义的话)。相反,当我们看到很常见的或是发音很特殊的单词时,会采用直接通路,即词汇通路进行阅读加

    工,先识别单词并提取词义,然后再利用词义信息去提取它的发

    音(见图1-5)。

    图1-5 单词阅读的加工在几条平行的通路上同时进行

    从输入书面单词(左下)到输出其语音(右下)的过程中,脑依赖好几条通路,在

    图中用方框和箭头标示。当单词为规则词时,一条表层通路直接把字母转换为语

    音。当单词为不规则词时,例如“carrot”,更深层次的表征就会参与进来。这些表征

    类似于心理词典,将单词与语义联系起来。

    从脑外伤及其造成的心理后果的研究中,我们可以找到支持

    两条通路存在的最佳证据。一些患者会由于中风或脑损伤而失去

    快速提取文字发音的能力25。显然他们从拼写到语音转换的语音

    通路被严重破坏了。虽然他们在脑损伤之前可以正常阅读,但在

    损伤后,他们的阅读表现出深层阅读障碍(deep dyslexia)或称

    语音阅读障碍(phonological dyslexia)的所有特征症状。虽然拼

    写能力完全没问题,但是他们再也不能大声读出不常见的词,如“sextant”,尽管这种词的拼写是规则的。此外,他们再也无法

    阅读新词或自造的词,如“departition”或“calbonter”。然而,令人

    惊奇的是,他们仍然可以理解常用词,而且基本上可以大声读出一些不规则的常用词,如“eyes”、“door”和“women”。偶尔,他们

    会将一个词与另一个词混淆。例如,深层阅读障碍患者可能

    把“ham”读成“meat”,或“painter”读成“artist”。这些错误的特点表

    明,患者基本上保留了提取单词意义的能力。如果患者没有理

    解,或至少部分地理解他想要读出的词,那么他根本就不可能提

    取出这词的正确词义。尽管深层阅读障碍患者已经基本失去加工

    出这些文字读音的能力,但是他们似乎可以识别书面文字。看起

    来好像一条从拼写到语音的阅读通路被阻断了,而信息仍然能够

    通过另一条从拼写到语义的通路进行加工。

    而与之相反的情况也有过记录。这一次,一名患者所患的是

    另一种综合征,被称为表层阅读障碍(surface dyslexia),他们

    无法对词义进行直接提取,必须慢慢地读通文本,并把所有单词

    念出声。在这种情况下,“默读”的局限性更明显。表层阅读障碍

    患者仍然可以阅读发音规则的单词,如“banana”,甚至可以读出

    新词,如“chicopar”,但是他们却几乎完全无法读出不规则的单

    词。他们通常会通过盲目的声音转换来读出其标准化的发音。例

    如,有一名患者将“enough”读成[inog],然后发誓说他从来没

    听过这种奇怪的单词。很明显,该患者从视觉到心理词典的直接

    通路被阻断了,而从书面文字到语音的转换却仍然可以正常运

    作。

    这两类患者的对比证实了我们拥有两条截然不同的阅读通

    路,但同时也证明,只存在一条通路时,不论是哪一条通路,人

    都无法读出所有的单词。直接通路,即从拼写通达单词及其词义

    的词汇通路,可以让我们读出大部分常见单词,但是这条通路无

    法应对罕见的或全新的单词,因为这些单词没有存储在我们的心

    理词典中。相反,间接通路,即从拼写到语音再到词义的语音通

    路,则无法应对像“women”这样的不规则单词,以及“too”这样的

    同声异义词,但是这条通路在我们学习新单词时起着不可替代的

    作用。

    阅读时,两条通路总是处于合作之中,每一条通路都对单词

    的准确发音起到作用。单词的大多数音素可以利用简单的拼写-

    语音转换规则通过字母组合推断出来,而有时候,我们则需要借助更高的词汇和语义水平来处理一些偶然的模糊情况。儿童的这

    两条通路间的合作并不协调。有些儿童非常依赖直接的词汇通

    路,他们尝试对单词进行猜测,通常会把目标词读成同义词,如

    把“house”读成“home”。还有一些儿童则哼哼呀呀地读出一句话,然后痛苦地从单词的字母中拼凑出一个近似的读音,却无法从这

    些似是而非的读音中猜出意义。要发展成熟练的成人阅读者的那

    种完整协调的阅读系统,还需要多年的练习,使这两条通路密切

    合作。

    目前大部分阅读模型都认为,流畅的阅读依赖于两条阅读通

    路间的密切合作,根据所读的词不同(认识的和不认识的、常见

    的与不常见的、规则的与不规则的)及阅读任务的不同(出声阅

    读还是文字理解),每一条通路所发挥的作用大小不同。在20世

    纪八九十年代,一些研究者试图用单通路的阅读模型来解释这些

    阅读现象。当时,神经网络模型的出现引发了热烈追捧。一些研

    究者把神经网络看成通用的学习机器,认为它们可以不需预先设

    定好认知结构,就能学会任意一种技能。他们认为阅读的习得可

    以建模为从字母输入到语音输出,而中间则由一个强大的学习机

    制来调整。研究者们希望找到一个网络,既可以模拟正常阅读,又可以模拟与阅读相关的那些疾病,且又不需要假定我们有多种

    皮质加工通路。这一类型的网络在当时代表了一种了不起的进

    步,特别是在拼写到声音转换过程的建模上26,然而今天的大多

    数研究者相信,这样的方法是不够的。

    我自己的感觉是,在没有将脑的结构研究透彻以前,是无法

    对阅读进行建模的,因为阅读依赖于平行且存在部分冗余的多条

    通路。近年来的几乎所有模型虽然还是要依靠神经网络模拟,但

    是都将“多条阅读通路”这一核心思想贯彻其中27。在本书后面探

    讨阅读的脑机制问题时,我们将会看到,脑结构的一个核心特征

    就是其“多条平行通路”的组织形式。因此,甚至双通路模型都可

    能低估了阅读神经系统真正的复杂程度。将阅读加工划分为两条

    通路,一条从拼写到语音的语音通路和一条从拼写到语义的词汇

    通路,只不过是一个实用的粗略估计而已。心理词典

    如果只讨论将词素转化为音素的表层语音通路,那么认为阅

    读的内部加工过程只是一系列简单程序,就是合理的。只要将英

    语中的几百个词素和它们相应的发音之间的对应关系存储在脑中

    即可。然而,当我们考虑另一条深层通路,即词汇通路是如何识

    别数千常见单词时,则需要更大的存储。认知心理学家将这种存

    储比喻为一种词典,叫作“心理词典”(mental lexicon)。

    毫无疑问,我们应当把心理词典看作是复数的,因为脑实际

    上存储了单词的很多类不同的信息。对于熟练的阅读者来说,每

    个人都拥有一本英语拼写的心理词典,其中列出了我们以往所知

    的所有单词的书写形式。这种正字法记忆很可能是以一种树形的

    层级结构来存储的,从字母到字素,到音节,再到词素。例

    如,“carrot”一词所对应的条目,应该类似[ca][rrot]。但

    是,我们同时还有另外一本“语音词典”,即一本记录单词发音的

    心理词典,例如“carrot”一词的发音为['k?r?t]。我们同时还有

    一个语法存储,它告诉我们“carrot”是一个名词,并且它的复数是

    规则变化的,等等。最后,每一个词还会与数十种语义特征相联

    系,详细地表明它的含义:“carrot”是指一种可食用的蔬菜,长条

    形,橘黄色等。当脑提取相关信息时,这些心理词典就一本一本

    地被翻开了。可以这么说:思维中存在着一座由数卷参考书组成

    的参考库,既有拼写指南,又有发音手册和百科词典。

    心理词典中词条的数目庞大。实际上,人类的词汇知识被大

    大低估了。有一种广为接受的谬误,说拉辛(Racine)和高乃依

    (Corneille)在写戏剧时只用到一两千个词,一些原本知识很渊

    博的人也为这个谬误进行辩护。传言说有一种叫作基础英语的高

    度简化版的英语,只包含850个单词,但却能让我们有效地表达

    自己的思想;还有一些人佯称,一些市中心青少年的词汇量已经

    缩减到500!所有这些想法都错了。我们曾做过准确的估计,普

    通人的词汇量往往能达到数万之多。标准词典大约有100 000词

    条,而我们通过抽样程序发现,任何一个说英语的人都认识其中的大约40 000~50 000个单词,还不算复合词。另外每个人还认

    识大约同样数量的专有名词、缩略词(如CIA、FBI)、商标(如

    Nike、Coca-Cola)以及外来词,这些加起来,每个人的心理词典

    可能包含了大约50 000~100 000个词条。这些数值进一步证明了

    我们非凡的脑容量。任何一个阅读者都能轻易地从至少50 000个

    候选词中找到合适的词义,这一过程只需要花零点几秒,而它所

    依赖的只不过是视网膜上的几道光线而已。

    “魔鬼的集会”

    词汇通达的几个模型,实现了模拟在类似于神经系统所创造

    的条件下,人类阅读系统的行为。其中,几乎每一个模型都是在

    奥利弗·塞尔弗里奇(Oliver Selfridge)于1959年提出的几个观念

    的基础上发展而来的。塞尔弗里奇提出,心理词典的工作方式就

    像魔鬼的大型集会,或者叫“鬼蜮”(pandemonium)28。他把心

    理词典生动地比喻为一个由上万魔鬼围成的巨大半圆,而魔鬼们

    都在彼此竞争。每个魔鬼都只对一个词有反应,而且必须在这个

    词被喊到的时候大叫,以便让大家知道这是他的词。每当一个字

    母串出现在视网膜上时,所有的魔鬼都同时仔细地观察它。那些

    认为自己的词可能出现了的魔鬼就会大叫起来。因此,当“scream”(喊叫)这个词出现时,负责这个词的魔鬼就会大

    叫,但是他的邻座,那个对“cream”(奶油)进行编码的魔鬼也会

    大叫。“scream”还是“cream”?短暂的竞争之后,代表“cream”的

    魔鬼放弃了,很明显,他的对手从字母串“s-c-r-e-a-m”这一刺激

    中得到了更强的支持。至此,这个单词就被识别出来了,并且可

    以进入系统的后续加工。

    在这个简单的比喻背后,隐藏着关于阅读过程中神经系统工

    作方式的几个关键观点:

    ◆ 海量的并行加工:所有的魔鬼都同时工作。因此我们不需要按顺序逐个检查所有的50 000个单词,如果是序列

    查找的话,这一过程就会根据我们心理词典的大小而变

    得极其耗时。而鬼蜮的并行加工方式则让我们的加工效

    率有了实质性的提高。

    ◆ 简单性:每一个魔鬼都完成一个基本任务,只是检查刺

    激字母与自己的目标词的匹配度。因此,鬼蜮模型不会

    像民间心理学中的模型那样陷入思维陷阱,假想出一个

    小人儿掌控着我们的大脑。如果有这么个小人儿,那么

    他的脑又是谁来控制的呢?一个更小的小人儿吗?从这

    个方面来看,鬼蜮模型可与哲学家丹尼尔·丹尼特

    (Daniel Dennett)的名言相比:“我们从思维的图式

    (scheme)中丢弃了那个幻想出的小人儿,而改用一大

    群这样的傻瓜来做这个工作。”29

    ◆ 竞争与强健:魔鬼彼此争夺表征正确单词的权利,这种

    竞争过程使我们变得灵活而强健。鬼蜮会根据当前任务

    的复杂程度进行适应调整。当没有其他竞争者时,即使

    是一个罕见且拼错了的单词,如“astrqlabe”,也可以被快

    速辨认出来。代表这个词的魔鬼即使在一开始喊得很小

    声,也总能轻松地战胜所有竞争者。然而,如果出现的

    刺激是一个像“lead”这样的单词,很多魔鬼都会被激活,即那些代表“bead”“head”“read”“lean”“leaf”“lend”等的魔

    鬼,在代表“lead”的魔鬼胜出之前,众鬼将经历激烈的争

    斗。

    所有这些简化的特征都与神经系统的主要特征相吻合。人类

    的脑大约由一千亿个细胞组成,简直就是一个巨型的并行计算系

    统的原型,所有神经元都同时进行运算。这些神经元之间的被称

    为突触的连接,从外界的感觉刺激中为神经元带来计算的依据。

    此外,还会有一些突触是抑制性的,即当该突触的源头神经元放

    电时,其他神经元的放电就被抑制了。加拿大的神经生理学家唐

    纳德·赫布(Donald Hebb)将这种并行运算形容为一种神经网

    络,名叫“细胞集群”,指不断竞争的神经细胞之间的联合。因此

    也无怪乎塞尔弗里奇的鬼蜮模型为那么多有关神经系统的理论模型提供了灵感,其中也包括第一个阅读的神经网络模型。图1-6显

    示了最早的这类模型中的一个,该模型由杰伊·麦克莱兰(Jay

    McClelland)和戴维·鲁姆哈特(David Rumelhart)在1981年提出 30。这个模型包括了类似神经元的单元所组成的三个层级。

    图1-6 麦克莱兰和鲁姆哈特的模型

    单词识别就像是在一个成千上万字母和单词单元的大集群中,各单元彼此合作找出

    输入字母串的最佳解释的过程。本图仅显示了麦克莱兰和鲁姆哈特模型中的一小部

    分。该模型中,输入字母串的基本特征激活字母探测神经元,而字母探测神经元再

    优先连接到包含这些字母的单词的探测神经元。这些连接可以是兴奋性的(箭头)

    也可以是抑制性的(圆头线段)。而单词单元通过激烈的竞争最终选出一个获胜的

    单词,这个单词就是输入字母串在网络中所产生的最佳结论。

    ◆ 在最低层,输入处理单元对呈现在视网膜上的线段灵

    敏。

    ◆ 位于中层的是字母探测单元,在出现某个字母时放电。

    ◆ 最顶层的单元对整个单词进行编码。

    所有这些单元都被千丝万缕的连接紧密地联系在一起。这种

    数量庞大的连接使得这一网络的运作变成了一场复杂的政治博

    弈,字母和单词彼此支持,彼此检查,或者彼此消灭。仔细观察

    这张图表,你就可以看到,既存在由箭头表示的兴奋性连接,又

    存在以圆头线段表示的抑制性连接。它们的职责是传递每个魔鬼的投票。每一个输入探测神经元都对某一特定的特征进行编码,如竖直线,然后将刺激信息传递给所有包含这一特征的字母——

    为了简单起见,我们可以说每一个视觉神经元都对这些字母是否

    进入下一层级进行“投票”。同样,在下一个层级上,字母探测神

    经元便依据每个单词相应的单元所提供的刺激,共同推选出某些

    单词。例如,“A”和“N”的出现,可以支持“RAIN”和“TANK”这两

    个单词,而对单词“RAIL”只有部分支持,对单词“PEST”则完全

    不支持。

    抑制在筛选最佳候选词时也发挥作用。由于抑制性连接的存

    在,每个字母都可以给那些不包含它们的单词投反对票。例如,对“N”进行编码的单元会通过抑制的方式给“RAIL”这个词投反对

    票。此外,互相之间存在竞争的单词会彼此抑制。因此,出

    现“RAIL”时就不能识别为“RAIN”,反之亦然。

    最后,自上而下的连接也是必要的,即从单词到其组成字母

    的连接。我们可以把这一过程比喻为参议院,单词在参议院中代

    表了字母的声音,并且会反过来支持选举出它们的那些字母。互

    利的连接创造了一种稳定的合作关系,可以避免偶然出现遗漏字

    母的情况影响单词的识别。例如,如果单词“crocodile”中少了一

    个“o”,与“o”相邻的字母们仍然会选举出“crocodile”一词,而这

    个词又会反过来支持词中间的“o”出席,虽然书写时把它漏掉

    了。最终,为了支持这种将单词、字母、特征联系起来的巨量的

    统计学约束,我们需要上百万的连接。

    还有其他一些微妙的特性使得整个网络得以流畅运行。例

    如,每一个单词所对应的单元的放电阈限可能会不同。常见单词

    的阈限比罕见单词的阈限低,在拥有等量的自下而上的支持时,常见单词更容易胜出。最近的一些模型还纳入了对字母位置的细

    致编码过程。所产生的网络运作模式非常复杂,已经无法进行算

    术描述了。我们必须借助电脑模拟的方法才能知道系统识别出正

    确单词所需要的时间,以及它出错的频率。

    并行阅读认知科学家们之所以愿意大费周章地研究出这些复杂的阅读

    模型,是因为这些模型给出的预测结果与实证结果相当吻合。这

    些由塞尔弗里奇的鬼蜮得到灵感的模型,不仅可以再现那些关于

    阅读速度和阅读错误的经典实验结果,还引领我们发现了微妙的

    新现象,这些新现象构成了人类阅读行为的核心特征。

    如果要设计一款书面文字识别软件,很可能不管选择哪一种

    方案,程序都会随着单词的变长而变慢。例如,一种很自然的方

    式是让软件从左到右一个一个地处理字母。正因为信息的加工是

    序列化的,我们可以预期,识别一个由6个字母组成的单词所需

    要的时间应该是一个由3个字母组成的单词的两倍。在任何一种

    序列化模型中,识别时间的增加与单词中字母的数量直接相关。

    看过这个例子之后,我们就会注意到,人脑中并不存在这种

    阅读时间与字母数量的相关关系。对熟练的成人阅读者来说,阅

    读一个单词的时间基本与单词长度无关。只要单词不要超过6个

    或7个字母,那么不管多长,单词的识别时间都基本恒定31。显

    然,这暗示我们,脑利用了一种并行的字母处理机制,能够同时

    处理所有字母。这种实证结果与我们的“扫描仪”比喻产生了分

    歧,但它却正好印证了鬼蜮的假设,即处于特征、字母、单词等

    不同层级上的成百万专门化的加工机制同时并行地运作。

    主动的字母解码

    我们再深入探讨一下这个计算机比喻。在传统的计算机程序

    中,信息的处理通常是通过一系列步骤来完成的,不论是最简单

    的还是最抽象的处理过程都是如此。我们可以合理地想象,应该

    有一段子程序是用来识别单个字母的,然后另一段子程序将它们

    组成字素,最后,第三段子程序检查该字母串可能是哪一个单

    词。然而,这样的程序通常来说容错能力非常低。第一阶段的一

    点错误往往会导致整个认知过程的瓦解。实际上,即使是我们现

    在购买扫描仪时所附赠的最好的自动文字识别软件,也仍然对图像质量的下降非常敏感。哪怕只是扫描窗口上一点点的尘埃,也

    会使一页人类阅读起来完全无碍的文字变成电脑“无法识别”的乱

    码。

    与电脑不一样,视觉系统善于解决那些不确定的问题。我们

    来做一个小实验,你可以自己读一下下面的句子:

    Honey bccs sovovr sweet ncctar(蜜蜂品尝甜花蜜)。

    在你不知道的情况下,你的眼睛成功地跨越了一系列的障

    碍,而这些障碍完全可以难倒传统的电脑程序。你是否注意到

    了,在单词“bee”当中,那个重复的字母其实是“c”?实际上,在

    拼写“nectar”(花蜜)这个词时,我也用了两个“c”,但是你的视

    觉系统把第一个“c”当作了“e”,而第二个才当

    作“c”。“savour”(品尝)这个词更糟糕,“a”和“o”一模一

    样,“v”和“u”也没有差别!上下文帮我们解决了这种不确定性:

    因为“souour”这个字母串在英文中没有意义,而如果把它理解为

    动词“savour”的话,整个句子就通顺了。

    简言之,对于这些可以难住当今任何软件的不确定性,人类

    阅读者可能都感觉不到。这种容错性与传统计算机软件相冲突,然而却非常符合鬼蜮假设的框架,因为字母、字素与单词可以通

    过大量冗余的连接而互相支持。字母、单词与上下文的合作,足

    以让脑中的阅读机器更为“强健”。阿尔维托·曼古埃尔说得很对:

    是阅读者赋予了书面文字意义,阅读者的“有能之眼”给那些本来

    僵死的字母带来了生命。字母与单词的识别来自一种主动的、自

    上而下的解码过程,通过这一过程,脑在视觉信息中加入了新的

    信息。

    心理学家们发现,这种主动的解码过程在词优效应(word

    superiority effect)中得到了很好的体现。在杰拉尔德·赖歇尔

    (Gerald Reicher)的经典实验中32,主试要求成年阅读者从两个

    可能出现的字母,如D或T中,找出哪一个曾短暂地出现在电脑屏

    幕上。通过调整难度,实验保证被试只能偶尔给出正确的答案。

    在一些试次中,字母单独呈现。在另一些试次中,同样的字母(D或T)在其他字母的伴随下出现,组成一个词,如HEAD或

    HEAT。注意,其他字母并没有带来有用的信息。因为两种情况

    下前面所出现的字母串“HEA”都是一样的,被试只能根据最后一

    个字母来判断。然而,令人惊奇的是,相比字母单独呈现的情

    况,有其他字母出现时被试的成绩要好得多!也就是说,在有上

    下文的情况下,字母识别的效果要好很多。看起来,由单词层级

    所提供的额外支持扫清了输入信息中的一些干扰。即使把字母插

    入一个假词中(如GERD或GERT),甚至是插入一个看起来像单

    词的辅音字母串中(如SPRD或SPRT),词优效应都依然存在,但如果字母串由随机的字母组成(如GQSD或GQST),这个效应

    就消失了33。

    这一现象也难以用严格的线性信息处理模型来解释,因为在

    这些模型中,必须先识别单个字母才能将字母组合成更大的单

    元。相反,赖歇尔的词优效应却支持视觉单词识别中的冗余连接

    和并行加工。即使将注意力集中于单个字母上,我们也会自动地

    从这个字母所在的上下文中获益。当这种上下文环境是一个单词

    或单词的一部分时,我们可以进行更多层级的编码(字素、音节

    和词素),而来自这些层级的“选票”,为这些字母识别单元提供

    了支持,从而加快了对字母的知觉。很多阅读模型对赖歇尔效应

    的解释是字母与单词在双向加工过程中有交互作用:那些较高层

    级的字素和单词探测单元协同工作,一致更倾向于识别那些与他

    们对输入字母串的理解相匹配的字母。我们看见什么,取决我们

    认为自己看见了什么。

    阅读中的协作与竞争

    我们已经知道,用电脑来比喻阅读,也就是将人类阅读者比

    作一台简单的扫描仪,显然是不够的。单词的解码并不是一个严

    格的序列加工过程,阅读一个单词所需要的时间与单词中含有多

    少个字母无关。所以我们要再次回到鬼蜮模型,将单词识别看成

    是魔鬼集会的成果。集会达成重要决策所需要的时间,也就是“汇聚时间”,并不依赖于他们所讨论的“动议”本身的内容,而

    是取决于这个动议引发的争论有多激烈。如果所有的参议员都同

    意,即使是一项再复杂的法律也可以很快通过。相反,即使只是

    法律中的一个小细节,如果触及敏感问题,则可能要经过长时间

    的争论才能达成一致。

    关于人类阅读的研究表明,阅读者的脑活动就像一个思维的

    参议院。单词的识别需要脑系统中多个单元共同得出对视觉输入

    信息的确切解释。因此,阅读一个单词所需要的时间主要取决于

    这个单词在脑结构中引发了哪些冲突与联合。

    多年以来,实验心理学家们已经发现,在单词加工的所有水

    平上都有可能出现冲突。例如,在词汇水平,我们已经知道单词

    可以与它们的“邻居”竞争,即与那些只有一个字母之差的单词竞

    争34。例如“hare”这个单词有很多邻居,如“bare”“care”“dare”“fare”“mare”“pare”“rare”“here”“hire”“hale”“hate”“have”“hard”“harm”“hart”,而“idea”这个单词则像一个孤独的隐者一样没有邻居。实验表

    明,单词的邻居数量,特别是邻居的相对词频,对单词被识别的

    速度有关键的影响35。

    很多时候,有一些邻居是好事。一个单词有越多的邻居,我

    们就能越快地断定它属于英文单词。邻居的存在显示出,相比

    于“idea”而言,单词“hare”的拼写是更典型的英语拼写。而密集的

    邻居也可以提供更好的学习机会。我们有更多的机会去学会那些

    以“are”结尾的单词应如何发音,而要学会以“dea”结尾的单词的

    发音则只有一次机会。因此举目无亲的“idea”在视觉和语音两个

    水平上的编码都要略逊一筹。

    然而,邻居太多也会造成干扰和烦恼。要理解或读出一个单

    词,我们对单词的识别就不能模棱两可,要将单词与它的邻居区

    分开,如果邻居们更常见,并因此在词汇的竞争中占有优势的

    话,这一加工过程就会特别缓慢且困难。因此,要识别

    出“hare”这个单词就相对慢一些,因为它与很多非常常见的词,如“have”和“hard”间存在竞争36。心理词典就像一个竞技场,竞争

    激烈,而那些常见的单词在与它们的低频邻居的竞争中拥有明显的优势。

    竞争也存在于从拼写到语音转换的语音通路中。例如,要读

    出“beach”这个词就比读“black”耗时更长。在“beach”中,输入的

    字母串必须被解析成复杂的字素“ea”和“ch”,而它们的读音与单

    字母的“e”“a”“c”“h”之间有巨大的差别。另一方面“black”这个词

    由于其字母与语音有直接的对应,读起来更加容易。实验心理学

    可以很容易地证明存在这种字母水平与字素水平之间的潜在冲

    突。在识别由复杂字素组成的单词时,会产生一个短暂的无意识

    竞争,虽然这一竞争会很快结束,但是相比于像“black”这样更透

    明的单词,这种竞争会引起可测量到的反应延迟37。

    值得注意的是,这些冲突大部分可以自动解决,不需要有意

    识地干预。当神经系统遇到不确定性时,它的基本策略是对所有

    的可能性保持开放——这种策略只有巨大的并行计算系统才能实

    现,因为它可以同时保留对刺激的多种解释。正是因为有了这种

    开放式的组织形式,在后续各水平的分析过程中才可以添加相应

    的证据,直到最后得出整体满意的结论。有时候,只有知道了句

    子的上下文,才有可能理解一个词的意义与发音。想一想这类句

    子:“The road winds through a valley battered by fierce winds.”(这

    条路蜿蜒地穿过被狂风肆虐的山谷。)实验证明,在这类情形

    下,单词的所有可能解释都同时被无意识地激活了,直到上下文

    将解释限定为一个词义38。我们的阅读过程十分高效,我们几乎

    意识不到这种不确定性,除非这种不确定性非常有意思,正如多

    萝茜·帕克(Dorothy Parker)在错过截稿日期后给她的代理人所

    发的电报那样:“就跟编辑说我忙得要死——反过来说也行。”(11)

    从行为到脑机制

    在这一章中,我们探讨了如何将阅读分解为一系列信息加工

    阶段。从视网膜图像加工,到字母识别的恒常性,再到发音、词

    素的识别,最后一直到心理词典中的冲突解决,人类阅读机制之高效让我们叹为观止。只需一瞬间,几乎不费吹灰之力,脑就解

    决了当代软件技术无法逾越的困境。对于单词中所包含字母的并

    行加工,对于不确定性的处理,从心理词典中的大约50 000个词

    中瞬间找出一个词的能力,都说明了脑对阅读这一任务的出色适

    应。

    人类阅读加工过程的惊人高效性让其产生机制越发神秘。既

    然人脑不可能针对阅读而专门进化,那它又是如何适应得如此之

    好呢?这种从奇怪的双足灵长类动物转变而成的狩猎收集者的脑

    结构,为什么能在短短几千年的时间内就如此完美地适应了视觉

    文字识别所带来的挑战呢?为了阐明这个问题,我们现在将转而

    探讨脑中的阅读回路。最近一项惊人的研究发现,大脑皮质中有

    一个专门处理书面文字的区域,就像初级听觉区或运动皮质一

    样,这个文字区域存在于所有人的脑中。更令人惊讶的是,不论

    阅读者说英语、日语还是意大利语,这个阅读区域都是相同的。

    这是否意味着大脑拥有一种通用的阅读机制呢?1892年,法国神经科学家约瑟夫-朱尔·德热里纳(Joseph-

    Jules Déjerine)发现,当中风影响到大脑左侧视觉系统的一

    小块区域时,可能引发完全的或选择性的阅读障碍。现在的

    脑成像研究证实,这一区域在阅读中起了重要的作用,叫它“脑中的文字盒子”再合适不过了。这一区域在全世界阅读

    者的脑中位置都一样,它会对书面文字自动产生反应。在不

    到0.2秒的时间内,还来不及产生有意识的知觉,这一区域就

    可以识别出字母串,不论字母的大小、形状或位置等表面特

    征怎样改变。然后,这一脑区将信息传递给两个重要的脑

    区,即主要分布于颞叶和额叶的脑区,它们分别对单词的发

    音模式和意义进行编码。

    我们竟对这奇迹视而不见,几个书写符号就可以包含不朽的意象、错综复杂的

    思考,包含一个活生生的新世界,里面的人们说话、哭泣、欢笑……

    如果有一天我们醒来,每一个人都发现自己完全无法阅读了,那我们怎么办?

    弗拉基米尔·纳博科夫,《微暗的火》

    奇特的语言视盲

    1887年10月,巴黎一个美丽的早晨,学识渊博的退休业务

    员、音乐爱好者C先生正舒服地陷在扶手椅里读着一本不错的

    书。突然,他惊慌失措地发现他竟一个词都不认识了!最近的几

    天,他偶尔觉得右臂或是右腿无力、麻木,说话的时候也感觉怪

    怪的不畅快。然而,这种不舒服很快就会过去,当然也没有引起

    他的担心。不过现在的问题就严重得多了:他已经完全无法阅

    读!尽管如此,C先生还能够讲话,还能识别身边的物体和人,甚至还写下了几张字条。很难想象这种令他沮丧不已的窘境究竟

    是由什么引起的。

    C先生相信换一副眼镜一定可以解决他的问题,于是就求助

    于著名的眼科专家埃德蒙·朗多(Edmund Landolt)。不幸的是,朗多医生发现C先生的问题根本就不是眼镜可以解决的。他怀疑

    这是一种神经性的问题,于是决定向比塞特尔医院(Bicêtre

    Hospital)名扬法国的神经学家约瑟夫-朱尔·德热里纳求助。C

    先生在1887年11月15日与德热里纳医生见面。在进行了相当全面

    的心理和生理检查之后,德热里纳医生做出了诊断,并得出了关于阅读脑基础的第一个科学结论1。他将C先生所患的疾病称

    为“纯语言视盲”(pure verbal blindness),意思是选择性地失去

    了识别字母串的能力。有这样一种疾病就意味着脑中存在着某个

    专门进行阅读加工的“字母视觉中心”。这种疾病第一次科学地证

    实脑中存在针对阅读的专门处理机制。

    实际上,德热里纳和朗多最终确认,他们的患者对于单个字

    母或书面单词都失去了辨识能力。在看到一组字母时:

    他以为自己疯了,因为他知道这些自己看不懂的符号其

    实是字母,他坚持说他可以清楚地看到它们,并用手比画出

    它们的轮廓,但却分不清它们是什么字母。当有人要求他把

    看到的东西抄下来时,他费了好大力气才慢慢一笔一画地把

    每一个字母临摹下来,就好像在画一张工程图一样,他检查

    自己画的每一条曲线,以确保画得准确。然而即使是如此辛

    苦,他还是没能认出这些字母。

    这就是“语言视盲”的悖论了:患者看不见的只有字母与单

    词。他的视力依然敏锐,物体识别与面孔识别能力也没有问题,他仍然可以逛逛自己没去过的地方,甚至还可以欣赏绘画作品:

    给他看物体时,他能轻松说出它们的名字。他可以说出

    工业设计清单中所有工具的不同零件的名字。在检查的过程

    中,他的记忆从来没出过错,看到图画时他可以立刻知道画

    的是什么东西,以及怎么使用它们。当他看到自己常读的报

    纸《晨报》(Le Matin)时,患者说:“这是《晨报》,我认

    得它的形状。”但是他连标题中的一个字母都认不出来。

    不过,临床检查还是发现了一些视觉问题。C先生右侧视野

    中的景象好像有点模糊。“物体放在右侧视野的时候,看起来暗

    一些,也不如放在左边时那么清楚。”(如果用神经学的术语来

    说,这可以称为右侧视野视力局部下降,partial right

    hemianopsy。)而且患者无法辨别右侧的颜色(偏侧色盲,hemi-

    achromatopsia)。这一侧的视野似乎只剩下黑、白、灰的颜色。然而,这些视力问题不能解释他不同寻常的阅读问题。C先生知

    道他视力的问题,所以会不自觉地将目光偏移,让他想读的词落

    在注视点的左边,而他左边的视力是完好无损的。但是这样并没

    能对他的阅读产生帮助。

    有一个证据也许可以证明C先生所患的是一种针对字母的选

    择性障碍,因为他仍然可以辩认数字。他可以轻松读出阿拉伯数

    字,甚至可以不费吹灰之力地进行复杂的运算。这个重要的观察

    结果表示,数字的阅读可能依赖另一条自动通路,与阅读字母和

    单词时所用的通路不完全相同。然而如果仅从视觉上来说,数字

    与字母形状非常相似,当初人们选用什么形状代表字母或数字有

    一定的随意性,且两者互换也未尝不可。实际上,有一些文化直

    接用字母的形状来代表数字,例如在阿拉伯,?、?、?、?和?这

    几个看起来像希腊字母一样的形状,分别代表数字8、7、6、5和

    4。因此,患者对数字与字母的反应不同,不能用视敏度下降来

    解释。不论多么精巧复杂的眼镜都不能治好C先生的阅读问题。

    他的这种选择性阅读障碍来自脑,这种病症让我们不得不推论,脑中存在一些针对字母串的专门化的处理机制。

    另一个事实也让C先生的阅读问题更显独特。德热里纳坚持

    认为C先生的智力与语言能力都没有受到损害。实际上,这个患

    者仍然可以非常清晰地表达自己的意思,他的词汇量也不比中风

    前要小。还有另一件让德热里纳大感惊奇的事,那就是患者的书

    写能力完全没有受到影响:

    虽不自觉,但患者的书写能力与他的说话能力一样好。

    我让他写了很多东西,我没检查出任何错误,没有拼写错

    误,没有误用字母……患者仍然可以轻松顺畅地听写,但是

    他却发现自己完全看不懂自己写了什么……面对这样的情

    况,他开始失去耐性,他写了几个字母,然后说:“我还会

    写这些字母,可我为什么看不懂?”

    事实上,虽然德热里纳确实观察到了患者的书写有一点点退

    步,但这完全可以归咎于患者的轻微视觉缺陷:如果在听写的过程中被打断,患者会开始困惑,不知道

    自己刚才写到哪里了;同样,如果他写错了字,也找不出是

    哪里错了。以前他写字又快又好,但他现在的字又大又拖

    拉,且下笔犹豫。用他自己的话来说,是因为他已经无法用

    眼睛去检查了。实际上,视力不但不能指导他,反而给他的

    书写增加了麻烦,以至于他情愿闭着眼睛写。

    书写能力得以保全,与肌肉记忆密切相关。如果让患者用手

    感觉字母的轮廓,他仍然可以识别它们。“因此,是他的肌肉感

    觉让他认出了字母。最好的证据就是,如果让患者闭上眼睛,拉

    着他的手在空气中比画出那些字母的轮廓,那么他就可以认出这

    个单词。”很多年以后,其他神经学家发现,在这类案例中触觉

    阅读完好无损:相比于视觉呈现,在患者的手心写字更容易让他

    辨认出来!这个现象给了我们一个重要的提示,告诉我们问题是

    在哪一水平发生的:字母形状的运动记忆还是完好的,只是视觉

    识别受损了。

    纯失读症

    C先生的症状奇怪到让人无法忽略。他能写、能拼出那些最

    生涩的单词,却又认不出字母来,这怎么可能呢?他是哗众取宠

    或是歇斯底里吗?不是的,德热里纳说,因为“我们在临床上观

    察到这类语言视盲不止一例”。实际上,现代的神经学一直在不

    断成功证实着德热里纳所有最初的发现。今天,有记录的相似案

    例已有几百起2,只不过术语上有所改变,现在我们管这种病症

    叫作“非失写性失读症”(alexia without agraphia,字面上的意思就

    是阅读受损而书写没有受损),也叫“纯失读症”(pure alexia)。

    为什么说“纯”呢?至少有4个原因,这4个原因都在德热里纳

    1892年的原始报告中提到,也在后来的发现中不断地被重复实验

    证明:

    ◆ 口语能力完好无损。

    ◆ 书写能力无碍。

    ◆ 物体、面孔、绘画甚至数字的识别基本正常3。

    ◆ 字母形状的触觉和动作知识没有受损。

    虽然在德热里纳的发现之后很多患者被报告为纯失读症,但

    现代分析表明,这些患者还可以划分为两种亚类型4。有一些患

    者,像C先生,一个字母都读不出来。他们甚至很难把大小写字

    母匹配起来,看不出来“A”和“a”是同一个字母的两种形式5。另一

    类患者则仍然可以识别单个字母。这一点小小的不同让两类患者

    的生活产生了巨大差异。通过慢慢地认出单词中的每一个字母,第二类患者通常仍可以识别出单词,对他们来说,纯失读症的表

    现就是阅读速度极慢。与那些不论长短一眼就能认出单词的正常

    阅读者不同,纯失读症患者需要5~10秒的时间才能读出一个单

    词,而他们的阅读时间会随着字母数量的增加而显著延长(见图

    2-1)。这种特殊的损伤模式叫作“逐字母阅读”,这很清楚地说明

    了这种病的特点。纯失读症的患者无法同时处理单词中的所有字

    母6。图2-1 德热里纳和洛朗·科昂对纯失读症患者脑的研究结果

    资料来源:经Oxford University Press授权使用。

    患者可能在中风后失去阅读能力,也就是患上失读症。德热里纳在1892年(图片上

    部)所描述的第一个失读症患者的解剖结果显示,其脑损伤区域与现代患者磁共振

    成像结果中显示的脑区(图片下部)有一定的相似性。两者都是左半球的下部和后

    部受到了影响。几个患者损伤区的交叠指出了系统地影响阅读能力的脑区的具体位

    置。每一个识字的人都拥有这样一个脑区,且这一脑区总是位于左半球腹侧枕-颞

    区(白色“+”号的位置)。失读症患者有时可以通过一个字母一个字母辩认的方式

    识别单词。即使这样,这些患者的阅读速度也会很慢,且与正常被试不同,他们的

    阅读时间会随字母长度的增加而增长。他们失去了并行加工字母串的能力。

    语言视盲的脑损伤

    C先生的案例表明,人脑中拥有专门负责阅读的区域,它们

    识别文字之后将信息传递给脑中其他掌管语言的区域。德热里纳

    明白,只有通过解剖,他才能真正准确地定位相关的脑区,让他对这个现象的观察具有“生理学实验的严谨价值”。1892年1月16

    日,C先生在他第一次中风的4年之后死于第二次脑梗死,他直到

    死都没能恢复自己的阅读能力。追踪观察他的神经学家定期记录

    着:“尽管他耐心地练习,付出了很多努力,却再也没能重新看

    懂单词和字母的意义。”德热里纳可以进行解剖了。几个星期以

    后,他在法国生物学会发表了他的发现。尸检显示,患者大脑的

    右半球完好无损,而左半球的后部受到了过去的一些脑损伤的影

    响。这些损伤侵入了“枕叶,以及从楔状叶底部开始到枕极的盘

    绕区,还包括舌小叶及梭状叶”。图2-1是一幅德热里纳原画的临

    摹。他清楚地画出了一片“黄色的萎缩地带”的轮廓,正是这片萎

    缩地带所在的皮质区域被血管梗死破坏,使得C先生在4年前失去

    了阅读能力。

    为了更好地解释为什么某些视觉区域的损伤会对阅读造成选

    择性的改变,德热里纳采用了一个“切断连接”的概念。在他给生

    物学会的报告中,他强调C先生的一部分脑损伤是在“白

    质”(white matter)上,白质指的是把距离较远的脑区连接起来

    的神经纤维束。此外,这些损伤还出现在枕极,也就是进行初期

    视觉加工的位置。最后,脑损伤还部分地影响了左侧视觉皮质,并且部分地破坏了胼胝体的长距离连接,损害了它将右侧视野的

    视觉信息传递至左侧大脑的能力。

    在这些解剖学线索的基础上,德热里纳提出C先生的脑损伤

    使得视觉信息向他所谓的“字母视觉中心”传输的神经纤维被切断

    了。在其他一些观察结果的基础上,他进一步将他所假设的这个

    阅读中心的位置范围缩小到角回,即左侧顶叶基部的一个层叠结

    构。德热里纳认为,C先生的字母视觉中心是完好的。所以患者

    在用掌心感觉笔画的时候仍然可以读、拼以及辨认出字母形状。

    然而,由于没有了视觉输入,这个区域完全被切断了,也就无法

    将其关于字母的知识应用于任何视觉刺激。因此,患者并不是真

    盲。他仍然可以看到字母的形状,可以像加工其他视觉物体一样

    加工字母,但是患者不再能将它们辨识为字母或单词,因此才产

    生了顾名思义的“语言视盲”的症状。发现“文字盒子区”

    德热里纳的卓越发现之后100多年,我的同事、神经学家洛

    朗·科昂(Laurent Cohen)和我7,还有其他一些研究者8,在新的

    患者身上重新研究C先生的症状。我们发现德热里纳所描述的那

    种脑损伤竟还颇为常见。我们的纯失读症患者大多是左侧枕-颞

    区受到损伤,与C先生的损伤位置大致相同,这样的损伤经常是

    血块阻塞左侧大脑后动脉造成的,导致这一区域的供血受到影

    响。图2-1显示了我们在三个近期的个案中所看到的脑损伤轮廓。

    三个损伤都影响了左半球后侧的下表面。

    现代磁共振成像(magnetic resonance imaging,简称MRI)比

    德热里纳当时所用工具先进得多。我们不仅不需等待解剖就能看

    到损伤区域,还可以得到不同患者的脑损伤的电脑图像,然后修

    正脑的大小与形状上的个体差异,把这些损伤图贴在一个统一的

    解剖学空间中。这样我们能做的就比德热里纳更多:我们可以找

    出哪些皮质区域是对阅读障碍起到独特作用的,把这些区域与色

    盲等其他视觉缺陷相关的区域区分开。其中的逻辑很简单。首

    先,找到较多数量的失读症患者,然后我们在三维空间中找到他

    们脑损伤的重叠区域。这种对多个脑进行平均所得到的信息可以

    去除中风中所固有的空间随机性,从而将与阅读障碍有关的区域

    找出来。其次,我们再从这个区域中减去另一组没有失读症的患

    者的脑损伤区域。最终就得到一张电脑图像,它精确地标示出哪

    些区域的损伤会选择性地导致阅读障碍。

    如图2-1中所示,这项分析显示,左半球后部的大部分区域在

    阅读中并没有特殊的作用。枕区损伤常常出现在纯失读症患者脑

    中,但是也出现在其他没有失读症的脑损伤患者的脑中。实际

    上,我们知道这些区域与视觉分析的初期阶段有关,这些阶段并

    不是专门处理阅读的,它们对形状、颜色或物体的视觉识别也有

    所贡献。因此,如果中风只影响了这些后部区域,那么引起的就

    是一般性的视觉缺陷。这样的患者通常会丧失视野内部分视觉,有可能会对呈现在他们注视点右侧的刺激表现出半盲或全盲状态。他们经常觉得单词的右侧很难看清,并经常出现向右的眼

    动。这些视觉缺陷可能会降低阅读速度,特别是对那些需要数次

    眼动的长句子,但是从原本的意义上说,我们不应该将这些缺陷

    与纯失读症混淆9。

    纯失读症的关键区域位于枕极前几厘米的地方,在大脑左半

    球的底侧。这一区域在本书中占有重要地位,它有好几个名字。

    解剖学家叫它左侧枕-颞区(left occipito-temporal area),因为

    它在脑的枕叶与颞叶的交界,在一个叫作外侧枕-颞沟(lateral

    occipito-temporal sulcus)的皮质凹陷处(在图2-2中可以找到这些

    区域的位置)。洛朗·科昂和我则建议把这个区域叫作视觉词形区

    (visual word form area),这一名称现在已经成为科学文献中的

    标准说法,它所强调的是这一区域在字母与单词形状的视觉分析

    中起到的重要作用10。然而这两个名称都比较拗口。在本书中,为了简单起见,我会称它为“脑中的文字盒子”或“文字盒子区”,这一名称很好地总结了我们对这一区域功能的认识:它处理输入

    的文字信息!我们将会看到,这一脑区确实在如下过程中发挥着

    重要的作用:对字符串进行快速识别的过程,以及信息向更高级

    区域传递以便计算发音和词义的过程。图2-2 两种阅读神经模型

    经典的阅读神经模型(图片上部)现在已经被一种并行加工的“交错式”模型(图片

    下部)所取代。左半球枕-颞区的“文字盒子区”对字符串的视觉形态进行辨别,然

    后将这种具有恒常性的视觉信息传递给分布于左半球各处的很多区域,它们分别对

    单词的意义、语音模式和发音进行编码。所有浅灰色的区域都不是阅读所专用的,它们主要用于口语的加工。因此,阅读的学习过程就是在视觉区与语言区间建立有

    效连接的过程。所有的连接都是双向的。我们现在还不完全了解它们具体的组织方

    式,脑中的连接实际上很可能比这幅图所展示的更加复杂。扫描二维码下载

    “湛庐阅读”APP,搜索“脑与阅读彩图”,获取本书所有彩图。

    与德热里纳不同,我们现在认为负责字母的视觉识别的主要

    区域并不是脑后上部的角回,而是个非常不同的区域,即位于脑

    偏下部的“文字盒子区”。因此,德热里纳的错误可能源于C先生

    脑损伤的独特性。与大多数纯失读症患者不同,C先生的“文字盒

    子区”并没有遭到直接的破坏,而很可能只是其连接被切断了,在这一点上德热里纳是对的。他只不过搞错了到底是哪个位置的

    脑区被切断了连接,这个脑区实际上位于腹侧视觉系统,而不是

    角回所在的背侧区域。

    我们现在知道,至少有三种脑损伤可以让视觉词形区运作异

    常11。最简单的情况显然是直接损伤这个区域。然而,这个区域

    也可能由于上游信息切断而得不到视觉输入,C先生就是如此。

    还有可能是下游连接的问题,使这一区域不能将信息发送到脑的

    其他区域。在任何一种情况中结果都一样,都会严重损害识别书

    面文字的能力。

    德热里纳还弄错了一个更加根本性的问题。他大大低估了脑

    阅读系统结构的复杂性。德热里纳和很多后来的科学家,如哈佛

    大学的神经学家诺曼·格施温德(Norman Geschwind)一样12,都

    将阅读系统想象成了一条简单的加工链。他们声称书面文字以视

    觉模式进入枕极,再传入角回与单词的视觉图像建立联系。然后

    神经的激活将传导到威尔尼克区(Wernicke's area)——单词的听

    觉表象所在地,再到布洛卡区(Broca area),提取出发音的模

    式,最后进入控制肌肉的运动皮质。这一结构是序列化的、简单

    的、线性的,就像工厂的生产线一样。实际上,这种想法颇有19

    世纪机械类比的味道,那时候人们喜欢将脑的功能比喻为电流的

    传递或蒸汽机中蒸汽的流动。当然,我们可以看到这些最初的神

    经学图式与笛卡尔的液压机图式之间一脉相承的关系。笛卡尔

    用“动物精神”在体内管道中的循环来解释神经反射。这种反射弧

    的比喻盛行了几代。我们不能因为德热里纳当初的错误而责怪他,毕竟我们比他

    多了一个世纪的心理学和神经科学的研究积累。今天,我们抛弃

    了早期的序列化模型,认为脑是一种丛林般复杂的结构,有多个

    功能同时并行运作。一方面,在尝试过用电脑编程实现视觉形状

    识别后,我们认识到了视觉的复杂性,以及它不可能被简化为一

    条脑“意象”的简单链条。即使是识别一个字母也需要一系列错综

    复杂的运作。另一方面,在阅读之中,视觉分析只是第一步。在

    之后,我们还需要集合很多种不同的思维表征:词根、词义、发

    音模式及运动发音图式等。通常这些运作过程需要数个不同的皮

    质区域同时参与,而它们之间的连接也不是线性链。所有这些脑

    区都同时协力运作,而它们发出的信息也经常彼此交结。此外,所有的连接都是双向的:如果区域A连接到区域B,那么反过来

    从B到A的连接也一定存在。

    这些基本的解剖学原理能够让我们为阅读者勾勒出一幅新的

    脑图(见图2-2)。据我们所知,这张图中所有的区域都与单词的

    阅读有关。虽然如此,我的这张图仍然只是暂时的,虽然它看上

    去已经较为复杂,但与实际情况相比这张图很可能仍然太简单

    了,漏掉了很多核心的脑区与连接。与德热里纳不同,我的这张

    图所展示的并不是一种产生序列化视觉的脑组织图像,而是另外

    一种图式,即很多脑区可以同时被激活。因此,当今的脑科学家

    们更加谨慎。虽然拥有很多脑成像工具,我们的图式还是很难清

    晰地将功能与脑区联系起来,因为它们都是同时工作的,而且进

    行着高速的互动。德热里纳可以满心欢喜地指出视觉、听觉和运

    动分别对应着皮质中的什么位置,可是我们却不可以。毫无疑

    问,我们可以更加精细地观察皮质功能运作,但这却让神经心理

    学家头痛不已,让我们不禁怀疑究竟还能不能有这样一天,我们

    能清晰地把握脑的这种复杂回路。

    我们现在还不清楚科学家最终是否能完全理解脑的阅读机

    制。当然,我们对于脑的阅读系统的理解,特别是对为脑提供输

    入信息的“文字盒子区”的理解已经有所进步了。我们现在知道,这个视觉输入区占据重要的战略位置,似乎只有通过它,所有的

    视觉信息才能流动起来,然后分散到大脑左半球中各种不同的区域中去。另外,这种战略性位置还可以解释,为什么这一区域的

    损伤将导致书面文字加工能力完全丧失(如C先生的案例),让

    文字看起来像是一系列无意义的小点。但是这一区域的运作依赖

    哪些原理呢?

    脑成像技术揭开脑阅读的秘密

    30多年来,脑功能成像技术让我们可以直接“解读脑”,在人

    脑的研究中掀起了革命。在被试进行像阅读这类思维活动的同时

    将脑的活动直接具象化,这是这些技术的巨大潜力所在。从很多

    方面来说,脑成像实验比脑损伤研究要直接得多。谁又能知道脑

    在损伤后在多大程度上进行自我重组了呢?而且脑损伤的影响范

    围远不止于损伤区,因为这些损伤还可能会切断与其他脑区的联

    系,使它们得不到信息输入。在脑受损后的数周内,我们经常发

    现患者的脑部活动会大量重组,通过使用不同于健康脑的神经回

    路,患者们可以恢复他们失去的能力。最后,脑损伤还具有不可

    预知性。损伤面积可能会比较大,而且损伤位置也会因血管的结

    构分布而有所偏离,因此损伤区不能直接告诉我们健康脑在功能

    上的组织方式。如果没有办法看到正常人的脑,我们的工作就会

    难得多,像一个学徒只能用坏掉的钟表来学习如何制作钟表一

    样。

    脑成像依赖于一个简单的原则,早在18世纪,法国化学家拉

    瓦锡就提出了这一原则。像身体的其他器官一样,脑在工作时比

    休息时要消耗更多的能量。在《动物呼吸的第一备忘录》(First

    Memoir on Animal Breathing, 1789)中,拉瓦锡的一段话预言了这

    个简单的理念最终可能用来测量脑的活动:

    这样的观察结果产生了一种可能性,让我们能对看起来

    不相关的力的作用进行比较。例如,我们可以评估多少克的

    重量相当于一个人背一段演讲或一个音乐家演奏一种乐器时

    所付出的努力。所有机械的存在都可以用相同的方法进行评估,哲学家思考时的努力,作家写作时的努力,作曲家谱曲

    时的努力。虽然这些努力被认为是纯粹精神上的,但是它们

    也有其肉体的、物质的一面,这使得它们可以与劳动者的努

    力进行比较。

    200年过去了,这一简单的理念终于被付诸实践。1988年,史蒂夫·彼得森(Steve Petersen)、迈克尔·波斯纳(Michael

    Posner)、马库斯·赖希勒(Marcus Raichle)和他们的同事们最先

    以可视化方式呈现出人在阅读时脑的哪些区域消耗了能量13。他

    们使用了正电子发射断层扫描(Positron emission tomography,简

    称PET)技术,扫描并展示了脑的语言区的功能性组织情况。拉

    瓦锡肯定没有预见到这一技术所需的这种心理学与核物理技术的

    奇妙结合。被试们被注射了少量带放射性的水,水中原有的氧原

    子(16O,即氧16)被氧15所取代。这种液体可以迅速在血液中

    扩散,并在全身传播。特别是在脑中,放射性最集中的区域就是

    血流最快的区域,而这个区域正好是脑活动最剧烈的区域。因

    此,放射性的峰值位置直接反映了脑中的热点区域。

    在零点几秒之后,被试脑中的氧15原子会自动地放出一个正

    电子,从而变为稳态,即氧16。正电子是一种反物质粒子,与电

    子正好相反。当正电子与电子相撞时,它们会彼此湮灭,并同时

    放出两个高能光子。而这对光子以相反的方向从脑中穿出时,可

    以被扫描器捕获。遍布被试头部周围的晶体阵列将捕获的信息传

    入一台强大的计算机,由它通过重构计算出氧原子分裂的原始位

    置。最后,我们可以制出一个三维图像,一层一层精准地展示出

    工作时脑中能量消耗的分布情况,正因为是一层一层的,所以才

    叫“断层扫描”(tomography),这个词由希腊语中

    的“tomos”(层)和“graphein”(图画)组成。

    彼得森和他的同事们也在心理学的角度上进行了创新,他们

    让被试执行一系列越来越复杂的任务。首先,彼得森和同事们扫

    描了脑的静息态图像,静息态是指没有为被试呈现刺激,被试也

    没有思考什么特别东西的时候大脑的状态。然后,他们测量了被

    试观察并大声重复书面或语音呈现的单词时的脑活动。最后,他们还测量了同一个人进行词语联想时的脑活动,对每一个呈现的

    词,被试都要想出一个能够恰当地与之关联的动词,如看到“蛋

    糕”时说“吃”。研究者们希望通过把两个相邻步骤的结果相减,以

    此来找到相继运作的脑区,这些脑区分别参与单词的视觉和听觉

    识别、发音及对词义进行心理操纵。

    彼得森实验得到的图像相当奇妙,登上了全世界报纸的头

    版,并成了当今脑科学中不可或缺的一部分。这是人类历史上第

    一次绘出了活人脑中负责语言的区域(见图2-3)。虽然这张图还

    有待进一步完善,然而其核心发现被后来的研究不断重复。只要

    被试看到书面单词,脑后部专门负责视觉的区域就会被激活。同

    时左半球中正好位于枕叶与颞叶交界处的一个小区域也凸显出重

    要性,这个小区域与我们前面所说的“文字盒子区”正好一致。听

    到语音呈现的单词则没有在这两个区域产生激活,而是激活了颞

    叶皮质上部和中部的另外一些区域,这些区域与听觉和言语加工

    的区域一致。另一方面,说出单词则激活了左半球前部的一个区

    域,这一区域与法国神经学家保罗·布洛卡(Paul Broca)19世纪

    提出的与口语产生相关的区域非常接近。同时,产生口语的过程

    还激活了左右半球的运动区。最后,语义联想激活的是另外一个

    区域,位于左半球内侧前额叶皮质,这个区域通常被认为与创造

    性思维有关。

    图2-3 历史性的图片:由正电子发射断层扫描产生的脑语言区图片资料来源:经图片作者Mike Posner和Marc Raichle授权使用。

    相对于单单注视一个小点,默读(图片右上方)激活了位于左半球后部的单词识别

    的视觉加工过程。根据任务的不同,其后信息又被传递到对语音进行编码的区域

    (图片左上方)、言语产生的区域(图片左下方)或词义操纵的区域(图片右下

    方)。

    所有这些区域中,似乎只有左侧枕-颞区在阅读中发挥了专

    门而重要的作用。令人震撼的是,这一区域与脑损伤研究所得出

    来的纯失读症的损伤位置惊人地一致。彼得森和他的同事们发

    现,这一区域只被书面单词所激活,而且它并不属于低级视觉区

    域,因为它不会被棋盘格这样的普通视觉模式图所激活。他们提

    出,这一区域是将初期视觉分析与语言系统的其他部分联系起来

    的一个环节。视觉信息要想进入语言系统,就必须经过这个区域

    的过滤。这一区域选择性地分析看到的图像,从中找出字母,然

    后把字母的信息发送到脑的其他区域,进而使信息最终变成单词

    的发音或意义。

    脑阅读区的普适性

    视觉词形区在阅读中的关键作用,也已经被另一种已经基本

    取代了正电子发射断层扫描的新的脑成像技术所证实,这种技术

    名为功能性磁共振成像(functional magnetic resonance imaging,简称fMRI)。这种出色的、更灵活的技术与正电子发射断层扫描

    相比有两点优势:第一,任何一家医院都拥有这种技术;第二,它完全无害,因为不需要注射放射性物质。在功能性磁共振成像

    中,血氧浓度的变化会影响到磁共振信号,从而被功能性磁共振

    成像仪探测到。血细胞中有高浓度的血红蛋白,负责运送氧气。

    粗略来说,如果血红蛋白分子不携带氧气,那它会表现得像一个

    小磁铁,扰乱局域磁场,从而降低功能性磁共振成像仪所接收到

    的信号强度。而当血红蛋白分子携带氧气时,它在磁场中马上变

    得透明起来,这个变化虽小,但是功能性磁共振成像仪能够测量

    出这一共振信号的增幅。这种可以探测到的血氧浓度变化让我们能够测量脑的活动情

    况。血管与神经元是紧密结合的。当一个脑区被激活时,区域内

    的血管会扩张,在1~5秒内这一区域会得到一股新鲜的含氧血。

    通过测量血氧浓度,功能性磁共振成像将告诉我们几秒之前神经

    活动是如何增加的。此外,它还可以提供脑的任意一个区域的三

    维图像。我的法国同事德尼·勒比昂(Denis Le Bihan)是世界上

    最有影响力的磁共振专家之一,他将这一方法比作通过偷看园艺

    工人来猜测哪块地会长出植物来。虽然我们不知道种子播在了什

    么地方,但是可以通过观察园艺工人往哪里浇水来找到这些种

    子。追踪血液流动是观察神经元活动的一种相对间接的方法,这

    是一种迂回 ......

您现在查看是摘要介绍页, 详见PDF附件(6457KB,356页)