第一章单词识别与词汇心理表征
理论语言是人类特有的高级心理机能。语言是以语音和字形为物质外壳,以词汇为建筑材料,以语法为结构规律而构建的体系。词汇又叫单词,人们如何表征和加工单词,一直是认知心理学家重要的研究课题。
1单词识别的心理过程
单词是构成话语的、能够独立运用的、音义结合的基本语言单位。单词是语言的块件,单词和单词的组合表示我们所处的万千世界中林林总总的物体和事件。在日常的口语交际和书面语言中,人们自由使用的语言单位都是单词。在口语中,单词是音与义的结合体,它不仅传递声音与意义信息,还传递构词法与句法信息。在书面语言中,单词还具有图形信息。单词的作用是标志事物或对象,或传递事物的信息。词形与词音是单词存在的外在形式,词义是单词所指称的事物或现象。人们通过听觉、视觉输入词形或词音信息,在头脑中激活它所指称的事物或对象,即词义,这个过程就是单词识别的过程。单词识别不仅依赖于词音、词形的感觉输入,还依赖于人脑中已有的关于词的各种知识(心理词典),这些知识能对输入的感觉信息进行解释和预测。这就是说,单词识别是在心理词典中进行查询和搜索的过程。当人们根据词形或词音在心理词典中找到了相应词条,并获得对它的解释时,这个词也就被识别了,这就是词汇通达(lexicalaccess),即指根据词形或词音在心理词典中找到了相应条目和理解它的意义的过程。单词识别需要经历一定阶段,消耗一定时间,并完成一定的心理操作。J.I.chumbley和D.A.Balota单词的识别分为两个阶段:(l)词汇通达阶段,即将单词的视觉特征与心理词典中的一个项目进行匹配,从而达到一个词汇项目,或者说是在心理词典中找到了一个词的位置;(2)语义决定阶段,即确定词义、发音和与单词有关的其他信息。而M.s.seidenbeng则把单词识别分为3个阶段:(1)前词汇加工,即分析书面语言或口语的输入,把它确定为一个特定的词;(2)词汇通达,即激活与词典项目有联系的语义、语音、正字法和其他信息;(3)后词汇加工,即选择、精细加工和整合词汇的信息,以便理解句子和话语。在知觉的模式识别中存在着两种形式加一〔:即自下而上(Boftom一up)和自上而下(Top一Down)的加工。自下而上加卜是指由外部刺激开始的加工,通常是从较小的知觉单元进行分析,然后再转向较大的知觉单元,经过一系列连续阶段的加工,达到对知觉刺激的解释。
1.1自动搜索模型
K.1.弗斯于20世纪70年代中期提出了单词识别的自动搜索模型。他将心理词汇比作一个图书馆,一个词就像一本书,只能放在心理词汇/图书馆的一个地方,但是它的位置可以从不同的索引目录中找到。词汇以系列方式进行扫描,扫描后,在输入的感觉信息和一个词条间找到一种适当的匹配。在模型里,存在着三个通达文件:(1)供辨认书面文字的正字法通达文件;(2)供辨认口语的语音通达文件;(3)供辨认意义的语义/句法文件。有了这三个通达文件,词条就能在阅读、听辨和说话时搜索出来。这些通达路线只能一次用一条(就好像一次只能从一种目录中找一本书)。这就是说,知觉一次只能使用一种方式,如果我们在听一个词的同时又读到这个词,通达时间并不能因此而缩短。当一个词通过视觉或声音显示出来讨,根据词开始的字母或声音,词的完整表征就可以建立起来,并在通达文件中激活。一旦人根据该词的提取编码(相当于图书馆卡片箱里的索引)找到词的位置后,就可以通过指针到主文件中找出该词项,这个文件就是心理词汇。在主文件中,一个词的条目包括了它所有的语言信息(意思、拼写、发音、词性,句法、语用,等等)。主文件由许多储存单位,叫做“箱子”组成。
1.2单词发生器模型
英国心理学家J.莫顿于1969年把特雷斯曼的关于心理词典的假设发展成为一个比较完全的、清晰的单词认知模型,即单词识别的发生器模型,以后又经过几次修改。这个模型提出来后,引起了心理学家的注意,并且在70年代成为最有影响的模型。时至今日,仍然有重要的影响。单词发生器模型的基本思想是:词的提取并非靠它在心理词汇中的位置,而是靠它激活到一定阂限的程度。那么激活如何发生?是什么决定了一个词的闺限?莫顿用logogen来代表心理词典中的词条,logogen源于拉J一文fogos和genus,意思是单词和发生。他认为每一个词(或词素)都有它的logogen(词汇发生器),它的功能像一个记分板,记下词条和知觉刺激共享特征的数目,也可以说是一个特征计数器。这些特征把所有正字法的、语音的输入累加起来,以决定提取哪个词条。这个计数器对于知觉的和语义的信息都很敏感。当知觉系统的输入与相应词条一致时,它的计数就会增加;同样,当一个语义上有关的词出现时,通过在词汇网络内的交流,词条的计数也会增加。每一个logogen都有一个阐限,当计数超过闲限时,这个词就被认知了。一旦一个词被认知,相应的logogcn的闽限就会降低,这种降低会持续一个相对长的时间。由于高频词的闽限低,低频词的闽限高,所以所需要的计数也不同,对它们的反应也就不同:对高频词的反应快,对低频词的反应慢。因此logogen模型在一定程度上解释了单词的词频效应。另外,Morton的理论指出,各种方式的输入可以加在一起发生作用。这些不同来源的输入,平行地运作,相互竞争,最后提取出正确的词。词汇发生系统根据候补词和输入词的共享特征之不同以计算出其相对频率。如果几个词条都达到闽限,数目最高的“胜出”,即被“辨认”。当词汇发生器激发出相应的词,其他词汇发生器便会恢复到原来的静止状态(即特征记数器为0)。词汇发生器系统在辨认出一个单词后,又准备处理另一个词。词汇发生模型也能对启动效应和语境效应做出较好解释。
2词汇心理表征的理论
人的各种知识是相互联系、相互渗透、相互制约的。人在认知过程中,知识与知识之间彼此相关、互相联结,组成一个不可分割的系统。心理词汇是一种关于心理图式的假说。人类的知识是以越来越复杂的整合方式来结构和组织的,最简单的水平就是图式,它是能够作用于客体知识(例如单词识别)的心理表征。个体所以能够识别语音和文字,对单词做出反应,说明个体具有能够同化这些刺激的某种图式,即大脑中拥有一部能够识别单词的心理词典。所谓“心理词典”,是指“永久性储存于记忆中的词及词义的心理表征”。知识在心理词典中的表征及组织形式便成了探索单词识别心理过程中最为核心的问题之一。第一个语义表征的认知模型是由Collins&Qullian(1969,1970)提出的层次网络模型,又称作“可教的语言理解者”。该模型认为,贮存在知识系统里的信息是由单位、特征和指向连结组成的,并以分层形式构成网络。单位和特征表示概念,每一概念在网络中的位置称作“节点”(node)。一个节点只与和它有关的特征信息直接连结,当然也与它所属的范畴或它所包含的成分直接连结。但是,单位和特征分别代表不同的概念。作为单位的节点,对应于一个客体、事件或思想,所以该单位是事物的单位。作为特征的节点,用来说明一个单位的结构,相当于一个语句的谓语、形容词、副词的概念。需要指出的是,虽然单位和特征对等于句子的词,但它们指词在知识系统里的位置,而不是词本身。至于指向连结,主要指连结各个节点的连线,借此使各个节点构成网络。指向连结可以把心理词典中的某一词汇与概念中的相应单位连结起来,也可以把一个单位与另一个单位连结起来,还可以把一个单位与一个特征连结起来。在层次网络模型中,一个单位由一组指向连结排列而成,一个特征也是由一组指向连结排列而成的。同时,一个低层的单位也可以与一个高层的单位相连结,一个特征也可以与该单位的属性及其属性的量值(value)相连结。由此,语义知识便可表征为一种由相互连结的概念组成的网络。范畴大小效应(即语义距离效应)便是该模型最为有力的实验证据。但是词汇识别过程出现的熟悉效应、典型性效应和否定判断却成为了它的反例。
第二章汉字识别与多词素词的表征与加工理论
汉语是世界上使用人口最多的语言。汉字是世界上最古老的文字,也是世界上最独具特色的一种文字。汉字与其它语言文字既有相似的一面,也存在着很大不同。和拼音文字一样,汉字也是形、音、义的统一体。因此,在汉字识别中,同样存在复杂性效应、相似性效应和频率效应等。但是,汉字是方块字,属于平面型文字,每个汉字都是一个结构紧密的图形,这和拼音文字按线性方式排列有所不同。另外,汉字具有较强的表意功能,是一种典型的深层文字,不存在形一音对应或形一音转换的规则。因此,对汉字的信息加工或心理操作便呈现出独有的特性。正是这些独具特色的结构和加工过程,吸引了国际上众多心理学家的目光,使其成为当今认知心理学的研究重点和热点。开展汉语和其它语言认知的比较研究,不仅有助于揭示语言认知的普遍性,而且有助于揭示语言认知的差异性,有助于建立具有普遍意义上的语言认知心理学说。
1汉字识别的心理加工模型
由于汉字识别研究在广度和深度上都有较大发展,一些较有影响的汉字识别认知模型得以建立。了解和掌握这些认知理论,对于把握汉字识别的内在心理过程具有非常好的理论指导意义。Biedermam(1987)针对物体识别提出了经成分识别模型。这一模型来源于结构理论,该理论认为,模式识别不仅依赖于物体特征,而且依赖于特征之间的关系。一个物体的二维视像都由一些简单成分(即几何离子gcon)组成。各种不同的geon按不同关系(relation)组合起来,组成不同的物体。这一模型将物体识别分成5个阶段:(1)边界的抽取:(2)非偶然性特征的检测和对凹凸范围进行分析;(3)成分的确认;(4)将成分与物体表征进行匹配;(5)对物体的确认。Huang和Wang将RBC模型进行修改,提出了汉字识别的经成分识别模型。他们认为,汉字也是一种二维图形,与Biederman二维的物体图形有许多相似之处。因此,汉字识别与物体识别可能具有共同的心理过程:即汉字识别开始于特征抽取,然后进行非偶然性特征的搜索和分析字符范畴,其次是字成分及其关系的激活,接着是字符模型的激活,最后是汉字确认。
2多词素词的表征与加工理论
词素是音义结合体,是最小的能独立运用的造词单位。所谓“最小的”与“独立运用的”都是就造词而言的。词也是音义结合体,是最小的能够独立运用的造句单位。从词与词素的定义中,我们可以发现,除了是不同的单位外,二者其它特点都相同,它们在一定条件下可以互相转化。一个或一个以上的词素构成一个词。词素构成词有两种情况:一种是词素独立成词;一种是与其它词素组合成词。这种可以独立构成一个词的词素称为自由词素,因为它本身可以作为具有独立意义的词来使用;而“unluck”则由词素un一与luck构成。在英语中,词素un一表示否定意思,但是不能独立使用,而必须附在其他词素之前。汉语中作为构词基本部件的单字(词素),在数量上是有限的,在表义功能上是相对稳定的。并且,许多汉字都具有独立意义,即其本身可以成为一个词,有些词则有两个以上的词素所构成,称为多词素词。由于识别和理解词汇的依据是单字属性,所以单字的构词规律及表征组织形式就成为汉语信息加工中引人关注的问题。
2.1词素通达表征模型
在关于前缀词识别过程的研究中,发现前缀词的识别需要经过一个词缀剥离过程。他们认为,单词识别是经过通达在表征中的词干实现的,并提出了词缀剥离的模型。该理论认为,单词的识别要经过有两个层次:通达文件和主文件,也就相当于通达表征和语言学表征。主文件存储了与单词有关的语言学信息;通达文件存储了通达一个单词所必须的信息。对于多词素词,通达文件中存储的是其词干。通达文件的编码是依据形的相似程度和频率高低,加工过程是序列搜索。Taft和Forste:等人在词缀剥离研究的基础上,进一步针对合成词的表征与识别过程,提出了词素通达表征理论。他们认为,多词素词在心理词典中是以分解的词素方式表征的,在通达表征层次中只有不可分割的词素,而没有彼此独立的词条,词语是以词素分解形式存储在通达表征中的,故又称词素分解存储的通达表征理论。在识别时,整词的输入被分解为词素单元,词素单元得到了激活,通达到它们各白的语义表征,然后对它们进行整合(即将通达表征中的信息整合、映射到语言学表怔中),最后获得整词意义,从而完成了对整词的识别。由此可见,词素分解表征方式的一个突出优点是认知经济,即用少量的词素单元就可表征大量词汇。在汉字方面,张必隐等人(1992)发现,双字词的词素结构对词的认知具有一定作用,并在此基础上提出了双字词的分解存储理论。他们认为,在心理词典中,双字词的表征是以分解形式存储的,即以字(词素)表征为存储单位,字表征之间存在着不同的联系,从而形成一个网络。词素结构决定字表征之间的联系。词素结构的信息包括词的类别,字的语法类别,两个字表征在心理词典中的距离和联系强度等。但是,许多多词素词,如派生词和合成词,其意义不能简单地由词素的意义推知。在汉语中,也存在大量的语义不透明词。所谓语义透明度,是指复合词的语义可从组成词素的语义推知的程度,其操作定义是整词与其词素的语义相关程度。例如,词义不透明词“马虎气“马”和“虎”的词素意义并不能整合出整词的意义一一“粗心大意”。所以,对于语义不透明词来说,要准确地从通达表征映射到相应的语言学表征,就一定要有独立的通达表征。即使是语义透明词,其语义也不是两个词素语义的简单相加。因此有必要引入整词表征。
2.2整词通达表征模型
整词通达表征理论认为,多词素词在心理词典中以整词形式表征,即在通达表征中存储的都是整词,每一个词都有独立的词条,没有单独的词素表征。单词识别的过程是由刺激输入直接激活相应的单词表征。当然,整词通达表征模型并不否认词素在其中所起的作用。它认为单词的词素关系可通过某种方式蕴藏在通达表征层次的结构之中。Lukatela(1980)等人提出了关于名词表征的卫星模型。该模型认为,名词的每一个词尾变化形式都有各自的词条。而没有词尾变化的那个单词(另外还有一些由此单词通过词尾变化派生的)独具有优势,并作为核心与家族其它成员相连,犹如宇宙天体与卫星的联系。Cole(l990)等人发现,后缀词的词汇识别时间受词根累积频率影响,但前缀词却无此效应。同一词素家族(即词根相同)的派生后缀词的词汇识别时间受整词频率影响。由此他们认为,前、后缀词在心理词典中以整词形式存储,这些词素的结构受它们家族组织的影响。家族成员通过编码词缀词的词素、句法、语音等特质,使到它们之间相互联系。词根就成为词素家族的核心。词汇就是通过这个词根核心通达的。家族成员是按频率高低进行搜索的。前、后缀词在加工上表现了一定的差异:在后缀词加工过程中,由于从左到右的加工原则,词根先被通达,从而使词根频率对词汇识别产生了影响;由于前缀词的词根并没有优先于整词加工,所以,它的词根频率也就没有影响。
第二章汉字识别与多词素词的表征与加工理论...........16
1汉字识别心理过程加工模型...........16
2汉语多词素词的表征与加工理论...........18
第三章汉语多词素词实验研究的范式和结果...........22
1重复启动的范式...........22
2语义启动的范式...........24
第四章本研究的理论假设和研究范式...........27
1以往研究的局限...........27
2本研究的理论假设...........28
3本研究的实验范式...........29
结论
在语义不透明词的识别中,整词的激活相对就要晚些。而且,随着激活过程进行,词素激活和整词激活就会出现“此消彼长”的现象。在加工早期,主要是词素激活,在加工晚期,主要是整词激活。这样,就能在nC模型的基础上,较好地解决词素与整词的动态关系,特别是能较好地说明了在语义不透明词的加工中,整词的意义提取是如何进行的,以及为什么会出现词素和整词激活的相互抑制和此消彼长的现象。当然,这一模型只是我们的一个初步的设想,要证实它尚需要进一步的研究。
参考文献
1彭聊龄.语言理解.当代心理学研究.北京大学出版社,1993,107一175
2桂诗春.新编心理语言学.上海外语教育出版社,2000,250一298
3李维.认知心理学研究.浙江人民出版社,1998,52一%
4朱曼殊等.心理语言学.华东师范大学出版社,1990,184一204
5王苏汪安圣.认知心理学.北京大学出版社,1992,30一78
6傅爱平.汉语信息处理中单字的构词方式与合成词的识别和理解.语言文字应用,2003,4,25一33
7吴景文,皇甫恩.启动效应与知觉表征系统.心理学动态.1994,01,47一51
8喻柏林,曹河析.笔画数配置对汉字认知的影响.心理科学,1992,4,5一10
9谭力海,彭耽龄:关于语境与汉语单字词特征分析之间关系的实验研究.心理学动态,1988,2,5一10
10谭力海,彭腆龄.快速呈现条件下语境与词频对中文语词识别的影响.心理科学通讯,1989,2,1一6