第一章绪论
1.1释题
四字格不但在古代汉语中多见,在现代汉语中也广泛使用,表现为不仅许多从古代汉语中沿用下来的四字格仍具有勃勃生机,如为人们所熟知的“笔墨纸砚”、“青梅竹马”、“阳春白雪”、“杯水车薪”;而且大量的新四字格也迅速涌现出来,如“泡沬经济”、“黄金地段”、“垃圾邮件”、“中文信息”等等。
四字格从最初产生时的临时短语形式,如何发展成具有一定流通度和认知度的准固定短语,进而成为词形和语义上都非常稳定的固定短语,四字格临时短语的固化呈现出怎样的连续变化过程,处于固化各个阶段的四字格表现出什么特征,影响四字格临时短语固化的条件参数有哪些?本文将以“名+名”式四字格为考察重点,逐一解答以上这些问题。
1.1.1四字格是现代汉语词汇的重要形式
四字格是现代汉语词汇中一类非常特殊且重要的词语,它们是由四个音节组成的一个独立的词或者固定结构,一般而言,结构固定而紧密,音节整齐而明快、意义稳定而丰富,具有词形对称、节奏和谐、表现力强等特点。如:
司空见惯 接二连三 百科全书 标点符号 单口相声
灰色收入 八荣八耻 学术超男 通货膨胀 捂盘惜售
这种四字格从古代汉语中一步步发展至现代汉语,数量不断增加,表意愈加丰富。它适合的词长和上口的节奏将词语内部表意的充实性和外部形式的简洁性结合了起来,兼顾了语言的经济性和准确性。
四字格以短语为主要形式,短语在汉语词汇系统中起着承上启下的重要作用,连接着上一级语言单位的句子,以及下一级语言单位的词。因此,短语在汉语词汇系统乃至整个语言体系中占有重要地位。
从共时的角度来看,短语是指两个或更多词的组合,也被称为词组。它是由句法、语义和语用三个层面上能够搭配组合起来且没有句调的语言单位。它是大于词而又不成句的语法单位。简单的短语可以充当复杂短语的句法成分,短语加上句调可以成为句子。短语最小由两个词构成,根据表达需要,还可以增加词,扩充为内部结构层次和语法关系更加复杂的短语。在实际语用中,短语因其合适的词语长度和语义容量,而成为符合心理认知的语言组块。Lewis(1993)认为词块是语法化的词汇,而不是词汇化的语法,词块不仅可以作为语言储存和输出的理想单位,还是听(读)者理解话语的重要基础之一。词块的特征是以整体形势储存,易于在语用层面直接提取,具有较强的搭配和生成能力。词块的具体表征,AlisionWray(2000、2002)认为“语块”是用来描述两个或多个短语成的具有独立性的词串,其中部分多词结构是心理词库的基本单位。汉语中的词串即为短语。而在结构和语义上具备稳固性和整体性特点的四字格形式的短语,更加能够凸显出语块整合词语、语法和语境作用。在语言交际和习得中都具有重要意义。
从历时的角度来看,短语在汉语词汇系统的演变中扮演了重要的角色。古代汉语以单音节词为主,逐渐生成了双音节和多音节词。汉语发展至今,现代汉语中的双音节词占绝对多数。汉语的词汇系统经历了由单音节单语素为主到双音节词为主的演变。而在汉语双音化的过程中,特别是在双音化的初始阶段,双音词主要产生于句法,即由短语演化而来,汉语短语词汇化是复合词产生的一条重要途径。董秀芳(2002)考察后认为,汉语双音节化之初,偏正式短语发生词汇化的比重最高,战国后则是并列式短语增多,偏正式其次。现代汉语中发生词汇化数量较多的短语类型与古代汉语略有差异。李慧(2007)认为,现代汉语中,发生词汇化最多的是动宾式短语,其次为偏正式短语。不同类型短语词汇化数量和比例的调整是源于词汇系统内部的调整,但毫无疑问的是短语是汉语双音节词的主要来源,短语在汉语词汇系统中的重要地位,使得以短语为主要形式的四字格研究具有很大的研宄价值。
................................
1.2四字格及固化的界定
1.2. 1四字格的界定
顾名思义,四字格得名于其特征明显的词语形式。从语音上看,四字格四个音节连用,其特征简要明晰;但从其他不同的角度将四字格分类,情况则非常复杂。词汇学上将词按其结构特点分为单纯词和合成词,按照音节的数量分为单音节词和多音节词。将这两种分类标准参照比较,单纯词绝大多数是单音节词,还包括少数双音节的连绵词和外来词。合成词除了少数儿化词外,绝大多数是多音节词,特别是双音节词。四字格数量丰富,从性质上看,四字格可能是一个词(鄂伦春族),也可能是一个短语(爱国主义);从音节形式上看,可以分为叠四字格(半信半疑)和非叠四字格(点石成金);从语义格式上看,包含成语(瓜田李下)、熟语(喝西北风)、专有名词(社会主义)、普通四字格(国际象棋)等;从语义内容上看,反映了政治(金砖五国)、生活(丁克家庭)、医药(心肌梗死)、宗教(阿鼻地狱)等方面的内容。四字格的分类和列举将在后面的章节中进行更为详尽的分析。
1.2. 2固化的界定
随着社会的发展,汉语词汇系统中不断涌现出新的四字格,专有名词性质的四字格从生成开始即具有稳定的词形结构,是为四字格固定短语,如“血红蛋白”、“北京猿人”;少量的或成为复合词,如“白金汉宫”、“哈萨克族”等;但还有大量的普通四字格,从其产生到稳定要历经四字格临时短语、四字格准固定短语、四字格固定短语的过程,我们将之称为四字格固化过程。
处于固化不同阶段的四字格具有不同的特征。虽然四字格的固化过程是渐进的,界限并不完全分明,但每个阶段所展示出的特征仍是较为显箸的。四字格临时短语是指根据需要新组合的由四个音节组成的短语,其特点是产生时间较短,使用频率较低,组合形式不固定等,例如“红色炸弹”、“光盘行动”等。四字格准固定短语特点主要体现在,一是某些四字格临时短语经过优胜劣汰,词形逐渐稳固下来,并表达较为固定的意义,它们作为整体出现,并且使用的频率增加,不再是刚生成时的不为大家所熟知的临时短语,而成为了准固定短语,例如“机会主义”、“个人问题”等,它们可能继续发展,最终稳定为固定短语。二是由于广泛而高频的使用,一些词越来越多地使用在四字格中,而形成了以这一语素为构成部件的一批词语,具备生成能力也是四字格由临时短语发展为准固定短语的标志之一,如由“目光如豆”的“XX如X”格式生成的新的词“堆积如山”等,“目光如豆”已完成了从准固定短语到固定短语的发展阶段,新生成的“堆积如山”等从临时短语阶段继续发展。又如由“社会主义”等“名词+主义”新产生的四字格临时短语“平民主义”、“精英主义”等。四字格准固定短语的特点是词形较为稳定,意义也比较固定,一部分四字格准固定短语会继续发展为固定短语。
是否被词典收录也衡量四字格是否成为固定短语的参照标准之一。四字格固定短语主要是成语和由准固定短语而发展来的那些词形和意义上都非常稳定的短语组成,这些固定短语的认知度很高,广泛为人们所接收和使用,且多被收入相关词典,如成语词典、现代汉语大词典等。例如,“虎头蛇尾”、“爱国主义”等。
除了从四字格生成和发展的特征,以及是否入典以外,可以判断四字格在从临时短语到准固定短语,再到固定短语的过程中,四字格受到哪些因素的影响,具有哪些特征及固化条件参数,则是本课题要逐一展开深入研宄的内容。
.................................
第二章“名+名”式四字格临时短语的动态分析
2. 1分词标注语料库的建立
2.1.1建库的理念
语料库(corpus)是语言材料的集合,指借助计算机及其相关软件,统计和分析经过科学取样和加工的大规模的文本库。语料库是语言研究的重要基础资源,语言研究者以此为研究手段,科学地展开语言理论和应用研宄。语料库发展至今己经是第三代了。20世纪60年代产生第一代语料库,首个语料库在美国BROWN大学建立,是第一个系统采集英语语料的规模为100万词次的语料库。第二代语料库开始于80年代,以词典编纂为背景,例如英国的Cobuild的语料库规模为2000万词次。九十年代以后,语料库进入了第三代,不仅语料数量达到亿级,甚至万亿级,而且语料也从单语种到多语种,从平行语料库到对比语料库,从局部的抽样统计语料库到大规模的动态流通语料库。这种基于海量真实文本的历时语料库,对语言文字的动态化的进行实时监测,全面生动地反映了最新的社会语言生活。
一个具有一定规模的语料库,能为研究提供大量翔实可靠、鲜活具体的语料,确保研究所采用的材料所具有充分代表性和真实性,从而在很大程度上保证了研宄所得出结论的科学性。采用语料库的研究方法,可使四字格的研究语料更为丰富,内容能涉及生活的方方面面,也更贴近于语言在生活中使用的实际情况。无论是从数量还是从质量上来看,个人关门生造的有限例句完全不能与语料库中的例句相比。
语料库主要分为四种类型,异质的、同质的、系统的和专用的。我们参考国内外相关语料库的建库经验,重点针对本课题主要的研宄目的,综合考虑研究者搜集和处理材料所需的时长、精力等因素,设计了用于本课题研究的汉语四字格分词标注语料库,它属于系统型的语料库,根据预先确定的原则和比例收集语料,使得语料能代表某一范围内的语言事实,可提供语言研宄的数据支持,确保研宄结论的客观性和全面性。
2.1.2语料库的构成
本课题的研究语料不仅包括了词典中收录的四字格,还包括从语料库中自动划分出来的四字格,以及未划分为四字格,但为“名+名”式组合形式的四字格,这些四字格或为未被分词系统识别的四字格固定短语,或为还未完全固化的四字格临时短语。
首先,根据对词典中所收录的“名+名”式四字格静态考察的统计结果,我们发现“名+名”式四字格的主要构成形式是由两个双音节名词组成,因此,在进行研宄时,从语料库中析出的“名+名”式四字格临时短语也以前后相连的是两个双音节名词为析出条件。再次,四字格的使用范围以书面语为主,较少出现在口语中,并且在口语中出现的四字格也没有区分于书面语四字格的明显特征。因此,自建语料库取材于报纸、杂志、各类书籍等书面语的文体,其中不但包含了传统的纸媒的语料,还包括了在当代生活中起着越来越重要作用的网络媒体的语料。希望通过尽量充分的描写和分析,展示出四字格在当代语言生活中的全面而真实的面貌,探索以“名+名”式四字格为主的四字格固化的路径、特征及条件参数。
词典中所收的四字格是现实生活中最常使用的认知度最高的四字格,一般而言,入典的四字格都具有稳定且固定的词形和语义,是为四字格固定短语。它们作为实际语用中四字格的典型代表,其类型和特点也充分代表着实际语用中的四字格的类型和特点。但是,现实生活中所使用的四字格数量庞大,内容丰富,而词典始终要受到收词规模和收词标准的制约和规范,不可能将生活中产生的所有四字格都囊括其中,只能以有限的词语尽量充分地体现出四字格个的共性特征。因此,我们以词典中收录的“名+名”式四字格的研究为基础,以语料库中的“名+名”组合来作为补充,尽量全面和深入地来展现“名+名”式四字格的面貌和特点,以及画化的过程、特征及条件参数。
本研宄建立语料库的目的为研宄汉语四字格的格式和特点等,特别是“名名”式四字格的产生、固化的过程及其固化条件参数。所以在设计语料库的过程中,我们充分考虑并坚持以下的语料抽样原则:
..............................
2. 2语料库的基本数据统计
2. 2.1四字格的频度分析
我们将析出的四字格以年代和属性为分类标准作进一步的梳理,分别从(1) 2010-2013语料,(2) 2000-2009语料,(3) 2000以前的语料中析出频度处于前100的四字格,具体分析这三个时间段的频度在前100的四字格,并以共同出现于三个时段的四字格为重点讨论对象。
..................................
第三章“名+名”式四字格固定短语的静态分析.................................. 80
3.1词典所收录的四字格分析.................................. 80
3.2 “名+名”式四字格的结构.................................. 83
第四章“名+名”式固化四字格的分析
4.1 “名+名”式四字格固化的特征
4.1.1词形结构特征
词形结构特征是四字格最基本的特征之一,只有那些在词形上具有基本的词形结构特征才能成为四字格,进而逐渐固化为四字格固定短语。
四字格固定短语的词形结构特征主要包括:
第一,组成四字格的Ml和N2的组合是稳固的,稳固性即组成四字格的名词不能随意被其他名词替换,四字格内部不可任意调整词序等。如并列式四字格“经史子集”、“张三李四”,偏正式四字格“君子协定”、“社会主义”等,只有极少量的并列式四字格可以调整Ni和N2的词序,而在语义上没有改变,如“海角天涯”和“天涯海角”等。
第二,四字格以一个完整且封闭的四音节词语的形式出现和使用,四字格内部不能插入其他的成分,插入其他成分后构成的词语的语义和原四字格的语义并不对等,如“泰山北斗”并不与“泰山和北斗”对等,“山盟海誓”也不与“山的盟约和海的誓言”对等。四字格内部不但不能被插入其他成分,也不能任意被拆分,绝大部分由四字格拆分以后的词语的语义和原来的四字格语义不对等。只有极少数的四字格能够在一定规则的作用下,产生语义对等的缩略的双音节词形式,如“交通警察”与“交警”,“标点符号”与“标点”等。
4.1.2句法功能特征
四字格固定短语的句法功能特征表现为,四字格具有独立充当句子成分的能力,如能充当主语和宾语等。四字格是作为一个整体来充当句子的某个成分,独立承担句法功能。
四字格能充当主语,如下例中的“数字电视”:
(45)数字电视落户杭州诸多问题未解决(南方周末,2004.04.08)
能充当宾语,如下例中的“官僚主义”:
(46)处理好形式与内容、过程与效果的关系,建立健全各项制度,有效防止和克服官僚主义、形式主义。
(到盛辉,领导干部须戒庸戒懒,人民日报2010. 02. 25)
能充当定语,如下例中的“高峰论坛”:
(47)高峰论坛间隙,主办方会分别安排参会人员与各司局官员和其他‘大人物’进行联谊、互动,并进行合影。
(经济观察报,2010.12.01)
4.1.3词语属性特征
四字格固定短语的词语属性对四字格的固化也有着一定的影响,四字格的词语属性特征主要包括:
第一,四字格的性质是词还是短语;
第二,四字格是离心结构还是向心结构。
4. 1. 3. 1四字格作为词或短语的性质影响其固化
四字格的性质是词还是短语,直接影响到了其在词形和语义上的稳定性,因此,四字格的性质是四字格的固化特征之一。虽然有关词和短语的区分的争论仍客观存在,但获得大家普遍认同的是,词的形态比短语的形态更加稳定。性质为词的四字格比性质为短语的四字格在结构上更稳固。因此,四字格从最稳定的形态到最不稳定的形态,依次为单纯词、复合词、固定短语、准固定短语和临时短语。
四字格中的单纯词数量非常有限,主要是音译词,如阿弥陀佛、盖世太保、罗曼蒂克、嘛里_啦等。复合词和短语的界定比较模糊,在四字格中,其构成成分如果包含有外来语成分,如白金汉宫、基尼系数、阿拉伯人、古尔邦节、哈雷彗星、帕金森病、伊斯兰教等,则这些四字格的性质更趋近于复合词,其结构和语义都比较固定。由临时短语、到准固定短语和固定短语的划分和固化特征及条件参数,则需要在语料库中通过进一步从搭配、词频和分布等的考察和得到的数据来分析和确定。
.................................
第五章结语与展望
5. 1主要研究结论
现代汉语语法研究的一个主要趋势是提高词在句法中的地位。乔姆斯基的句法理论强调词库(lexicon)的功能,将原来由句法来处理的许多信息都直接纳入词库中,认为每个词都带着丰富的句法信息进入句法运算。但是从词到句子的构成,一般还有短语作为一个中间环节,词构成短语,再由短语构成句子。短语系连着表达概念信息的词,并组成具有完整语义的句子。四字格以及其中的“名+名”式四字格以短语形式为主,且大部分的四字格从其产生到固化,都经由了四字格临时短语、准固定短语和固定短语的过程,最终以稳定的词形表达固定的语义,词形和语义之间具有完全对应的关系。
本课题对“名+名”式四字格进行的动态研究,结合语料库分析了四字格临时短语的特点,析出固化特征及条件参数,并结合“名+名”式四字格的静态研究,将固化特征及条件参数逐条进行验证。从四字格临时短语的固化过程研究中主要得出了两方面的结论:
第一,名词和名词的组合是现代汉语中极具表现力的组合类型,不仅数量众多,而且表现形式丰富。这既是由于名词本身所具有的丰富表现力,也是由于四字格的结构形式本身对构成其成分的名词语义的有效刺激,极大增强了四字格的语义表现力,而使得它具有很强的理据性和生命力。
“名+名”式四字格是符合人们思维认知规律的短语形式。首先,名词既是语言中最基础的一类词,也是人们大脑词库中最基础的一类词。Aitchinson (1987)通过心理学实验证明,名词是大脑词库中最稳固和独立的词类,当人们对其他词类的词丧失忆能力时,他们还能记忆起一些名词。一失语症患者被要求描述一间厨房的情景时,他所运用的多是由名词组成的电报式话语,而缺乏动词。对大脑词语的语义结构从语义联系的类型角度进行的分析证明,“名+名”组成的四字格正是语言中最基本的组合形式,不仅具有庞大的数量,而且具有稳固的思维理据。Aitchison (1987)的实验还证明,处于同一语义场中的词似乎是储存在一起的。而且,语义联系最为强烈的是并列结构,包括属于同类的词和具有反义或相对关系的词,前者如salt和pepper,或者red、blue、black等,后者如right和left,hot和cold等;以及搭配关系,如salt water、butterfly net等。在大脑词库中语义联系最为紧密的两类结构,一是包含同类、相反或相近意义的并列结构,二是具有搭配关系,常常表现为偏正结构。并列结构和偏正结构正是构成“名+名”式四字格的两种结构,这证明了 “名+名”式四字格在构词上具有最充分的理据,因为它们的构词形式正是人们思维认知的最基本形式。词语联想试验发现,最普遍的反应是来自同一词类的词语,名词引发名词的状况达到80%,动词和形容词中的状况大概50%。这表明名词和名词间的联系,特别是同一词类中的名词和名词间的联系最为密切。体现在“名+名”式四字格中,同一词类中的名名联想即多反映为并列式“名+名”式四字格,不同词类中的名名联想即多反映为偏正式“名+名”式四字格。
名词是表示事物的一类词,但在实际语用中,名词的的功用除指示事物以外,还有类似形容词的指示事物性状,或是类似动词的表示行为动作,甚至固化程度很高的专有名词也有语义泛化的使用情况。有的名词能像形容词一样受到副词修饰,如“更绅士”、“很雷锋”;有的名词像动词一样直接带宾语,如“他宝贝着老婆”、"别废话了”。在汉语中,已有名形兼类词,如“科学”、“机械”、"规矩”等,越来越多的名词也具有了形容词语义和性质,也有很多名词活用作动词的情况。这是因为名词除了最基础的表示事物概念的语义外,还能由此引申或者比喻得到与该事物性质相关的联想语义,这极大的丰富了名词的表现力,特别是在名词和名词搭配所构成的四字格中,名词和名词的表现力被更多的激发了出来。
第二,通过基于语料库的四字格临时短语动态分析,和四字格固定短语的静态分析,析出并验证了 “名+名”式四字格临时短语固化特征及条件参数。四字格具有的固化特征越多越突出,对固化条件参数的满足度越大,就越容易完成四字格固化,进而发展成为四字格固定短语。
四字格固化特征主要包括基本特征、参考特征和典型特征。基本固化特征包括句法功能特征和语义理据特征中一点,即四字格有充分的语文理据和文化理据。这不仅适用于“名+名”式四字格,而且适用于所有四字格,是四字格成词的基本特征。参考固化特征是判断四字格是否完成固化的参考性因素,并不是主要的判断标准。例如词语属性特征。典型固化特征由于由于其性质重要性和内容丰富性,可被视为四字格固化的条件参数,即词形属性条件参数、语义理据条件参数和使用频率条件参数。
.................................
参考文献(略)
四字格临时词语中“名+名”式的固化探究
论文价格:0元/篇
论文用途:仅供参考
编辑:论文网
点击次数:0
Tag:语言学论文,四字格,固化,条件参数,语料库
如果您有论文相关需求,可以通过下面的方式联系我们
客服微信:371975100