本文是一篇语言学论文,本文基于语料库,以配价语法、格语法理论为指导,从语料库中选取三价动词谓语句,对句子进行句法成分、语义角色、名词语义手工标注,构建了“三价动词谓语句主语、宾语对应的语义角色信息库”。
第一章 语料的筛选与加工
1.1语料的筛选
在蒙古文信息处理工作中,依据语料库的数据统计来归纳总结其规则是必然和必需的。因此,加工语料库就成为一个必不可缺少的环节。探讨句子结构与语义角色之间的对应关系时,对所选语料进行词法、句子成分、语义角色、名词语义类标注加工,区分出动词谓语句的句子成分,是自然语言处理工作中的一项基础性工作。
论文所利用的语料是“一百万词级现代蒙古语语料库”(下文简称为100万标注语料库),从中选取了三价动词谓语句。三价动词是指在语义上支配三个必有的语义成分。主要表示人、动物行为的词和使动态变体的一组词[1]。
对语料标注句子成分和语义角色标注时,语料应具备以下四个要求:
筛选语料时的三价动词的词汇意义:探究语料库中的三价动词时不难发现,该类动词在蒙古语语义表达中除了基本词汇意义还有很多基于共有语义特征的派生义项。但在句法与语义关系对应研究中我们所需语料中筛选出的三价动词必须是用于基本词汇意义。例如,《搬动》义动词中包括[拿去、放]等动词,《使某物搬到一定的位置》是这些动词共有的语义特征。但是,《放》一词中,在蒙古语中含有多个义项,如留头发“ᠡᠵᠢᠡ ᠲᠠᠯᠪᠢᠬᠤ ”、演讲“ᠶᠠᠷᠢᠶ ᠠ ᠲᠠᠯᠪᠢᠬᠤ”、死去“ᠠᠮᠢ ᠲᠠᠯᠪᠢᠬᠤ”等。
1.1.1本文仅选用基本意义的动词。例句᠄ []C0LM0N/Nt1{Nbba1123}{sbj}{uid} deNG/Ne1 N0C0G_A/Ve1+JV/Fn1 ,/Wp1 NIDU/Ne1+N/Fc8 SIL/Ne1-IYEN/Fx11{Nbbu2}{obj1}{hur} AB/Ve1+CV/Fn1 HAJAGV/On-DAGAN/Fx31{abd}{0r0} TALBI/Ve1+GAD/Fn2(朝鲁门点了灯,摘下眼镜,放在旁边…)
1.1.2.三价动词的句子成分:三价动词在句子中一般充当谓语成分。例句᠄ TERE/Rj UY_E/Ne1-DU/Fc21 ,/Wp1 TA/Rb{sbj}{uid} NADA/Rb{obj2}{edl} NELIYED/Dx Y0S0/Ne2-YI/Fc31{ Nbhy3}{obj1}{hur} SVRG_A/Ve1+BA/Fs14 ./Wp1(那时,您教会我很多道理。)
............................
1.2 语料加工
1.2.1句子加工
1.2.1.1标注句子成分
从100万标注语料库中,筛选典型三价动词谓语句子分析出三价动词谓语句中的主语、宾语对应的语义角色进行统计,并加以解释说明其中的对应关系。
(1)标注主语成分
例句:[]GEREL/Nt1{Nbba1123}{sbj}{uid}DEBTER/Ne1-IYEN/Fx11{Nbbu2202}{obj1}{hur} []C0G/Nt1-TV/Fc21{Nbba1123}{obj2}{edl} OG/Ve1+GO/Zs1+GED/Fn2(格日乐把书给了朝克……)
(2) 标注直接宾语成分
例句:EHE/Ne1 NI/Sf{Nbba1127}{sbj}{uid} SERIGULGETU/Ai CAG/Ne1-IYAN/Fx11{Nbbu21}{obj1}{hur} TEGUN/Rb-DU/Fc21{obj2}{edl} OG/Ve1+BE/Fs14 (母亲把闹钟给了她……)
(3)标注间接宾语成分
例句:ABV/Ne1-YIN/Fc11 SAGV/Ve2+DAG/Ft21 BAG_A/Ac MASIN/Ne1-IYAR/Fc51{Nbbu211}{obj2}{bag} CIMAYI/Rb{obj1}{hur} GER/Ne1-TU/Fc21{Nob22 }{abd}{0r0} CINI/Sf HURGE/Ve1+Y_E/Fb11 (用爸爸的小汽车送你回家。)
.................................
第二章 “三价动词谓语句主语、宾语对应的语义角色信息库”的构建
2.1建立信息库的方法与过程
该信息库的构建主要以“面向信息处理的蒙古语动词语义信息库”在100万标注语料库中出现的三价动词谓语句子作为研究对象。筛选出的三价动词作为谓语句的词,是以基本意义出现的句子。其中以基本意义出现的三价动词有72个,筛选的句子有3394个,笔者对此进行了标注和加工。具体步骤如下:
(1)从100万标注语料库中选取了三价动词谓语句子。
(2)选取了三价动词基本意义。
(3)选出了含有主语、宾语的句子。
(4)以文本格式存储了句子成分、语义角色、名词语义类标注。
(5)文本格式存储的语料保存至Microsoft Excel 2016中,设制属性字段并填写相应属性取值。
..............................
2.2“主语、宾语对应的语义角色信息库”的属性字段及属性取值
“面向信息处理的蒙古语动词语义信息词典”中选取三价动词后,从100万标注语料库中筛选基本意义出现的三价动词谓语句,再以选句规则来确定最终使用的句子。该信息库中以基本意义出现的三价动词谓语句有3394个,其中主语句有2032个,直接宾语句有2401个,间接宾语句有924个。对选取的句子进行人工标注句子成分、语义角色、名词语义,并建立信息库。构建的主语、宾语对应的语义角色信息库如图2.2.1、2.2.2所示。
语言学论文怎么写
...................................
第三章 三价动词谓语句主语、宾语对应的语义角色特征分析 .........................................21
3.1 主语对应的语义角色特征分析 ........................................ 21
3.1.1主语对应的语义角色词类特征 .................................. 21
3.1.2主语对应语义角色的语义类特征 ................... 26
结论 ............................ 57
第三章 三价动词谓语句主语、宾语对应的语义角色特征分析
3.1主语对应的语义角色特征分析
该部分基于“三价动词谓语句主语对应的语义角色信息库”与主语对应的语义角色特征进行研究。语义角色特征的体现不仅要研究句法对应语义角色关系,也要研究充当语义角色的词类特征、语义角色标志形式特征、语义分类特征。因此,基于笔者加工的语料库进行统计分析,得出结论:从语料统计的结果来看,主语对应的语义角色有施事、当事、使事、主题、与事、受事、涉事等。
3.1.1主语对应的语义角色词类特征
3.1.1.1主语对应施事角色
施事是有意发起动作行为的主体。因此,主体可以是人、国家、机关、团体。因为是动作执行的主体,所以与谓语动词有密切的关系。其中谓语动词涉及自动态、互动态、同动态、众动态。
(1)主语对应名词性施事角色
名词包括人物、事物、现象、动作、变化发展、状态、关系、特点、事物命名的名词。该语料库中主语对应名词性施事角色的例句有1209个。
例句:GETEL_E/Cr UDE/T B0L/Vz2+HV/Ft12-DV/Fc21 []JIRGAL/Nt1{ Nbba1123}{sbj}{uid} UNEHER/H TAMAHI/Ne1+N/Fc8 HAYIRCAG/Ne1-TV/Fc21 VGSARA/Ve1+GSAN/Ft11 SIN_E/Ac RADI0%/Ne1-YI/Fc31{Nbbu212}{obj1}{hur} ABAG_A/Ne1-DAGAN/Fx31{Nbba1127}{obj2}{edl} BELEGLE/Ve1+JEI/Fs11./Wp1(到晌午时分,吉日嘎拉果然把连接的新收音机送给了叔叔。)
(2)主语对应代词性施事角色
主语对应代词性施事角色的例句有613个。
例句:BI/Rb{sbj}{uid} SAR_A/Ne1 BORI/Gx CIM_A/Rb-DV/Fc21{obj2}{edl} JAGV/Mu+N/Zx FRANGK/Ne1-VN/Fc11 YEHE/Ac HUU/Ne2{ Nha2}{obj1}{hur} OG/Ve1+GO/Zs1+Y_E/Fb11 (我每个月给你约一百法郎的利息。)
语言学论文参考
................................
结论
本文基于语料库,以配价语法、格语法理论为指导,从语料库中选取三价动词谓语句,对句子进行句法成分、语义角色、名词语义手工标注,构建了“三价动词谓语句主语、宾语对应的语义角色信息库”。在此基础上,对构建的信息库统计分析了主语、宾语对应的语义角色及语义角色特征。下面将本论文的研究内容及其相应科研成果,从以下三个方面来概括:
一、基于语料库建立了“三价动词谓语句主语、宾语对应的语义角色信息库”。
二、借助“三价动词谓语句主语、宾语对应的语义角色信息库”对主语、宾语对应语义角色进行了统计分析。根据信息库中的信息统计得出,主语对应施事、当事、使事、主题、与事、受事、涉事等语义角色。其中,主语对应施事的概率最高,占主语句的91.34%。与主语对应的语义角色大多出现在主体,在客体上的体现较少。直接宾语对应受事、涉者、与者、施事、共事、处所、范围、目的等语义角色。直接宾语对应受事语义角色概率最高,占直接宾语句的95.63%。从统计可知,直接宾语对应的语义角色多数情况出现在客体中,领体出现较少。间接宾语则对应比事、工具、与者、任者、受事、释事、施事、当事、共事等语义角色。间接宾语对应与事语义角色的概率最高,在间接宾语句占76.05%。从以上数据可以得出间接宾语对应的语义角色大多以客体形式出现,主体、领体较少。这也表明主语、直接宾语、间接宾语可以表达多种语义角色,但在表达不同语义角色时会受到不同程度的限制。
三、主语、宾语对应的语义角色特征中,分别对充当语义角色的词类特征,名词语义类特征,语义角色标志形式特征等进行了案例分析。
参考文献(略)