第一章 绪论
1.1 研究背景
“当今时代更为精确的定位应该是翻译时代(translation age),而不是信息时代”(陈伟,莫爱屏,2014:311)。机器翻译无法完全代替译者,但在大数据时代下,随着信息与互联网技术的发展,翻译研究的视野不断扩展,翻译需要被重新定位和定义(谢天振,2018),机器翻译将重构翻译业务和翻译形式(崔启亮,2018)。
典籍英译与机器翻译技术结合是典籍英译研究新趋势。“近二十年来,随着计算机科学、计算机语言学、互联网、大数据和云技术的快速发展,翻译技术也突飞猛进”(刁洪,2017:19)。机器翻译在语料库的基础之上对信息类文本能达到较高的匹配度,实现较准确的翻译。随着中国经济发展和“一带一路”战略的实施,语言服务进入了空前飞速发展的时期。在此背景下,不管是国家层面还是学术界(主要指语言学和计算机)都对语言服务和翻译技术给予了高度的关注。“基于大数据技术的古代文学经典文本分析与研究”[1]、“一带一路”语言文字研究和语言文字信息技术研究等相继进入学术视野,成为应用翻译领域的讨论热点议题[2],在此过程中,机器翻译需求的大量增加,机器翻译质量测评需求也相应地快速增长。国内外计算机专家也开始高度重视汉译英技术的研究及汉译英机器译文的质量测评[3]。在社会各界的努力下,一方面,我国汉英翻译技术取得了较好的发展,具有一定的国际影响力;另一方面,汉英翻译技术成为了国内外研究的热点和焦点。
人工智能和大数据的神经网络翻译技术问世之后,机器翻译效率高,训练模型也考虑到了句法、语义等信息,神经网络机器翻译质量获得大幅提升。神经网络翻译系统通过采用 34 种风格迥异的圣经译文版本,最终将能够把任何文本转换成适合不同受众偏好和水平的文体(Keith Carlson, Allen Riddell, Daniel Rockmore,2018)。这意味着只要高质量的人工译本足够多,机器翻译便可以为读者提供不同风格和水平的译文。莫爱萍(2015)指出,人类社会的发展向来没有排斥过工具的利用。在翻译技术史上,计算机辅助翻译对非技术类文本的应用从被否定到逐渐被接受,到当下广泛与高质量的机器翻译结合产生的译后编辑的模型(采用“机器翻译机辅工具译后编辑”);从技术类文本的翻译拓展到一些非技术文本的翻译,翻译技术显示了应用价值。可见,学术界从“人工翻译能不能被机器翻译取代”的讨论已经悄悄转移到了“如何突破机器翻译的语言障碍”的讨论。因此,在人工智能、自然语言处理技术、神经网络翻译技术的大数据时代下,“新技术的发展为机器典籍带来哪些便利”,《论语》作为中华文化典籍的精华和代表,“是否该顺应机器翻译的发展”与人工译文相比,“典籍的机器译文的可接受性怎么样”等等成为典籍英译的研究亟待回答的问题。
...........................
1.2 研究问题与研究假设
本研究基于可接受性视角下机器翻译和典籍英译的基础上,以可接受性理论为指导,将文本外的读者因素和文本内的译文质量作为两个重要因素,建构一种基于语篇的可接受性评估模型。并将此应用于实际读者对译文可接受性调查。本文将《论语》译文读者分为外国读者和中国读者,外国读者母语为英语,为目的语读者,主要是来自孔子学院的学生及在华留学生和外教;中国读者为从事多年英汉翻译研究的多所高校教师,具有一定的学术水平。本文对读者可接受度调查数据进行总结、归纳,结合文本比较进一步回答研究问题。通过定性与定量分析相结合,最终得出中华典籍机器译文的可接受性评估结果。本文认为“可接受度”具有测量意义。因此,在读者调查的数据分析中,本文采用“可接受度”的表述;在机器译文综合评估之后,本文采用“可接受性”的表述。
本文的主要研究问题和假设如下:
1. 译文读者对《论语》机器译文的可接受度如何?
1) 外国读者在词汇、句法、语义和主旨对《论语》机器译文的可接受度如何?
2) 中国读者在词汇、句法、语义和主旨层面对《论语》机器译文的可接受度如何?
3) 二者对《论语》机器译文在词汇、句法、语义和主旨层面可接受度差异如何?
假设 1:读者对词汇、句法、语义和主旨的可接受度与译文整体可接受度有相关关系。
2. 二者为什么会出现这样的可接受度?
假设 2:译文读者对词汇、句法、语义和主旨的可接受度基本能解释译文的整体可接受度,可接受度评估模型有效。
3. 如何提高机器英译典籍的可接受性?
..............................
第二章 文献综述
2.1 机器翻译的可接受性研究
根据描述翻译学的划分,对机器译文进行可接受性评测属于狭义的翻译批评,即翻译质量测评,是应用翻译研究。换句话说,机器翻译的可接受性研究是机器译文质量测评的一个重要方面。“机器翻译的发展带来了机译评测的进展,同时机器翻译质量的评估又促进机器翻译的发展”(张卫晴,张政,2008:13)。“语言与机器的品质与前景需要深入研究与评估”(刘满芸,2016:17)。
虽然机器翻译的效率远远大于人工翻译,但翻译质量远远不及人工译文。随着大数据和语料库的发展,这么短时间产生这么多机器译文,其质量如何?用户(读者)对这些质量参差不齐的译文可接受性如何?有翻译就有翻译批评(狭义上翻译批评指翻译质量评估)。随着机器翻译的发展,“机器翻译质量评析”(秦颖,2018)也引起了学术界的广泛关注。在跨文化交际日益频繁的翻译时代,许多机器翻译质量评估者往往忽略了译文的可接受性。这主要是因为机器译文质量测评并非易事。机器翻译质量评估首先必须回答“什么是好的译文”,其关键在于“制定质量评价标准”(黄海英,冯剑军,2008:29)。然而从机器译文可接受性的研究成果上来看,“现有研究主要集中于质化评价,量化评价研究数量不多”(王金铨,万昕,董子云,2018:73)。在质化评价上,学术界关注非文学文本(如科技文本)机器翻译的译后编辑”(崔启亮,李闻,2015),通过一些译例挑错分析和比较(如樊蓉,2018,刘付广,2018,赵晨,2018 和邹启立,2014 等),从而分析得出机器译文的可接受性,“通过一些译例分析、比较,可说明强调标语英译文可接受性的必要性;可从语义、句法、声韵及文化内涵等方面提高标语英译文的可接受性”(朱艳卿,2006:60)。,这些研究“仅提出一些指导原则,既没有就译文的可接受性或质量的不同级别制定标准,也没有提供可用于 TQA 的工具”(刘亚猛, 2018: 13)。如“评价者应该是什么人或具有什么条件”、“错误的性质及程度应如何划分”、“评估应基于全文还是抽样,如何抽样”、“如何量化质量”等比较实际然而对机器翻译质量可接受性的构设及应用十分关键的问题,缺乏系统地研究。
............................
2.2 典籍英译的可接受性研究
国内外翻译界的交流与互动频繁,汉学研究与汉学翻译密不可分,使得典籍翻译理论日渐成熟。“但是我国典籍翻译的理论和实践研究远远落后于西方发达国家,忽略了翻译学的跨学科和跨领域发展”(董丽丽,2018:181),其中典籍翻译与机器翻译领域相结合的研究探讨鲜为少见。
国外对机器翻译典籍的可接受性研究尚不多见,主要集中在对机器译文质量的评估研究以及就机器译文的改进策略方面。在机器译文质量评估上,主要分为机器测评和人 工测评。在先前评估译文质量使用最广泛的方式是 BLEU( Papineni et al. 2002),其具有快捷、廉价和客观的特点。但是,在研究机器译文错误时发现,这种机器的方法存在一些缺陷,比如 BLEU 只能把握译文的某些特定方面,如词汇的相似性、准确性(Snover et al. 2005)。并不能很好地测试句法的翻译(Och et al, 2003),并且基于人工译文的句法语言模型能够更好地提高机器翻译质量(Charniak et al, 2003)。后来,Callison-Burch et al. (2006) and Koehn and Monz (2006) 用实例比较了机器自动测评译文质量的方法之后,提出了人工测评机器译文质量。由于机器测评只是单纯从语言的角度进行评估,并没有和实际的读者存在互动。因此,本文对可接受性的研究主要采用人工测评的方法。“对于目的语读者的可接受性调查,完形填空是一个不错的测试方法”(奈达,2002),也可以“将读者对文本产生的反映分为输出型和审美性两种”(Rosenblatt,1994、1995)。为了测试读者机器译文质量的可接受度,可把机器译文、编辑后的机器译文和人工译文让读者分别对其进行打分评估。
国内学者主要从机译典籍的适用性、机器译文可接受性两方面对机器典籍英译进行了探讨。在机器翻译典籍的适用性上,姚振军(2006)对机器翻译典籍做了初步探讨,指出中医语言的特点适合机器翻译,中医翻译的特殊程序使得采用受限语言成为可能,强调机器翻译对于特定领域的典籍翻译有一定的帮助性。屈亚媛和周玉梅(2016) “对机器译文和人工译文进行平行语料对比研究”(罗季美,李梅,2012:84),指出尽管机器译文翻译译学典籍的双字格术语会出现望文生义、主语不全等问题,但并不否认机器翻译对典籍翻译的有效性。包凯(2017)对谷歌翻译汉译英“具有类型化和高重复性的特征”进行分类、总结,并在其在词汇、句法和符号等翻译处理上提出了针对性的纠错方法,为提高英汉机器翻译质量和效率提供了语言分析基础。曹剑和李丹(2011)从奈达的功能对等理论看机器翻译译文的可接受性,主要考虑三个方面: 确保信息的等量传递、充分考虑译文接受者接受力、实施译后编辑。
..................................
3.1 可接受性理论 ...................................... 13
3.1.1 国内外学者对可接受性的研究 .................................. 14
3.1.2 本文的可接受性的界定 ................................... 16
第四章 研究设计与方法 ....................... 22
4.1 读者对象 ...................................... 22
4.2 研究工具 ...................................... 24
4.2.1 语料 .................................. 24
4.2.2 机器翻译系统 .............................. 26
第五章《论语》机器译文的读者可接受度调查 .............................. 30
5.1 可接受性视角下的《论语》英译文读者水平调查 ........................... 31
5.2 《论语》英译机器译文的读者可接受度调查 ............................... 38
5.2.1 词汇层面 ..................................... 39
5.2.2 句法层面 ................................... 41
第六章 基于读者可接受度的《论语》机器译文质量评析
6.1 《论语》机器译文与人工译文对比分析
机器译文与人工译文的对比是建立在可接受性理论框架下文本内的词汇、句法、语义和主旨四个层面的基本特征和基于翻译对等策略的错误类型对比之上的。翻译策略影响翻译效果,机器翻译与人工翻译所采取的翻译策略不同,因此导致产出不同的翻译文本。当读者接触这两个译本时,自然产生不同的读者反应或效果,进而影响整体译文的可接受性。当机器翻译采用与人工翻译不同的翻译策略或不能高度模仿人工翻译策略时,则会导致机器翻译错误。机器译文错误包含词汇错译、句法错译和符号错译三大类(韩娜,2018),罗季美等(2012)考虑科技文体的特征后(如标点符号、物理学单位)加入符号错误。把不同文体输入机器翻译软件得到机器翻译译文,通过参照或不参照人工权威译文对机器译文进行挑错,然后把错误归类到词汇、句子、语篇三个层面上。这种做法的缺陷是“只见树木,不见森林”。
本文认为机器翻译错误的原因在于机器认知能力与人工认知能力的差异,即机器翻译和译者在追求形式对等和意义对等的翻译标准上采取了不同的翻译策略。机器翻译采取错误的翻译策略(翻译算法),所以造成机器翻译错误。本文在机器翻译错误类型的成果上,加入机器翻译与人工翻译的翻译策略比较,从本质上揭示机器翻译与人工翻译的差异。此外,机器翻译错误也有程度之分,本文认为语言错误比符号错误更有讨论意义,同时因为精力有限,本研究只比较机器译文与人工译文在词汇、句法、语义和主旨四个层面上的差异,对属于格式错误的符号翻译上错误的差异不做讨论。本文参考了钟书能《汉英翻译技巧》、陈宏薇《汉英翻译教程》、冯庆华《实用翻译教程:英汉互译》三本书对翻译策略的讨论,结合机器翻译错误分类,对比人工译文的翻译策略,分析机器翻译在汉译英的过程中由于采取了不同的翻译策略而导致在词汇、句法、语义和主旨四个层面的错误。
............................
第七章 结语
7.1 本研究的结论与创新之处
本文从典籍《论语》文本特征出发,以可接受性理论为依托,对可接受性的定义进行了重新界定,并将读者纳入机器译文可接受性的评估模型中,提出基于读者的典籍译文的可接受性评估模型。
本文的可接受性是指读者基于原文和参考译文,对译文的形式和意义是否理解和是否接受,既考虑文本内的译文质量因素,又考虑文本外的读者因素。本文将《论语》译文读者分为外国读者和中国读者。外国读者为目的语读者,母语为英语,主要是来自孔子学院的学生、在华留学生和外教;中国读者为从事多年英汉翻译研究的多所高校教师,具有较高的学术水平。本文选取了刘殿爵的《论语》译本作为“参照译文”,让译文读者对机器译文分别从词汇、句法、语义、主旨和总体可接受度进行打分评价。以针对性的问卷调查、访谈为手段,调查了《论语》机器译文在外国读者和中国读者中的接受情况。接受测试者包括外国读者 32 名和中国读者 37 名。通过数据分析和文本比较,宏观与微观相结合,定量与定性相结合,深入且系统地探讨了中国读者和外国读者对机器翻译典籍译文的可接受性差异,以及其差异形成的原因;并在其分析的基础上,为机器翻译典籍研究和中华典籍文化的外译提供建议和策略。
参考文献(略)