自建语料库的汉英翻译新闻词汇特征分析

自建语料库的汉英翻译新闻词汇特征分析
王立松;赵晗
【摘 要】Lexical feature is one of the most significant features of an essay.Based on two corpora established by the au-thor, the study compares lexical features, especially features of verbs, of Translated English news (TEN) and Non-transla-ted English news (NTEN), which have the same content.The aim is to find lexical differences between TEN and NTEN and to improve the quality of TEN.It is found that compared with NTEN, TEN is moderately difficult and satisfies readers' expectation; lexical Simplification is obvious in TEN; TEN tends to use less modal verbs, tenses and more parataxis cohe-sion.This means translators of TEN should use more modal verbs and tenses and reduce the influence of Chinese news.%用词是行文的一个重要部分,词类差异能够体现出文本的许多行文特征.选取两个自建语料库,对比国内翻译英语新闻与其对应的原生英语新闻词汇特征,重点对比了动词特征,意在探究翻译新闻和原生新闻之间的词汇差异,并提出改进意见.结果表明,翻译新闻有如下特点:一是阅读难度适中,符合读者阅读习惯;二是呈现简化特征;三是情态动词使用不足、时
态使用单一、意合程度较高.因此,在进行国内新闻翻译时应增加情态动词、时态的使用,减少汉语新闻的影响.
【期刊名称】《天津大学学报(社会科学版)》
【年(卷),期】金宏柱2018(020)004
【总页数】4页(P335-338)
【关键词】语料库;翻译新闻;原生新闻;词汇特征
【作 者】王立松;赵晗
【作者单位】天津大学外国语言与文学学院,天津300350;天津大学外国语言与文学学院,天津300350
【正文语种】中 文
【中图分类】H315.9
孙绍聘
随着科学技术的发展,语料库翻译学作为一门新兴学科迅速发展起来。语料库翻译学为研究翻译、语言特征提供了新的视角。它以语言理论和翻译理论为研究上的指导,以概率和统计为手段,以大规模双语真实语料为对象,采用语内对比与语际对比相结合的方法,对翻译现象进行历时或共时的描写和解释,探索翻译的本质[1]。
英国曼彻斯特大学的Mona Baker较早采用了以语料库为基础的分析方法。1993年,她发表了第一本关于语料库翻译学的著作《语料库语言学与翻译研究:启示和应用》。同年,国内的杨惠中教授发表了《语料库语言学与机器翻译》一文,开启了国内语料库研究的篇章。此后,语料库研究方法逐渐开始在语言特征、译者风格、口译等方面得到广泛运用。以语料库为基础的词汇分析主要集中在宏观词汇特征、微观词汇使用、词汇搭配、语义韵等方面。王克非利用北外“通用汉英对应语料库”对翻译汉语不同于原生汉语的词汇特征进行了分析[2]。武光军通过对比2011年我国政府工作报告和美国国情咨文,提出我国政府工作报告应当增加动词、小词等词类的使用[3]。覃梅通过分析汉语新闻翻译及英语新闻翻译的特征,验证翻译共性是否在英汉两种语言中普遍存在的问题[4]。朱一凡和胡开宝以“被”字句为出发点,对比了其在新闻汉译语料和原创语料中的语义韵差异[5]。
一、 研究目的及步骤
1. 研究目的
借助语料库技术,以英语原语新闻为参照语料,以翻译新闻为观察语料,一方面验证Baker等人提出的简化等翻译共性,另一方面在对比中出汉译英翻译新闻的不足之处,提出解决措施,以期提高英语翻译新闻的水平,在新闻方面增强对外宣传能力。广东药学院精品课程
2. 研究步骤
为了将汉英翻译新闻与英语原语新闻进行对比,收集了78篇国内新闻、78篇国内新闻的英语翻译(translated English news,TEN)、78篇同样内容的英语原语新闻报道(non-translated English news,NTEN)。新闻类型广泛,涉及政治、经济、文化、科技、社会等多种题材。翻译新闻和原生新闻均来自权威网站,其中翻译新闻来自爱语吧双语新闻、中国日报、Global times等网站,原生新闻来自dailymail、BBC、mirror等网站。
基于上述材料,笔者自建了两个小型单语语料库,第一个语料库包含翻译新闻,共计20 159个字,第二个语料库包含原生新闻共计17 474个字。
第一步,将这两个文件转为txt文本,命名为和。
第二步,在线用CLAWS7软件对文本进行词性赋码,将赋码后的文本分别复制到新建的两个word文档、两个文本文档中,命名为Tag-TEN.docx、Tag-NTEN.docx、、。
第三步,利用word文档的“查”功能出某一词性的词(如用_N查名词)的个数,除以文档总字数得到这一词性的分布比例。利用wordsmith分析、、、,得到文本的总体特征参数,并形成词频表。
二、 汉英翻译新闻词汇特征
编码的奥秘
1. 总体特征
类符形符比(type/token ratio, TTR)是衡量文本语言复杂程度的标准之一。类符指语料中不同词的数量,形符指语料中所有词的数量。类符形符比比值越高,语料复杂程度越高。但由于一定时期内语言的词汇量是有限的,即类符是有限的,而形符却随着文本大小的变化而变化。文本越长,形符越大,在类符一定的情况下类符形符比越小。因此,比较规模不同的语料库时,常用“标准类符形符比(standard type/token ratio, STTR)”作为衡量标准,即
计算文本中每1 000词的形符类符比。利用wordsmith 4.0的统计功能,得到翻译新闻和原生新闻的数据(见表1)。
表1 翻译新闻与原生新闻总体特征对比项目翻译新闻原生新闻类符数/个4 2674 014形符数/个21 46517 920STTR45.7846.20STTR标准差50.3749.31平均词长/字数55平均词长标准差2.642.62
这些指标反映了文本的词语变化[2]。由表1可知,相比原生新闻,翻译新闻的STTR值较小,但与原生新闻的差距仅为0.4,这表明翻译新闻的词语丰富度虽然低于原生新闻,但差别并不十分明显。这一情况可能是由于本语料库中的翻译新闻均选自国内英语学习权威网站,翻译质量受网站审校人员的严格把关,且一些网站,如China Daily等均有英语母语者作为审校人员,因而译文水平有所保障。从STTR标准差来看,翻译新闻STTR的离散程度要高于原生新闻,表明国内不同网站的汉英翻译新闻词汇丰富度参差不齐,差别较大,而国外网站的用词普遍比国内网站较为丰富。
许伟指出,常见文本的平均词长为4左右,如果远低于4,意味着文章的语言比较浅显,如果高于4,意味着文章的语言比较复杂深奥[6]。由表1可知,翻译新闻与原生新闻的平均词
长均为5,说明两类文本都有一定的阅读难度。这一情况可能是因为两个语料库的语料均出自国内外知名网站,如China Daily、mirror等,这类网站的译者或记者的语言应用能力强,文章质量也较高。但翻译新闻与原生新闻的平均词长仅比常见文本的平均词长高出1个字母,说明两者都在保障文章质量的同时,考虑到了新闻的文体特征,不使用过于复杂的词汇,满足读者的阅读需求。
Halliday指出,词汇密度也是衡量文本复杂程度的一项指标,反应了文本包含的信息量。采用Michael Stubbs提出的计算词汇密度的方法,即计算实词形符包括动词、名词、形容词、副词在总形符中的比例。用CLAWS 7软件对翻译新闻和原生新闻进行词性标注后,对照CLAWS 7 POS Tageset词性赋码集,利用word的查功能计算出两个文本的词汇密度(见表2)。
表2 翻译新闻与原生新闻各类实词频率对比名称翻译新闻/%原生新闻/%差动词16.516.8-0.3名词33.933.80.1形容词8.68.50.1副词3.83.9-0.1实词比例62.863-0.2
Ure指出,词汇密度(实词在总词数中的比例)在口语表达中一般低于40%,在书面文本中则高于40%[7]。而根据UE.COM,词汇密度在60%~70%之间的可视为词汇密度高的文本,
知识与能力训练在40%~50%之间的词汇密度相对较低。由表2可知,翻译新闻和原生新闻均为信息量高的文本。翻译新闻的词汇密度略低于原生新闻,支持翻译共性假设中的“简化”特征。
2. 动词特征
(一) 时态
由表2中的“差”一栏可知,翻译新闻与原生新闻各类实词最明显的差异在于动词的使用。进一步根据CLAWS 7 POS Tageset词性赋码集的动词分类标准,检验各类动词的频率,其中翻译新闻和原生新闻差异最大的前五位动词(见表3)。
表3和表4综合反映了翻译新闻与原生新闻在时态、情态动词运用方面的差异。“动词过去式”代表一般过去时,“过去分词been”代表完成时(过去完成时和现在完成时),“动词原形”一方面与“情态动词+动词原形”的结构有很大关系,另一方面也体现了一般现在时、to不定式的使用,“will”和“would”代表将来时。由表中数据可知,翻译新闻与原生新闻都以一般过去时为主要时态,且两者之间一般过去时的差异最大。返回翻译新闻与原生新闻文本中发现一般过去时的例子如下。
表3 翻译新闻与原生新闻各类动词频率对比名称翻译新闻/%原生新闻/%差动词过去式2.612.400.21情态动词1.071.22-0.15动词原形0.931.06-0.13过去分词been0.190.31-0.12动词ING分词形式1.931.820.11
表4 翻译新闻与原生新闻情态动词频率对比情态动词翻译新闻/%原生新闻/%差will0.560.500.06would0.140.22-0.08can0.180.23-0.05could0.040.10-0.06must0.040.05-0.01may0.020.05-0.03should0.030.020.01shall00.01-0.01

本文发布于:2024-09-21 17:44:24,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/227913.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:新闻   翻译   原生   动词   语料库   文本
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议