从主流机器翻译软件工作原理角度探究机器翻译的优缺点——以对比


2024年1月2日发(作者:金山股份)

第11卷第3期吕梁学院学报Vol.

11

No.

20x011

of

Luliann

University2021年6月Jun.

7021-语言学研究-从主流机器翻译软件工作原理角度探究

机器翻译的优缺点——以对比百度翻译与人工翻译译文为例白一博(北京外国语大学英语学院,北京100089)摘要:机器翻译软件在翻译实践过程中得到广泛运用,机器翻译和人工翻译译文质量的差别是翻译研究

领域的热点话题,为了研究这一问题,作者选取了一篇北京外国语大学英语学院翻译系学生在大四阶段翻译的文

章,并使用主流机器翻译软件百度翻译对原文进行重译之后,从百度翻译工作原理方面对两篇译文进行对比分析。

分析结果显示:人工神经网络机器翻译软件在保留政治内涵、分析隐含逻辑能力方面表现欠佳;而在表达方面较为

自然。关键词:机器翻译;人工翻译;译文质量;9度翻译中图分类号:H315.9

文献标识码:A

文章编号:2095

-185X(2021)03

-0013

-04在人类发展史中,科学技术的作用是无与伦比

的。马克思主义生产力学说明确指出,科学技术是

第一生产力[1]0在当前的翻译行业中,机器翻译的

蓬勃发展深刻改变了我们目前的翻译方式。作为人

机器学习、大数据等技术在提升机器翻译质量的同

时,也整合了翻译市场、人才、数据等资源,逐渐实现

了“语言服务的规模化和全球化”[]。一、语料的选取和翻译软件的选择为了探讨机器翻译与人工翻译的优劣,本人作

工翻译的替代品,机器翻译软件在许多翻译实践中

都发挥着重要作用,大大提升了翻译工作的效率。机器翻译,又称计算机翻译,是指利用计算机将

了以下语料的对比研究。(一)语料选取一种语言符号转换成另一种语言符号。机器翻译这

一概念起源于22世纪30年代,在近一个世纪的发

展过程中主要经历了四个发展阶段:基于规则的机

选用作者于2216年翻译的文章《Wher

tUe

A­merican

"Bull”

BreaCs

inte

tUe

china

shop

of

"16

+

5

Cooxeratiox”》①作为例文(当时作者为北外英语学

器翻译、基于统计的机器翻译、基于实例的机器翻译

和基于不同方法应用的机器翻译[2]。而在目前的

基于不同方法应用的机器翻译阶段,机器翻译软件

和工具可以分析前三种翻译方式的优缺点,之后综

院翻译系大四学生)o选用这篇文章的原因有三

点:第一,本文原文《当美国“大象”闯入“16

+

1合

作”的“瓷器店”》刊载于2216年第六期的《世界知

识》中,因此原文质量是有保证的。第二,这篇译文

发表于中国-中东欧研究院,因此译文质量也

合运用多种方式对文本进行翻译。机器翻译领域的一大特征是与新兴科技的紧密

是有保证的。第三,作者在翻译原文时在读大四,北

京外国语大学(北外)是教育部直属、首批“211工

结合。例如,许多机器翻译软件可以利用互联网,获

取相关的语言资源实现在线同步翻译[];云计算、

程”高校、“

995

”优势学科创新平台高校、首批“双一收稿日期:2021-01-13作者简介:白一博(1992

-),男,山西太原人,在读硕士,研究方向为英语口语。①

chma-cee.

eu/■^-00—0—/upy)ans/2019/04/Worama_paper-221902-Fena-0honapma-Chen-Xid-Xu-Gang.

pdf.13

流”建设高校①。自22世纪55年代开始就开始开

chint

shop

of

"16

+

1

Cooperation设翻译课程,并分别于1993年和2201年开始设置

本科阶段的笔译和口译方向。2007年在英语学院

【MTTT1

】When

Ameacan

"aephni”

breaki

into

"16 +

1

cooperationpoaPdin

shop下设翻译系,开始在全国范围内招收翻译专业本科

生⑷。英语学院翻译系的课程设置包括四个方面,

即“外语技能、母语修养、翻译实践和学科素养”⑷。

翻译专业课程基本都设置在本科前三年,因此,这段

时间的译文较能体现翻译系本科学生的翻译水平。我们可以看出,百度翻译对原文的处理过于直

译,而且没有识别出“大象闯入瓷器店”这里的文化

内涵。这一短语起源是1816年阿美士德(Amherst)

奉命出使中国,代表英国政府与清政府进行贸易洽

谈,但最终因叩头行礼问题未能达成贸易约定。英

国媒体于是创作了一篇名为A

Bull

in

n

China

STop

(二)百度翻译百度翻译是百度公司于2211年6月推出的基

于互联网大数据的机器翻译系统。它支持包括汉

语、英语、日语、德语等200多个语言互译,是国内市

的漫画,讽刺阿美士德把出访搞得一团糟。此处的

Bull”既指粗鲁的公牛,又指英国(约翰牛是英国的

形象化、人格化代表),而“China”既指易碎的瓷器,

又指中国。后来,这句短语被用来形容举止粗鲁,搞

场份额第一的翻译类产品。除了使用量最大的百度

翻译网页版,它还拥有APP,小程序等多种产品形

态,可以为用户提供文档、网页、图片、拍照、语音等

砸一切的人。显然,百度翻译在此处未能识别原文的文化意

向,译文出现了偏差。其原因是,人工神经网络并未

能识别出此处“大象”与英文“bull”意象的对等关

系。在人工神经网络在语料库学习过程中,也鲜见

“美国'大象’”或“American

bull”的搭配,因为正如

多模态的翻译功能。除了机器翻译功能,百度翻译

还可以提供离线的牛津和科林斯词典,方便客户查

阅单词②。百度翻译属于人工神经网络系统,通过拥有海

量结点的深度神经网络,使计算机先自动学习语料

库中的翻译知识,再自动理解语言和生成译文⑶。上文所言,俚语“

bull”所指的是英国。可见,人工神

本文选择网页版的百度翻译来测评机器翻译软

经网络在此处的学习和处理存在不足。【ST2】我刊邀请了三位专家就此进行了交流与

件的汉译英译文质量。原因有三点:第一,百度翻译

在国内所占的市场份额最大,拥有较大的客户体,

讨论。③【TT2】

We

invitep

three

experit

to

discast

and

ex-

说明其经过了多次实践检验。第二,网页版无需下

载,且翻译文本的功能和其他版本相同,使用较为便

捷。第三,作者在翻译实践中曾使用过不同的机器

chanae

inec

op

thic

issue.【

MTTT2

We

iavitee

three

expertc

to

exchanae

翻译软件,百度翻译给作者的体验最好。二、译文质量对比(一)

质量评判标准从上文的选择材料理由可知,本文的人工翻译

译文质量是具有一定保证的,因此,在此次对比分析

viewc

op

this

issue.原文中的“交流与讨论”其实是中文中的习惯

搭配,表达的意思就是交换意见。我们可以看到此

处人工翻译和百度翻译都把握了原句含义,但不同

的是,百度翻译更加简洁,因为"exchange

views”就

中,笔者以人工翻译译文为基准,从内容是否完整正

确、逻辑是否流畅和语言是否规范三个角度来进行

包含了”

discuss”的过程,所以此处笔者认为百度翻

译更胜一筹。笔者猜测,百度翻译在这一部分更加

质。出的原因是:这句话在很多采访或新闻稿中频繁

有大

照《

百度翻译的

产品介绍也指出,软件会先学习语料库,之后再匹配

(二)

实例对比分析此部分的ST为原文,TT为人工翻译译文,

MTTT为百度翻译译文。对照给出译文。而人工翻译查阅对照语料库的能力

【ST1】当美国“大象”闯入“16

+

1合作”的“瓷

器店”【TT1

】When

the

American

"

Bull”

Breaks

into

the

则是相对较弱的。【ST3】从蓬佩奥的行程安排和种种表态来看,

美国“重返”中东欧的意图是很明显的https

://www.

bfsu.

edu.

ca/”

://bnir.

baidu.

com,/item,/%E7%99%

BE%

E5%

BA%

A6% E7%

BF%

BB%

E7%AF%

91.这一句在《世界知识》上刊载的原文是没有的,但客户给译者的原文中确实包含这一句。14

【TT3

]

Wc

coxlt

tell

from

Pompee

'

s

visiting

$0^111”

and

opinions

tUaf

tUe

US

has

an

obviousmten/ou

to"bnch”

te

Central

and

Eastem

Eukpe

【MTTT3

]

Judging

from

pompr'

s

itideram

and

statements,

tUe

inten/ou

xX

tUe

States

te''mtum”

te

06^1'31

and

Eastea

Eumpe

is

oXvioxs通过语法分析我们可以看到,百度翻译的译文

出现了主语和伴随状语主语不一致的情况,“the

in­tention"

并不是“judging

from"的主语,因此在语言和

逻辑方面是较为混乱的,但意思的传达方面整体还

是清楚的。作者推测,百度翻译在这一例中出现语

法错误的原因和上一例中翻译出的原因其实是一

致的,都是基于对语料库的分析给出的译文,但这一

句的问题就出在了关系从句和主句之间的逗号上。

笔者认为,百度翻译的句段划分是以标点符号为界,

逗号分隔开的两个小句也会被处理成两个句段,之

后分别在语料库中进行分析处理,这就引发了语法

错误。为了验证这一猜想,译者将原文逗号删去,重

新使用百度翻译,此次的结果为"Judging

from pom-

Pux

itideram

and

vvnons

statements,

it

is

oXvioxs

tUaO

tUe

United

States

intends

te

4

mtum

'

te

central

and

Easteo

Europe”。虽然这一结果的逻辑主语仍是错

误的,但我们可以看到后半句采用了形式主语,这和

保留逗号时给出的译文结构是有明显差异的,所以

作者认为上文的猜想是部分正确的。现在几乎可以

确定百度翻译以逗号为句段的最小拆分符号,但此

句机器翻译错误的根本原因还是在于不能像人工一

样确定"judging

from"的主语,因为原文中这个逻辑

主语是省略掉的。【ST4】2月65日为科索沃单方面宣布独立纪

念日【TT4

】Kosove

unilaterallp

announced

Fenmam

17th

as

i/

Indenendence

Dap【MTTT4

]

Fa^mdm

65

is

tUe

anniversaro

of

Kose-

ve

-

s

unilateral

declaration

of

indenendence这一句话的人工翻译和百度翻译译文在逻辑和

表达方面都是通顺的,唯一的区别为传递的内容有

细微的差别。作者初译这段文章时,给出的译文和

百度翻译译文是几乎一致的,但后来经过查证相关

资料和独立思考后将译文改成了

TT4的形式。改

动的原因是,作者敏锐地意识到科索沃是一个主权

存在争议的地区。塞尔维亚认为科索沃是其境内一

个高度自治的自治区,但科索沃却宣称自己是一个

独立的国家。两方在国际上都有许多的支持者,而

中国政府的立场是支持塞尔维亚对科索沃地区享有

主权,因此在翻译这句的时候需要格外注意政治立

场的问题。虽然原文提到了“单方面宣布”,但百度

翻译译文中的"unilateral

declaration

of

indenend-

会给读者带来一种既成事实的感觉,这其实是

不符合中方立场的。因此,作者经过分析资料以及

询问相关领域研究人员后,决定将译文改成TT4的

形式,只表明2月15日是其所谓的"Independence

Day”,但丝毫不涉及科索沃是否是独立的国家。综

上,百度翻译此处对原文的把握是没有问题的,但是

却反应了机器翻译无法考虑政治立场、意识形态对

语言表达的影响,在这一点上人工翻译是要远远优

机器翻译的。【ST5】美国承诺,若马其顿方面做出让步,将尽

快帮助其实现入约【TT5】

Thc

US

promi

sen

te

hela

Malnonie

join

tUe

NATO

ss

soon

as

possible

if

it

manc

codcessions【MTTT5

】Thc

Uniten

Statce

promi

sen

tUat

if

tUe

Macenonian

sinc

manc

concessione:

it

wouI”

hela

it

irm

plement

the

nreatp

as

soon

as

possiblc这一句话里存在着一个缩写,“入约”是加入北

约的简称。因此,在翻译这段话的时候,只有意识到

这个问题才能做到准确地传达内容。从两篇译文中

我们可以看到,人工翻译可以联系上下文从而判断

出这里“入约”的真实含义,并阐明“join tUe

NATO”

的实际内容。而机器翻译也准确把握了“入约”中

暗含的条约彳息,并准确表达出了这一点,从这个角

度来看,机器翻译是比较成功的。但可惜的是,机器

翻译未能进一步联系上下文分析出这里的条约指的

就是

MTTT2

看,

机器翻译在将译文系语料库方面是非常出的,但机器翻译却不能很

好地联系上下文,作者认为,这是机器翻译缺乏逻辑

。【ST6】我们知道,冷战时期欧洲分为西欧和东

欧,这些概念有很强的政治彩。【TT6 】2

is

widely

1100x46(1-6”

that,

tUe

division

of

Europe

inte

Easteo

and

Westera

Europe

in

tUe

Colt

Wcs

was

vero

political.[MTTT6

]

Wc

”now

tUat

during

tUe

celO

wcs

,

Eut

mpe

was

divinen

inte

Westeo

Eumpe

and

Easteo

Eu-

mpe,rd

tUese

conapts

haC

a

strong

political

coIos.作者认为,这句话暴露了机器翻译的两个不足

之处。首先,百度翻译给出的译文过于直译,“政治

彩”其实是在突出上文“西欧”和“东欧”并非是按15

照地理因素来划分的,而是纯粹出于政治考虑,基于

不同的意识形态做出的划分,因此,“彩”这一词

语其实是没有实际意义的,翻译出来“

political

”即

可。第二,这一段翻译还暴露出了机器翻译在句段

整合方面还有待提高。原文中的“这些概念”实际

就是指代的上文中“西欧”和“东欧”,因此完全可以

处理成先行词的形式,将两句话合并为一个主句加

从句的英文表达形式”纵观百度翻译的译文可以发现,机器翻译给出

的定语从句是较少的,而且在表达方面也并不理想”

但其他从句的效果,比如条件状语从句,还是可圈可

点的。单从逻辑上来看,MTTT5对状语从句的把握

是非常成功的。我们不禁会问,为什么机器翻译处

理不同从句的效果差别如此显著呢?作者猜测,这

与英汉表达习惯有关。前文提到了机器翻译会根据

标点符号来划分句段,这其实就会打乱各个小句之

间的逻辑联系。而中文的条件状语从句是有逻辑结

构连接的,比如ST5中的“若……将……”结构,机

器翻译在识别到这个信息后,就会自然采用从句形

式;但中文中缺乏定语从句,尽管某些短句可以发挥

定语从句的作用,但没有明确的先行词和关系代词,

所以,机器翻译系统无法意识到某处可以使用定语

连接

短句”【ST7】由于地理上不接壤,也不存在历史遗留

问题,且与中国有着传统交往和友谊,中东欧国家总

体对华友好,积极参与“7

+

:7合作”和“一带一路”

建设。【TT7

】Certrai

and

Eastern

Erropern

cauntyrs

are

gereraliy

frierdiy

te

China

and

activeiy

panicipate

iv

the

"

7

+

7

Cooperatiou

"

and

"

the

Beii

and

Road

Int-

tiative

"

,

foo

we

are

geographicady

far

and

have

no

prooiems

left

by

histore

and

they

have

traditionai

faerdship

with

China.【MTTT7

】China

is

one

belt,

one

road

and

the

0^-

er

is

the

"16

+

7

cooneration”

and

''ooe

belt

and

one

road”

constraction.我们可以看到,MTTT7在内容,逻辑和表达方

面都与原文大相径庭,错得十分离谱”但仔细阅读

ST9就会发现,这句话其实包含了前文提到过的许

多翻译难点(针对机器翻译而言):逗号将句子拆分

为许多句段、主语缺失、虽然有逻辑结构,但较为松

散……作者认为,百度翻译对这句话的翻译情况一

定程度上印证了上文作者详述的猜想”7分析总结(三)内

方面,

百度翻译译文以和北外翻译系大四学生一样,完整传达原文内容,

不会漏掉重要信息,但不能分析出原文所蕴含的文

化和意识形态彩,不能体现翻译客户想要凸显的

特定立场。逻辑方面,百度翻译可以较为准确地翻

译出有明显逻辑结构的句子,但如果句子之间逻辑

关系是隐藏的或逻辑结构较长,则翻译结果就明显

不如北外翻译系大四学生。表达方面,在逻辑通顺

的情况下,百度翻译的英文表达还是十分流畅的,和

学生不分高下,在某些常用的固定表达方面,百度翻

译的表达比学生的表达更加简洁明了,可见其在利

用语料库方面具有重大优势。三、结语机器翻译可以极大提升译者的翻译速度,但其

缺点也是相当明显的。想要充分发挥机器翻译的优

点,同时尽力避免机器翻译的不足之处,就必须通过

比较机器翻译和人工翻译,从机器翻译工作原理的

角度剖析译文的不同,使不同翻译方式各展所长,绝

不能脱离翻译实践空谈机器翻译的特性,因为一切

翻译工具最终都是要经过实践的检验”由于篇幅和精力所限,作者只分析了七个具有

代表

的译

有做

全文

为分析部分的逻辑对该领域的研究还是具有价值的。

作者将机器翻译的错误译文和其工作原理相结合,

做出合理推断,总结机器翻译出现错误的原因,整个

分析过程具有可借鉴性”但翻译作为一个交叉学

科,其机器(机辅)翻译领域与计算机专业具有高度

重合性,因此未来研究者可以从计算机专业角度来

分析本文中提出的猜想是否合理,并且通过修改代

码让机器翻译更加智能。我们要充分发挥主观能动

性,做科技的主人,不断改进机器翻译工作方式,提

升其译文质量,并积极开辟新的翻译实践模式”参考文献:[7马忠法.“科学技术是第一生产力”思想的实现途

径及时代价值[0].研究,2020(5).[2]

胡开宝,李翼.机器翻译特征及其与人工翻译关系的研

究[J]中国翻译,207(5).[3]

刘满芸.翻译技术时代翻译模式的裂变与重构[0].中国

科技翻译,207(4).[4]

吴青.本科翻译专业培养模式的探索与实践——谈北京

外国语大学翻译专业教学理念[0].中国翻译,2010

(0)


本文发布于:2024-09-21 20:52:08,感谢您对本站的认可!

本文链接:https://www.17tex.com/fanyi/53160.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:翻译   百度   译文   方面   人工   分析
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议