机器翻译历史

                  机器翻译历史的大纲
1.机器翻译的概念
(1)机器翻译术语的出处:
(2) 机器翻译又称自动化翻译,是一种高级的人工智能技术, 它是计算机科学、数学和语言学等多学科共同参与研制的结晶。机器翻译之所以成为可能,一是因为两种语言之间存在着可译性,二是因为人的翻译过程具有可模拟性。
2.我和动物交朋友机器翻译历史
(1)最早的机器翻译起源于1933年,苏联人P.P.特罗绛斯基提出借助机器进行翻译的详细步骤,并设计出由一条带和一块台板依靠机械原理进行翻译工作的样机。
(2)70年代之前在欧美的发展
(3)70年代之前在中国的发展
      我国在1956年开始研究机器翻译问题
垂直搜索产品用计算机实现一种自然语言到另一种自然语言的转换。一般指自然语言之间句子和全文的翻译。
机译系统可划分为基于规则的和基于语料库的两大类。前者由词典和规则库构成知识源;后者由经过划分并具有标注的语料库构成知识源,既不需要词典也不需要规则,以统计规律为主。机译系统是随着语料库语言学的兴起而发展起来的,世界上绝大多数机译系统都采用以规则为基础的策略,一般分为语法型、语义型、知识型和智能型。不同类型的机译系统由不同的成分构成。抽象地说,所有机译系统的处理过程都包括以下步骤:对源语言的分析或理解,在语言的某一平面进行转换,按目标语言结构规则生成目标语言。技术差别主要体现在转换平面上。
语法型机译系统 研究重点是词法和句法,以上下文无关文法为代表,早期系统大多数都属这一类型。语法型系统包括源文分析机构、源语言到目标语言的转换机构和目标语言生成机构3部分。源文分析机构对输入的源文加以分析,这一分析过程通常又可分为词法分析、语法分析和语义分析。通过上述分析可以得到源文的某种形式的内部表示。转换机构用于实现将相对独立于源文表层表达方式的内部表示转换为与目标语言相对应的内部表示。目标语言生成机构实现从目标语言内部表示到目标语言表层结构的转化。
语义型系统 研究重点是在机译过程中引入语义特征信息,以Burtop提出的语义文法和Charles Fillmore提出的格框架文法为代表。语义分析的各种理论和方法主要解决形式和逻辑的统一问题。利用系统中的语义切分规则,把输入的源文切分成若干个相关的语义元成分。再根据语义转化规则,如关键词匹配,出各语义元成分所对应的语义内部表示。系统通过测试各语义元成分之间的关系,建立它们之间的逻辑关系,形成全文的语义表示。处理过程主要通过查语义词典的方法实现。语义表示形式一般为格框架,也可以是概念依存表示形式。最后,机译系统通过对中间语义表示形式的解释,形成相应的译文。
知识型系统 目标是给机器配上人类常识,以实现基于理解的翻译系统,以Tomita提出的知识型机译系统为代表。知识型机译系统利用庞大的语义知识库,把源文转化为中间语义表示,并利用专业知识和日常知识对其加以精练,最后把它转化为一种或多种译文输出。
智能型系统   目标是采用人工智能的最新成果,实现多路径动态选择以及知识库的自动重组技术,对不同句子实施在不同平面上的转换。这样就可以把语法、语义、常识几个平面连成一有机整体,既可继承传统系统优点,又能实现系统自增长的功能。这一类型的系统以中国科学院计算所开发的IMT/EC系统为代表。
machine translation
又称自动化翻译。应用语言学中的一门新兴的实验性学科,研究如何利用电子计算机按一定程序自动进行自然语言之间的翻译问题。
  20世纪30年代初,法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想法。1933年,苏联发明家П.П.特罗扬斯基设计了把一种语言翻译成另一种语言的机器,并在同年9月5日登记了他的发明。但是,由于30年代技术水平还很低,他的翻译机没有制成。1946年电子计算机问世后,英国工程师A.D.布斯和美国工程师W.韦弗在讨论电子计算机的应用范围时,提出了利用计算机进行语言自动翻译的想法。1949年,韦弗发表了一份以《翻译》为题的备忘录,正式提出了机器翻译的问题。1954年,美国乔治敦大学在国际商用机器公司的协同下,用IBM-701计算机进行了世界上第一次机器翻译试验,此后,苏联、英国、日本、中国等国,也相继进行了机器翻译试验。1966年11日,美国科学院语言自动加工咨询委员会公布了一个题为《语言与机器》的报告,对机器翻译采取否定态度,一些国家的机器翻译研究转入低潮。70年代初,由于现实的需要及技术的进步,机器翻译又重新兴旺起来,现在仍在不断发展中。美国、加拿大、法国、日本、苏联都先后建立了一批翻译能力较强的机器翻
译系统。有的系统已提供给一些单位试用,如法国的俄法机器翻译系统。有的系统已在一定范围内正式投入使用,如加拿大的TAUM-METEO英法机器翻译系统,用于天气预报。还有的系统已投入市场,如美国的SYSTRAN系统和WEIDNER系统。前者在大计算机上运行,每小时能译几十万词,但译后需加工。后者在微型机上运行,速度虽比前者慢,但仍比人译得快。
斯蒂文 斯皮尔伯格
  中国机器翻译研究起步于1957年,是世界上第4个开始搞机器翻译的国家,60年代中期以后一度中断,70年代中期以来有了进一步的发展。现在,中国社会科学院语言研究所、中国科学技术情报研究所、中国科学院计算技术研究所、黑龙江大学、哈尔滨工业大学等单位都在进行机器翻译的研究;上机进行过实验的机器翻译系统已有十多个,翻译的语种和类型有英汉、俄汉、法汉、日汉、德汉等一对一的系统,也有汉译英、法、日、俄、德的一对多系统(FAJRA系统)。此外,还建立了一个汉语语料库和一个科技英语语料库。中国机器翻译系统的规模正在不断地扩大,内容正在不断地完善。
  机器翻译的研究是建立在语言学、数学和计算机科学这3门学科的基础之上的。语言学家提供适合于计算机进行加工的词典和语法规则,数学家把语言学家提供的材料形式化和代
码化,计算机科学家给机器翻译提供软件手段和硬件设备,并进行程序设计。缺少上述任何一方面,机器翻译就不能实现,机器翻译效果的好坏,也完全取决于这3个方面的共同努力。
  整个机器翻译的过程可以分为原文分析、原文译文转换和译文生成3个阶段。
  在具体的机器翻译系统中,根据不同方案的目的和要求,可以将原文译文转换阶段与原文分析阶段结合在一起,而把译文生成阶段独立起来,建立相关分析独立生成系统。在这样的系统中,原语分析时要考虑译语的特点,而在译语生成时则不考虑原语的特点。在搞多种语言对一种语言的翻译时,宜于采用这样的相关分析独立生成系统。也可以把原文分析阶段独立起来,把原文译文转换阶段同译文生成阶段结合起来,建立独立分析相关生成系统。在这样的系统中,原语分析时不考虑译语的特点,而在译语生成时要考虑原语的特点,在搞一种语言对多种语言的翻译时,宜于采用这样的独立分析相关生成系统。还可以把原文分析、原文译文转换与译文生成分别独立开来,建立独立分析独立生成系统。在这样的系统中,分析原语时不考虑译语的特点,生成译语时也不考虑原语的特点,原语译语的差异通过原文译文转换来解决。在搞多种语言对多种语言的翻译时,宜于采用这样的独立分析独立生成系统。
  迄今存在和正在研制的机器翻译系统按其加工的深度可以分为3种类型:第1类是以词汇为主的机器翻译系统;第2类是以句法为主的机器翻译系统;第3类是以语义为主的机器翻译系统。
森林之神与仙女们  从美国乔治敦大学的机器翻译试验到50年代末的系统,基本上属于第1类机器翻译系统。它们的特点是:以词汇转换为中心,建立双语词典,翻译时,文句加工的目的在于立即确定相应于原语各个词的译语等价词;如果原语的一个词对应于译语的若干个词,机器翻译系统本身并不能决定选择哪一个,而只能把各种可能的选择全都输出;语言和程序不分,语法的规则与程序的算法混在一起,算法就是规则。由于第一类机器翻译系统的上述特点,它的译文质量是极为低劣的,并且,设计这样的系统是一种十分琐碎而繁杂的工作,系统设计成之后没有扩展的余地,修改时牵一发而动全身,给系统的改进造成极大困难。
  60年代以来建立的机器翻译系统绝大部分是第 2类机器翻译系统。它们的特点是:把句法的研究放在第一位,首先用代码化的结构标志来表示原语文句的结构,再把原语的结构标志转换为译语的结构标志,最后构成译语的输出文句;对于多义词必须进行专门的处理,
根据上下文关系选择出恰当的词义,不容许把若干个译文词一揽子列出来;语法与算法分开,在一定的条件之下,使语法处于一定类别的界限之内,使语法能由给定的算法来计算,并可由这种给定的算法描写为相应的公式,从而不改变算法也能进行语法的变换,这样,语法的编写和修改就可以不考虑算法。第2类机器翻译系统不论在译文的质量上还是在使用的方便上,都比第1类机器翻译系统大大地前进了一步。
  70年代以来,有些机器翻译者提出了以语义为主的第3类机器翻译系统。引入语义平面之后,就要求在语言描写方面作一些实质性的改变,因为在以句法为主的机器翻译系统中,最小的翻译单位是词,最大的翻译单位是单个的句子,机器翻译的算法只考虑对一个句子的自动加工,而不考虑分属不同句子的词与词之间的联系。第3类机器翻译系统必须超出句子范围来考虑问题,除了义素、词、词组、句子之外,还要研究大于句子的句段和篇章。为了建立第3类机器翻译系统,语言学家要深入研究语义学,数学家要制定语义表示和语义加工的算法,在程序设计方面,也要考虑语义加工的特点。
  目前世界上绝大多数的机器翻译系统都是第 2类机器翻译系统,研究的重点主要放在句法方面。有些系统以句法为主,适当增加了一些语义参数,以解决句法上的歧义问题。由于语义研究还不成熟,建立第3类机器翻译系统还有相当大的困难。
还在计算机降临人世之前,人类就萌生出一种极富魅力的梦想,希望有一天能够制造出一种机器,请它在讲不同语言人中间充当翻译。把这种翻译机器揣在衣兜里就能走遍 天下:到了英国,它讲英语,到了法国,它又会讲法语……,无论操何种语言的外国人与 你谈话,只要拨一下开关,它都能在两种不同语言间充当“第三者”,准确地表情达意。人类有了它,又何愁“天下谁人不识君”呢?
20世纪20年代,有位俄国人想动手实现这一梦想,他造了一台机械装置,试图通过那些齿轮的转动把俄语翻译成英语,终于以失败而宣告结束。 20世纪40年代,电子计算机的发明又重新勾起了人们美好的憧憬。1949年,美国学者沃伦·韦弗向大约200名友人发出一份备忘录,他热情地指出,用计算机完全能够解决语言的翻译问题。他认为,人们可以让计算机模拟人类翻译家的作法,使用一部两 种语言对照的词典作工具,用一种语言的单词去查出另一种语言的等价词,然后编排整理成文。这种翻译机至少可以用来帮助解决世界范围的文献翻译。疫情下的奥运会如何举办?
韦弗先生的设想简单明晰,却颇有吸引力,引起了美国科学界人士极大的兴趣。当历史跨入50年代后,美国人甚至有点迫不急待。因为在激烈的世界科技竞争面前,大部分美国科
嘌呤霉素学家和工程师都不能阅读俄语书,而大部分前苏联科学家和工程师却都精通英语。 美国科学家十分担心自己会根不上俄国人定期发布的优秀科技论文的水平。机器翻译的研究项目因此受到了高度重视并获得大量的经费资助。 美国计算机界铆足了劲,要一举摘下机译的皇冠。从1954年实力雄厚的计算机公司IBM和乔治城大学研究小组合作的首次试验起,韦弗设想的那种“词对词”的计算机翻译系统开始了它的蹒跚学步。

本文发布于:2024-09-22 04:29:33,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/601944.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:系统   语义   翻译   进行   分析   语言
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议