[拼音]:zidong fanyi xitong
[外文]:automatic translation systems
在语言学、数学和计算机技术的基础上建立的由计算机将一种语言翻译成为一种语言的语言信息处理系统。自动翻译又称机器翻译,包括文字机器翻译和语音机器翻译。这类语言文字处理的进一步发展就是自然语言理解。机器翻译的任务是利用电子计算机模拟人的翻译活动,将源语言转换成目标语言,实现翻译的自动化或部分自动化。
发展简史1946年第一批计算机问世时,W.韦弗和A.D.布思就提出把翻译任务全部地或部分地交给计算机执行的设想。他们认为把源语的词汇替换成译语的等价词,就能得到译文。事实上,为了使译文具有一定的意义,需要进行结构的变换,即变换词序、词性和词的数目。1949年美国华盛顿大学的E.莱夫勒最早开始自动翻译的研究。1954年美国乔治敦大学的L.多斯特尔特与 IBM公司开始合作研究英俄自动翻译,并于1960年推出自动翻译系统。1956年苏联科学院也开始研究自动翻译。1957年苏联发射第一颗人造卫星,使美国感到需要了解苏联技术发展动向,加速了俄英自动翻译的研究工作。1960年法国格勒诺布尔建立自动翻译研究中心CETA。1964年美国 发表对自动翻译的评价报告(即ALPAC报告),认为自动翻译不论在技术或经济方面短期内都不会有什么前途。于是中止了自动翻译的研究项目。1970年乔治敦大学研制出第一代自动翻译系统 SYSTRAN系统。自动翻译理论方面也有了新的进展。1968年C.菲尔莫尔提出格语法理论,以非常一般的方式描述了词在句中可能具有不同的功能。1971年T.维诺格勒进行自然语言理解系统实验,证明对自然语言的理解不仅与它的内部规律有关,而且与它的应用环境有关。1977年加拿大蒙特利尔大学研制出了自动翻译系统TAUMMETEO系统,它能在24小时内把加拿大各地区的气象预报从英文译成法文。1978年法国格勒诺布尔大学B.沃克领导的自动翻译实验室研制出第二代自动翻译系统ARIAN78,其语言模型利用树型结构来表示句子,它把描写词典和文法的语言模型部分与进行分析、转换和生成的算法的软件部分分开,因而可独立于系统的软件来改进语法和语言模型。目前大多数自动翻译系统都是第二代系统。1978年美国得克萨斯大学与联邦德国西门子公司开始合作研制德英机器翻译系统METAL 系统。它是高度模块化的结构,可并入语义分析、情报检索和专家系统模块。它采用短语结构文法构造语言规则系统,通过转换生成目标语言,用马尔科夫过程的方法实现系统运行。运行速度为每秒一词,日产200页英译文。它已成功地运行在几个专业领域。1980年美国推出ALPS系统,它是包括机助翻译功能较完善的多语种语言信息处理系统,有丰富的语言数据处理与管理软件,通过人机对话进行机器翻译,可用于办公自动化系统。1982年欧洲经济共同体开始自动翻译计划 EUROTRA。对从美国引进的 SYSTRAN系统进行了大量开发工作,现已成为较完善的多语种机器翻译系统,能翻译9个语种,包括英、法、德、意、荷、葡、西等。主要语种的词典规模都在10万词条以上,软件规模已达10万行,能翻译的对口专业有12个,用于共同体成员国之间不同语言文献的相互翻译,每小时可翻译 3万个词。日本于1982年开始自动翻译计划,已推出 TITRAN等实验系统,有TITRAN EJ(英日),TITRAN JE(日英),TITRAN JF(日法)等系统。我国于1985年推出英汉机器翻译系统,如军事科学院的KY-1型,我国社会科学院语言所的《天语》系统(ECT-2)。《天语》系统的首期目标是翻译美国AD报告、NASA报告及英国INSPEC磁带的文献题录。它属于第二代系统,语言数据与软件互相独立。语言数据的加工是语法语义并重,注重语言事实的描写和分析。平均每3分钟一条题录,正确率在80%以上。现在正在研究第三代自动翻译系统,它的特点是词汇驱动,不但使用一些通用的规则,而且还使用一定数量的针对每个词的个别规则。第四代自动翻译系统则是自然语言理解系统。
基本方法把源语译成目标语时,自动翻译一般要经过三个阶段。第一阶段是对源语句子的分析。这种分析的深度大体上决定了翻译的级别。第二阶段是转换。把分析得出的源语结构和范畴转换成目标语的结构和范畴。第三阶段是生成,即生成目标语的清晰易懂的译文。第一代自动翻译系统 SYSTRAM系统的操作过程也分为分析、转换、生成三个阶段(见图)。在法国研制的第二代自动翻译系统 ARIANE 78系统中也可以清楚地看到这三个阶段。这个系统在一个带标记的语法树上进行一种语言到另一种语言的转换。源语的所有的词都作为词汇基元放在树上,在树的节点上标明这些词汇基元的形态、语法和语义特征,由计算机对树型图和词汇基元加工。系统实现了这种双重转换后,就能生成目标语的完整句子。在生成阶段所经过的步骤与前面分析阶段相同,但方向相反。一般采用LISP语言作为自动翻译的程序设计语言。
自动翻译根据对要翻译的句子进行分析程度的不同,可分为 5个层次。第一层是按字母转译。它只要求更换原词中的字母。如日文中汉字和假名同时存在,可用文字处理机把汉字自动变成假名或拉丁字母。第二层是词对词翻译。它只要求使用一部词典。对于一些比较接近的语种,如印欧语系的一些语言,只要改变词序,就可做到一一对应。第三层是语法翻译。通过对语法结构的鉴别来翻译句子。第四层是语义翻译。它不但分析句子的语法结构,还要分析它的语义内容,即要注意词的语义和词的搭配的语义关系。这种语义方法的基础是格语法理论。第五层是语境翻译。要求分析时尽量考虑语境。当一个孤立的句子有许多译法时,只有把上下文中所有的句子连贯起来看,才能作出抉择。要解决歧义问题,除语言外计算机还要具备外部世界的知识,要有推理能力。
严正声明:本文由历史百科网注册或游客用户伟晔自行上传发布关于» 自动翻译系统的内容,本站只提供存储,展示,不对用户发布信息内容的原创度和真实性等负责。请读者自行斟酌。同时如内容侵犯您的版权或其他权益,请留言并加以说明。站长审查之后若情况属实会及时为您删除。同时遵循 CC 4.0 BY-SA 版权协议,尊重和保护作者的劳动成果,转载请标明出处链接和本声明内容:作者:伟晔;本文链接:https://www.freedefine.cn/wenzhan/62984.html