计算机翻译软件的测试
跨进九十年代以来,计算机以其迅猛的势头进入了高等学校的教学科研领域。这一趋势也把外语专业的翻译教学推到了一个十字路口,给这门课提出了新的课题。众所周知,人工智能研究的一个十分重要但又极其困难的方面,就是让计算机懂得人类交往的语言,即自然语言。机器翻译系统是计算机科学的重要研究领域,国内外近几年来均取得了重大进展。有报道说,由中国科学院计算机所等单位联合开发研制的“863智能型英汉翻译系统”达到当今世界最高水平,该系统实现了对原文的语法、语义’和常识的一体化分析,具有面向多文种翻译的软件环境。台湾产“功学电脑自动翻译系统”也具有“文章类别指定’)的功能,用户可以在“电子资讯、“历史法律”、“军事”等方面指定计算机进行翻译。机译系统的这些功能是非常诱人的。
不管怎么说,我们没有理由拒绝这些高科技成果。然而从当前的情况来看,翻译及翻译教学与计算机及其辅助翻译系统的“联姻”却困难重重,举步艰难。其中,硬件建设是客观原因之一,例如《译星》主系统投资据了解在两万元左右,
每加一种词典又需一万五,等等。此外,翻译软件功能的评价标准无法达到统一也是其中的原因。笔者长期从事翻译及翻译教学工作,对翻译的标准问题深有体会。在翻译界,长期以来郎存在对翻译标准的争论。“信、达、雅”,“忠实、通顺、“正确”,“形似…、神似”,不一而足,有的甚至连圈内人都说不清楚。说到底,造成这种情况的根本原因在于,与科学上的度量衡不同,翻译质量的标准是一些软杠子,在实际操作中,标准与订单一标准之间的差别很大,谁也不可能制的定量测试标准。例如有的客户只要求翻出大意,能看懂就可以了,而翻译工作者和翻译课教师,正规的出版社或报刊,考虑到对读者负责,避免谬种流传,往往要求译文达到可以正式出版的标准。对于由计算机软件完成的翻译作业,不同专业、不同级别的专家实行的标准当然就更不可能统一了。有的英语专业人员可能给50分,另一些可能只20分。中文专业的可能给50分,某些非语言专业的人员则可能给80分。
这是因为,英语专业人员看到的可能全是计算机做错了或做得不好的地方,而非英语专业的人员看到的则是计算机完成的翻译作业中已经解决的问题或可以来用的部分。耐人寻味的是,一个基础很差乃至可能根本不懂英语然而会操作计算机的人能够毫不费力地做到这一步。而这很可能是翻译界和翻译教学今后回避不了的问题,对此我们应该有所准备。
最近我们在翻译课教学中组织了一次英语专业学生与计算机自动翻译系统的交互测试实验,目的是让学生初步认识机器翻译系统,了解机译系统的长处与不足,进一步则要求学生思考在今后的实际工作中怎样运用这些高科技产物。我们感觉实验从整体上说是成功的。学生对这祥的实验很有兴趣,实验结果基本上没有
超出我们的预估。现将有关这一实验的一些基本情况分析如下,希望能够引起译界同行和计算机专家们的兴趣。
实验的第一部分是为什算机完成的翻译作业打分。为便于比较,我们采用了两种机器翻译系统,一种是中国科学院科智语言信息处理有限公司的“智能型英汉机器翻译系统”,另一种是台湾产的功学自动翻译系统。十个题目中前五题的原文选自高等学校英语专业教材《英汉翻译教程>>(张培基、俞云根等编,上海外语教育出版社),题材属于社会科学类,难度对于英语专业学生来说属于中等,对非英语专业的人员则偏难。后五题选自中国冶金进出口上海公司的一份广告(《上海科技翻译》1993年第二期)内容大致可以归人科技类,难度为中等。实验规定的等级为优等2分,及格1分,不及格为0。每一个句子后边的中文即计算机完成的作业。原教材和刊物提供的译文(不是标准答案,谨供参考)附后:
1. The sight and sound of aur jet planes filled me with special longing。
科智系统:我们的喷气式飞机的情景和声音使我充满特别的渴望。
功学系统:我们的喷射机的景象与声音充满我以(和)特别的Ionging。
参考译文:看到我们的喷气式飞机,听到隆隆的机声,令我特别神往。
2. The sun rose thinly from the sea。
科智系统:太阳从这海稀薄升起。
功学系统:这太阳薄细上升起从这海。
参考译文:淡淡的太阳从海上升起。
3. The mountains began to throw their long blue shadows over the valley。
科智系统:这些高山开始越过这个(山)谷投他们的长的蓝色的影子。
功学系统:这些山开始掷他们的长蓝色阴影超过这valley。
参考译文:群山已在山谷里开始投下蔚蓝色的长影。
4. He wanted to send them more aid,more weapons and a few more men。
科智系统:他想要送他们更多的援助,更多的武器和几个更多的人。
功学系统:他想要送他们更多aid,更多一些枪械与一些men。
参考译文:他想给他们增加些援助,增添些武器,增派些人员。
5. Let bygones be bygones。
科智系统:既往不究。
功学系统:是过去的就让它过去。
参考译文:过去的事就让它过去吧。(或既往不究)
6,Handle domestic sale of surplus prod.
科智系统:处理过剩产品的本国出售。
功学系统:处理盈余products进出口贸易。
参考译文:兼营剩余出口产品的内销。
7. Contract engineering projects and offer technical service。
科智系统:承包设计工程并且提出技术服务。
功学系统:合约工程计划与提供技术的服务。
参考译文:承包工程项目和提供技术服务。
8. Import raw materials for metallurgical induStrv。
科智系统:为冶金工业的进口原材料。
功学系统:为冶金学的工业提供原料。
参考译文:进口冶金工业所需原材料。
9. Handle compensation trade and joint venture prOJects。
科智系统:处理补偿毛衣和合资经营工程。
工学系统:处理对抵贸易和联营事业计划。
参考译文:经办冶金企业补偿贸易和合资经营。
10. Import and export metallurgical equipment, spare components andinstrumentation devices。
科智系统:进出口冶金装备,零部件组成和器乐演奏的谱曲设备。
功学系统:进出口贸易冶金削设备,饶恕零组件与使用仪器工具(装置)。’
参考译文:经营冶金设备、备品备件和仪压的进出口业务。”
实验结果,计算机的得分率为50%左右,其中第五题得高分的概率很高。也就是说,整个第一部分的题,计算机可以得百分制50分。从两种机译系统的译文也不难看出“科智”显然要比“功学”高明许多。
第二部分实验要求根据机器(功学系统)译文给出下列英语谚语在汉语里的准确说法。
1.从不提供教鱼游。
2;虽然上帝的磨慢慢地研磨,还他们非常地研磨小的。
3.滚动的石头衣皱没有苔藓。
4.一半一个一块是更好的比没有面包。
5.由于你铺你的床,你如此必须躺。
6.一只猫有九生活(人)。
7.天堂的复仇是慢下来,但确定的。
实验结果,大部分学生部能根据现成的译文写出相应的谚语,并且能够指出计算机的错误,例如第3题,翻译系统错在不识原文,译得很笨拙。第6题错得很可爱,正确的译法应该是“猫有九命”。第2题和第7题原文是同一谚语的两种不同的说法,从机器译文也应该说看得出来。
我们感到,这一类型的实验最理想的对象是非英语专业的人员,设计时还可以将内容展开一些,例如避开两种语言文化中有较大共核的部分,等等。这一部分实验证明,机器翻译系统不像翻译界所认为的那样笨,但也没有达到计算机界所相信的那样高的智能化。现今的一些翻译软件大都标榜译文的信度达百分之八十以
上。这大概依据的是某一个专业的标准,在专业分工高度明细化的今天,夸耀这样的信度是没有什么实际意义的。这恐怕是软件业者在宣传中应该注意的一个问题。
实验的第三部分借鉴了美国加利福尼亚大学的一项人工智能实验的某些做法,要求裁判原文下边所附的两种译文中哪一种是计算机完成的。我们选择了见诸若干正式出版物的部分。
译文,译者即使不算名家,也是在翻译界多年征战的强手。选择原译的思路是原有译文在发表的当初就多有争议(参见《此风不可长》阂义,《中国翻译》1981年第三期),这些争议的现实义就在于,近几年来翻译界屡禁不止的粗制滥造之风有越演越烈的势头,圈外人有理由看看,译界中人有的时候是不是也会错到十万八千里外去。
1.No one is so foolish as to believe that anything happens by chance。
A. 谁也不会愚笨到相信世间有什么偶然发生的事。-
B. 没有人是如此愚蠢的,以至于相信任何事物意外地发生。
2. It was hardly likely that anyone would threaten him with prison。
A,它是几乎不很可能的;任何人以监狱威胁他。
B,几乎好像什么人都会拿监狱来恐吓他似的。
3. How she must hate me !
A. 如何她必须恨我!
B. 她为什么一定要恨我!
4. Suppose we get to the point. What do you suggest happened?
A,如果我们谈到重点时,你的提议到底发生了什么作用?
B假设我们抓住到这要点。你建议发生什么呢?
5. Do you fellows feel like a drink?
A,你们这些家伙感到像饮了酒一般吧?
E你伙伴们想要一个饮料?
6. But l don't know what the note refers to. Perhaps you do-or perhaps de Winter does。
凡但我不知道,那个这注解参考(提及),冬天你"做-or/或许de或许是。
B,不过我不晓得这张条是谁的。或许是你的——或者是文德的吧
对这一部分实验结果的分析比较复杂。首先,第1题和第2题原译刚好译反,而计算机译文则是正确的。这里有一个两难问题,按照“信”或“忠实”的标准(right or wrong?),译者只能得零分;如果仅按“通顺”的标准裁判,公平他说,计算机还不至于只能得鸭蛋。因为按照翻译的标准,‘`忠实”永远是放在“通顺”之前的,首先要解决的是right or wrong?的问题,然后才谈得上考察通顺不通顺,译得漂亮不漂亮。这里倒是应了翻译界的一句俏皮话。翻译好比女人,往往漂亮的不忠实,忠实的不漂亮。第3题二者的译文差不多,译者比计算机好不到哪儿去,第4题和第5题与第1、第2题两题情况相似,意思出入很大,错误的译文同样不是出自计算机翻译系统。第6题,译文不像中文的一句是机器译文,这也是自动翻译系统在整个实验中翻译得最糟糕的一句,而像中文的一句偏偏又是一个连一般的英语专业学生都看得出来的极其明显的误译,这里的两种翻译都令人涕笑皆非,彼此大概都不能说自己比对方高明。
第四部分是演示机译系统的速度,这一部分是由北京科智语言信息处理有限公司的机译系统完成的,原丈选自1994年的美国《读者文摘》杂志,均有一定难度,每一题后括号里的便是计算机完成作业的时间:
1. There is no king who has not had a slave among his ancestOrs,and no slave who has not had a king among his.
2. Good teaching is one-fourth preparation and three-fourths theater。
3. There arethree ways to get something done :do it yourself,employ someone or forbid your children to do it。
4. I have one request:may l never use my reason against truth。
5. What really flatters a man is that you think him worth flattering。
1.没有国王,没在他的祖先中间有一个奴隶,和没在他中间有一位国王的没有奴隶。(5’)
2.好的教是四分之一准备与四分之三的剧院。(2’)
3.有三条路要完成某些事情:自己做它,雇佣某人或者禁止你(11)的孩子做它。(8’)
4.我有一项请求:也许五月我从未使用我的原因反对事实。(1')
5.真的奉承一个人的是你(们)认为他值得奉承。(Y)
1990年国家教委批准颁发的《高等学校英语专业高年级英语教学大钢》规定,高年级学生英译汉翻译速度为每小时250英文词(即每14秒钟处理一个词)。而速度则是机译系统的强项。“863”系统为每分钟400字,《译星一92》可达每小时3万个英文词,台湾产功学系统可以达到每秒一个英文词。
实验结束,电脑翻译系统的重大缺陷也暴露无遗,其中有些问题是计算机科学长期以来没有解决也可能是永远无法解决的。例如,机译系统能够正确翻译某些职业翻译稍有不慎就会译错的东西,却无法辨认连初中生都能识别的一些基本句型,如上述第四部分1、3两句,如果不经操作人员进行预处理,计算机无从辨别其中的there是作引导词还是作实词。第三部分第6句也很能说明问题,本句中的Winter是原文中的一个人物,助动词dO和does代前文中的动词know,翻译系统看来是无法理解这些问题的。非计算机专业的人员对于翻译软件的这些局限应该有比较全面和清醒的认识。似乎可以肯定,这一类自动翻译系统目前还不具备将上下文联系起来理解和翻译的能力。系统在确定文章类别方面的功能也没有什么实际意义。我们不能指望机译系统替我们翻译文学作品。再说,对于一个喜欢兜圈子的作家写出的作,品或者是一部有思想的哲学著作,十个翻译家绑在一起也不一定能翻译得十全十美,皆大欢喜。我们应该认识到的是,机译系统是能够为我们完成大量机械性的翻译任务的,非计算机专业的人员凭借自动翻译系统可以得到极大的解脱,充分发挥本专业之所长,去从事更富创造性的工作。我们的实验还证明,正在走向新世纪的大学生普遍对计算机科学抱有极大的兴趣,教师应该与他们一起探索如何进一步拓宽实际运用的范围,充分利用这一张二十一世纪的“护照”。
目前,翻译与翻译教学,和机译系统与机器翻译研究,似乎还处在以邻为壑、各自为政的状况。
---------------
日本料理 Japanese Cooking
冷盘(刺身)Cold Platters
综合生鱼片 Assorted Sashimi
生鲜虾片 Fresh shrimp appetizer
生鲜牛肉 fresh beef appetizer
汤soups(shirumono)
味噌汤 Miso Soup
明虾汤 Prown Soup
煮菜 simmered dishes(Nimono)
福袋煮 stuffed Tofu Pockets
南瓜鸡米 Pumpkin with chicken
煮金线鱼 Soy Simmered Golden Thread
筑前煮 Chikuzen Ni
金平牛蒡 Beef with Burdock Root
煮昆布小鱼 Simmered Kombu-Fish Rolls
冬瓜蟹肉 wintermelon with crabmeat
2012. 9.27