【导读】9月27日,谷歌推出了新的翻译系统,声称该套翻译系统基于对于人类神经思考的模仿,能够与真人翻译竞相匹敌。谷歌宣布将机器学习技术纳入网页和手机App翻译中,从前汉译英的尴尬局面将大为扭转。
在之前的一项西班牙语译为英语的测试中,设定满分为6分,谷歌旧的翻译系统得到3.6分,人类普遍得分为5.1分,而谷歌的新系统得到了5分的好成绩.然而,谷歌翻译真的那么神?华东师范大学比较文学教授金雯老师将从专业的角度,为大家测评谷歌翻译。
谷歌中译英新版凌厉登场,“神经网络翻译”和机器学习等字眼引动了许多不彻底的欢呼和不确凿的惶惑。
我不懂机器学习技术,但我对它是友好的,况且我懂中文和英文,理解翻译这件事。所以我也就不避纷扰,来发表一些我个人对于Google Translate目前中译英水平的观感。
首先,谷歌翻译功能不需要翻墙,在国内也可以用,所以以下我说的内容,大家都可以重复验证,并提出自己的观点。谷歌翻译的网址:translate.google.cn,选择中译英,因为中译英功能是这次谷歌技术的突破点。
我的总体感受:谷歌中译英对写得像英文的中文句子比较能应对自如,也就是说主语谓语宾语等成分清晰的句子。尤其惊艳的是对于包含两三个短句,当中用逗号连接,逻辑关系清晰(即西化)的中文句子,谷歌翻译能够正确识别何为主句,何为表达因果、伴随状态的状语从句。当然,对许多四字成语和俗语(如“梁上君子”、“图样图森破”等)也有备而来,至少在单独出现的时候能够识别并正确翻译。这也就是说,谷歌中译英比较适用于一板一眼的中文,比如说写得干涩而又
十分清晰的科学论文和人文社科类论文(即便是这类论文,也会出现机器无法处理的长难句)。也或许适用于一部分新闻社论。这类中文用谷歌翻译成英文后,经人工修改把关,问题就不大了。这样的确可以节省许多初级、机械的翻译人工,对翻译生产力是一种解放。如果会引发失业问题,影响应该也不大。
然而,谷歌中译英对于大部分散文作品、日常电邮交流(可能有官话,可能有省略式表达)、口语化的生动表达、诗词曲艺、文字游戏等,都还是只能望洋兴叹。而且,我发现,即使是谷歌认识的短句式和俗语,出现在有些复杂蜿蜒的句子中时,也会让谷歌犯迷糊。中文与英文也有许多不兼容的地方,有自己独特而狡黠的语法。况且,自然语言是灵动的,不论中英文,写的灵动的时候都是不机械,不容易理解的。对语言的灵动,机器目前是无能为力的,不知未来如何。还是希望研究语言文学的人与科技界人士多多交流互补,虽然主力军还是人工智能人士。
有的人说,为了使用谷歌翻译,可以将自己的中文句子写成机器可以辨认的样子。这个技巧当然是没错的,为了论文能够顺利快速地翻译成英文,也不失为一个权宜之计。可是这项技术不应该是为人服务的吗?如果让自然语言削足适履,科技就真的变成禁锢人类语言才华的枷锁了。下面来略具体地谈谈谷歌中译英功能的一些问题,由此也可以发现许多自然语言的奥秘和中英文差异。
主语的问题。
汉语中主语的位置非常灵活,也往往会在句子中省略,这会给机器带来不少困惑。而且,如果主语比较长,本身就是一个词组(这种情况中英文实际上都有)的话,谷歌翻译就更加吃力。例证如下:
原句:您预约的馆际互借图书已到馆,请尽快至闵行图书馆馆际借书处取书。
机器翻译:You have booked the interlibrary loan book has been to the Museum, as soon as possible to the Minhang Library Interlibrary borrow books from the book.
正确翻译:The interlibrary loan book you ordered has arrived at the library. Please come as soon as possible to the Minhang Library to pick it up.
“你预约的馆际互借图书”是用一个词组做主语,机器还没明白,以为“你”才是主语。而后面的半句里主语省略了,在机器的翻译中也就发生了句子残缺不全的情况。
原句:这本书只好去网上买了。
机器翻译:This book had to go online to buy.
正确翻译:I will have to order this book online.
这个句子的主语缺席,可以是“我”,也可以是“你”,要看语境。但机器以为主语是“这本书”。(另外还有一个问题,那就是机器默认的时态是过去时,而原句实际上是将来时,机器还不能辨认。)
你想看的电影已经上映。
机器翻译:You want to see the film has been released.
正确翻译: The film you want to see has been released.
机器又以为主语是你,而不是电影。
动词的问题。
汉语中经常出现用形容词或形容词词组做动词的情况,对谷歌是一个挑战。例证如下:
原句: 桃红柳绿。机器翻译:Pink willow green
机器懵了。应该说The peaches are red and the willows are green.
原句:谷歌新技术面世。
机器翻译:Google’s New Technology available.
谓语“is”缺少。
原句:北京近日多雨。
机器翻译:Beijing recently rainy.
同上理。
原句:肉熟了。
机器翻译:Meat cooked.
应该是The meat is cooked.这里不仅动词缺少了,冠词也没了,中文里不用冠词,所以谷歌不知道这里应该加The,这个问题需要比较高水平的人工译者来纠正。
#FormatImgID_3#
时态的问题。
机器最很难确定一个中文句子实际上表达的是什么时态。默认的是过去时,有时候也懂得用一般现在时,但总体比较机械。例证如下:
原句:他不相信。
机器翻译:He did not believe it.
原句:他不相信世界:
机器翻译:He does not believe in the world.
这里我要表扬谷歌翻译,它正确地判断出第一句是过去时,第二句是一般现在时,令我惊叹!
原句:一星期前我回家了,第二天就有小偷来摸索北房的铁丝窗。
机器翻译:A week ago I went home, the next day there is a thief to explore the north room of the wire window.
第二个短句应该也是过去时,但机器用了现在时,不明白要与前面一个短句承接的道理。
原句:他回想起过去的三年,不禁有些悲凉。
机器翻译:He recalled the past three years, can not help but some sad.
道理同上,第二个短句也应该是过去时。
#FormatImgID_4#
灵动的散文句子。
对于这些句子,机器还没有学会解读。其实在人工翻译中,这类句子也是最难翻译的,要用既符合英语语法,又精炼灵巧的方法译成英语,非常困难。以前我上高级英语课,会讲一点这类散文句子的翻译。
原句:周作人《苦雨》:北京近日多雨,你在长安道上不知也遇到否,想必能增你旅行的许多佳趣。
机器彻底没辙:Beijing recently rainy, you do not know Chang'an Road, also encountered no, must be able to increase your travel a lot of good fun.
这属于不能看的英文句子。不知所云。
原句:他自小受家庭影响,不爱说话。
机器翻译:He was affected by family, may not talk.
这里,谷歌翻译没弄明白后面一个短句是一个结果。如果把这句中文改成:因为他从小受家庭影响,所以不爱说话,那么机器应该是可以理解的。当然,人可以说,我凭什么要改的这么累赘。
原句:他回想起曾经为他做的事,觉得自己实在委屈,又没处申诉,便郁闷起来。
机器翻译:He recalled what he had done for him, feel that they really wronged, and no place to appeal, they depressed.
同理,句子各部分之间的逻辑关系谷歌没有弄明白,这个句子缺乏表示逻辑关系的连词,各部分的语法关系不明确,所以对机器构成挑战。
古诗词。
原句:青鸟不传云外信,丁香空结雨中愁。
机器翻译:Bluebirds do not pass the letter of the cloud, cloves empty knot rain.
前半句语法还比较清晰,谷歌翻译还可以勉强为之,后半句的“空”不符合一般语法要求,所以机器对后半句是完全崩溃的。
“比较”这个词。
原句:我感到比较郁闷。
机器翻译: I feel more depressed.
中文里的‘比较’比一定要和其它东西或人比,就是表示一种中间程度。而英文里一定是两相比较。这是中英文差异的一个小小侧面,是英语学习者的难点,也是机器翻译的难点。我的测试当然不完全,但是足以说明,机器翻译的难点和人工翻译的难点有不少重合的地方,人觉得难的,机器也一样不会处理。但机器在处理简单翻译任务的时候比初级水平的人工译员要可靠,这大概就是机器的神奇之处吧。祝谷歌翻译前程似锦,而我们人类也会不断磨砺翻译和语言能力,与机器联手,既深刻地参透语言的规律和秘密,又超脱不羁地使用真正活着的语言。(作者系华东师范大学比较文学教授)(作者系华东师范大学比较文学教授)