近日,某高校學(xué)生在豆瓣給一本西班牙語(yǔ)譯作《休戰(zhàn)》寫(xiě)的短評(píng)引發(fā)熱議,該短評(píng)就此書(shū)的翻譯質(zhì)量提出質(zhì)疑,認(rèn)為該書(shū)“機(jī)翻痕跡嚴(yán)重”,而后《休戰(zhàn)》譯者韓燁回應(yīng)稱該評(píng)價(jià)近乎人身攻擊。而北京外國(guó)語(yǔ)大學(xué)高級(jí)翻譯學(xué)院副教授王華樹(shù)指出:“被指責(zé)機(jī)翻痕跡嚴(yán)重實(shí)際上不是機(jī)器翻譯的問(wèn)題,而是譯者自身翻譯水平的問(wèn)題。”
翻譯技術(shù)的多樣性構(gòu)成了其復(fù)雜的技術(shù)體系,其中最具代表性的就是機(jī)器翻譯。機(jī)器翻譯從1950年代發(fā)展至今,經(jīng)歷了三個(gè)階段:基于規(guī)則的機(jī)器翻譯,基于統(tǒng)計(jì)的機(jī)器翻譯,以及目前主流使用的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯。前兩代機(jī)器翻譯的質(zhì)量不高,產(chǎn)出的譯文往往生硬難懂。
目前廣泛使用的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯在譯文質(zhì)量上已經(jīng)大有提升,盡管仍有一些自身暫時(shí)難以克服的缺陷,比如譯文句式比較死板等,但讀來(lái)生硬拗口的譯文,卻未必是機(jī)器翻譯的結(jié)果,人工翻譯中同樣存在大量類(lèi)似的“翻譯腔”問(wèn)題,即翻譯出來(lái)的譯文有洋化現(xiàn)象或不符合漢語(yǔ)的表達(dá)范例,表現(xiàn)為譯文生硬、難懂、費(fèi)解等特點(diǎn)。
事實(shí)上,目前譯者與機(jī)器翻譯的關(guān)系更像使用者與詞典的關(guān)系,過(guò)去的譯者遇到不懂的術(shù)語(yǔ)就會(huì)去查詞典,而現(xiàn)在則是把查詢的需求放到一個(gè)更復(fù)雜的“詞典”之中。對(duì)于翻譯專業(yè)的學(xué)生而言,主動(dòng)使用機(jī)器翻譯進(jìn)行譯后編輯,其實(shí)是向“集體譯者”學(xué)習(xí)的過(guò)程,使他們能夠深入分析優(yōu)秀譯文的形成模式。
在現(xiàn)實(shí)商業(yè)環(huán)境中,翻譯質(zhì)量其實(shí)具有不同層次的需求,大致上可以分為參考級(jí)、常規(guī)級(jí)、出版級(jí)等,這給機(jī)器翻譯留下了廣闊的應(yīng)用空間。當(dāng)下在文學(xué)領(lǐng)域,大多數(shù)人還不太認(rèn)可機(jī)器翻譯的能力,這是機(jī)器翻譯的領(lǐng)域適用性和需求層次適用性的問(wèn)題。在某些商業(yè)的專業(yè)領(lǐng)域,如果有足夠的訓(xùn)練語(yǔ)料,機(jī)器翻譯譯文準(zhǔn)確率可達(dá)到80%甚至更高。因此,機(jī)器翻譯當(dāng)前主要應(yīng)用于非文學(xué)翻譯領(lǐng)域,甚至因?yàn)槭袌?chǎng)驅(qū)動(dòng),非文學(xué)的翻譯市場(chǎng)可能占到98%,甚至更多,這就提供了更多的語(yǔ)料和更多的技術(shù)投入,使得機(jī)器翻譯系統(tǒng)所能發(fā)揮的作用更為強(qiáng)大。
深圳云譯科技作為投入機(jī)器翻譯商業(yè)應(yīng)用的高新企業(yè),通過(guò)在自然語(yǔ)言處理領(lǐng)域與語(yǔ)言服務(wù)行業(yè)深耕三十余載,云譯科技積累了上百億行業(yè)精準(zhǔn)數(shù)據(jù),包含40多億的句對(duì)專業(yè)語(yǔ)料,覆蓋86種語(yǔ)言、20個(gè)垂直細(xì)分領(lǐng)域,實(shí)現(xiàn)了機(jī)器翻譯多應(yīng)用場(chǎng)景的落地,服務(wù)客戶已覆蓋政府、高校、金融、醫(yī)藥、ICT等領(lǐng)域,在全球市場(chǎng)已獲得上千家企業(yè)的認(rèn)可與信賴。
在文本翻譯上,云譯科技通過(guò)三代機(jī)器翻譯技術(shù)深層結(jié)合,國(guó)內(nèi)第一個(gè)推出神經(jīng)網(wǎng)絡(luò)翻譯的開(kāi)源系統(tǒng)。支持批量解碼、GPU解碼,支持多個(gè)可選領(lǐng)域的機(jī)器翻譯引擎,支持?jǐn)?shù)字自動(dòng)識(shí)別翻譯。在圖片識(shí)別上,云譯科技利用OCR智能識(shí)別模塊自動(dòng)識(shí)別各類(lèi)型圖片文件,并自動(dòng)轉(zhuǎn)化為可編輯的文件類(lèi)型,提高翻譯效率及便利性。而在語(yǔ)音識(shí)別方面,云譯科技采用的是先進(jìn)的深度學(xué)習(xí)DNN模型的識(shí)別引擎,語(yǔ)音識(shí)別響應(yīng)速度達(dá)到RTF<0.5,識(shí)別實(shí)時(shí)率在0.5以內(nèi)。中文語(yǔ)音識(shí)別準(zhǔn)確率在95%以上,英文準(zhǔn)確率在90%以上。
借助上述技術(shù),云譯科技的機(jī)器翻譯解決方案可以應(yīng)用于多種場(chǎng)景,如大型社交平臺(tái)調(diào)用云譯翻譯引擎,使用戶可任意閱讀社交評(píng)論,實(shí)現(xiàn)與國(guó)際友人的互動(dòng)交流;通過(guò)掃描設(shè)備識(shí)別文字并快速進(jìn)行翻譯;辦公軟件可調(diào)用云譯MT翻譯引擎,郵件、辦公文件等內(nèi)容一鍵翻譯;同傳會(huì)議或論壇可配置云譯坤伸智能同傳系統(tǒng),實(shí)現(xiàn)實(shí)時(shí)同步的多語(yǔ)投屏等等。
機(jī)器翻譯廣泛應(yīng)用于商業(yè)領(lǐng)域,對(duì)于語(yǔ)言服務(wù)行業(yè)而言,其實(shí)是大勢(shì)所趨。人工智能技術(shù)在當(dāng)下的發(fā)展確實(shí)給翻譯帶來(lái)了巨大的沖擊,包括翻譯的手段、效率、質(zhì)量、模式等。人工智能所擁有的三大推動(dòng)力:算法、數(shù)據(jù)、算力正在以指數(shù)級(jí)的速度發(fā)展,在圖像、視頻、語(yǔ)音、翻譯等應(yīng)用方面優(yōu)化機(jī)器翻譯技術(shù),能夠很大程度上提高翻譯效率,節(jié)約企業(yè)的成本。