B站“不靠譜”翻譯大賽:為何人工翻譯無法被取代
2020年03月20日13:03

  原標題:B站“不靠譜”翻譯大賽:為何人工翻譯無法被取代

  最近,一些網友發現了機翻失誤帶來的“樂趣”。在國內知名的彈幕視頻網站bilibili上,很多up主上傳了令人啼笑皆非的機器翻譯視頻。今天,與大家分享的同時,也借助翻譯家大衛·貝洛斯在《你耳朵裡有魚嗎?》中的論述,探討譯者工作的必要性。

  網友們把一些影視劇、動漫或者其他著名場面中的台詞用Google翻譯重新加工。

  最終,在翻譯了20遍之後,原本一點點的翻譯瑕疵,在不同語言的譯介中錯上加錯,變成了“喪心病狂”的不知所云。

  《出師表》中“奉命於危難之間,爾來二十有一年矣”,被機器一翻譯變得不知所云。

  這類頗為搞笑的視頻最早是由B站的網友做出來的,而“風評被害者”則是Google翻譯。再列幾個點擊量比較高的名場面翻譯。

  電影《夏洛特煩惱》中著名的“馬冬梅”場景:

  電影《對王之王》:

  周星馳的原台詞是:十室九貧湊得八兩七錢六分五毫四厘尚且三心二意一等下流。翻譯後則化身為金融學家……

  電視劇《亮劍》中李雲龍的歇後語:

  還有些動漫作品中的台詞,在Google翻譯了20遍後,與原意截然相反。比如《冰雪奇緣》主題曲裡的“Let It Go”,最後被翻譯成了“放棄吧”。(原是很勵誌的歌曲)

  連我們語文課本里的文言文也沒有逃脫網友的魔爪。比如《桃花源記》:

  能把“鹹”翻譯成“西安”,看來Google翻譯還是有文史基礎的。

  比如蒲鬆齡的《狼》:

  不要讓語文老師看見。

  再比如《嶽陽樓記》被翻譯成了這樣:

  朋友們,你能看出這三句的原文是什麼嗎?

  當然,以上純屬網友們尋開心的惡搞。但它也的確體現了翻譯中存在的諸多問題。

  我們都知道,語言是進入其他文化的隧道——但由於其陌生性,很多時候語言也成為隧道里的黑夜,阻礙了不同國家、民族之間的交流。為此,我們需要翻譯,不僅是那種商務性與實用性的,還有潛心對文化作品進行翻譯的譯者,借助優秀譯者的工作,一個人可以在不掌握另外一門語言的情況下,儘可能地接觸異國文化。

  但有些時候,那些不理想的翻譯帶來的結果也是災難性的。不可見的災難性翻譯多發生在學術譯介中,有時候,一個哲學術語的用詞不當,便可能導致讀者在理解上出現偏差,或者,一首詩歌會在翻譯中喪失所有魅力,僅是變成幾行排列有序的、乾巴巴的句子。這兩種翻譯災難由於含有“不可譯”的因素,幾乎無法避免。比如,我們究竟要找一個什麼樣的詞語,才能精確表達出薩特所言的“自欺”呢?類似的翻譯問題只能通過閱讀原文來解決。但還有另一類翻譯災難則純屬技術性災難——因為譯者在翻譯過程中,幾乎只是做了辭典的工作,導致翻譯出來的東西既無語感,又沒有語境。

  我們都期待著有一天,能有最理性的人工智能翻譯軟件幫助我們解決語言的障礙,從而做到無礙的全球化交流。不過機器翻譯究竟能做到什麼地步,永遠是讓人質疑的。起碼就今天的技術水平來看,機翻幾乎是最不靠譜的選項。

  除了單詞和語法,我們如何理解某句話在字面意義背後的情景?機器翻譯有可能達到理解文化背景的程度嗎?如何為一個詞在另一種語言中尋找最恰當的對應表述——如果沒有的話,譯者是否可以發揮創造,以打破原句為代價去傳達語意?

  在《你耳朵裡有魚嗎?》一書中,著名翻譯家、普林斯頓大學比較文學系博士大衛·貝洛斯探討了關於翻譯語境、機器翻譯的起源以及文學翻譯等話題,來幫助我們更好地理解翻譯這項工作。

  1

  翻譯難題之無對應語境

  在探索和理解語言因何不同或因何相同方面,也有一段非凡的現代曆史。整個19 世紀,人們都樂此不疲,尋找世界上所有語言,想要整理出各種語言之間的關係,在這棵語言“族譜樹”上,每一個分支都有自己的祖先。這場引人入勝的比賽,就以上述結論為“發令槍”。但即使在歐洲舊大陸,有些語言—比如阿爾巴尼亞語—就沒有任何“近親”,它們就像腫脹的樹枝一樣掛在樹上。只有西班牙北部和法國西南部人們會使用的巴斯克語太過獨特,根本無法歸入任何一個“族譜樹”分支。大探險家亞曆山大的哥哥威廉·馮·洪堡(Wilhelm vonHumboldt)學會了這種特別的語言,還編寫了語法。

  巴斯克語表示不同事物的一系列單詞並沒有讓洪堡備感困難,真正影響他的是巴斯克語相當獨特的語言結構。在洪堡看來,巴斯克語的語法正是巴斯克文化的核心和反映。所有這些觀察形成了一種理論:儘管不同語言的形式各有不同,世界上每種語言都可以讓人走進不同的心理世界。巴斯克語不能“降級”為法語、德語或其他語言。巴斯克語就是巴斯克語—是“巴斯克風格”的體現和根源。據洪堡觀察,不同的語言就是不同的世界,世界上各種自然語言的多樣性應被視為各種思維方式和工具的寶庫。

  《你耳朵裡有魚嗎?》,作者: 〔英〕大衛·貝洛斯,譯者: 韓陽,副標題: 翻譯及萬物的意義,版本: 商務印書館2020年4月。

  洪堡的論文發表之前,“其他人不像我們這樣思考”的結論就已得出,但大部分人類曆史都對這一結論比較輕慢。在希臘人眼裡,不會說希臘語的“野蠻人”顯然不會說出什麼令人感興趣的事。同樣地,對於17 世紀的法國語法學家來說,其他語言幾乎無法讓其使用者真正思考—能做到這一點的只有拉丁語和法語。在殖民時代,人們通常認為其他語言的“差異性”體現了使用其他語言的人在智力上比不上法國人(或希臘人、羅馬人等),所以表達洪堡的這種觀點需要極大的勇氣。

  殖民擴張和征服行動讓歐洲人接觸到了比巴斯克語更獨特的語言。其中有些散落在世界各地,毫無規律可循,但的確非常特殊。想像一下,一種語言中沒有表達“左”和“右”的詞,只有表達偏重基本方向某一側的方式。比如“你西南方的那條腿上有一隻蒼蠅”可能表示“左腿”或者“右腿”,完全取決於對話雙方面對的方向。

  比如, 使用庫克薩優里語(KuukThaayorre)的人(澳州約克角附近)在排列有序集合的時候(比如從1 到10 的數字或從年輕到成年的面部照片),並不是按照從左到右或從右到左的順序,而是要從東邊開始排列—至於哪邊是東,則取決於人類語言學家所坐桌子的朝向。

  美國語言學家本傑明·李·沃爾夫(Benjamin Lee Whorf)研究學習過很多美國本土語言,有一個關於人類語言巨大差異的例子就因他而聞名於世。

  在霍皮人使用的語言中,有一種被稱為“證據性”語法現象。根據霍皮語語法,每個名詞短語並不會過多涉及泛指或特指(“一名農民”[“a farmer”]和“那個農民”[“the farmer”]),而是取決於所涉及的人物或事物是否在講話者的視線範圍內。表示“我現在能看到的那個農民”和“我昨天看到的那個農民”的形式不同,當然,表示“你之前跟我說過的那個農民”的形式就更不一樣了。因此,要想把英語句子“The farmer killed the duck”(“那個殺了鴨子的農民”)翻譯成霍皮語非常難,必須要提供大量的英語句子中沒有涉及的信息—比如所謂的農民是否在說話者說話時所見範圍內,以及所涉及的那隻鴨子是否還在附近等。當然,如果你使用霍皮語,與你交談的對方也使用霍皮語,你們交談的情景是鴨子或農民某一方或都沒有在你們附近,你就會知道這些問題的答案,也就可以用正確的語法表達自己要說的內容。一旦“The farmer killed the duck”超出了上下文範圍,就無法進行有效翻譯了。

  如果你走進星巴克只說要一杯“咖啡”, 那咖啡師很可能一臉茫然地看著你。於他而言,“咖啡”這個詞並沒有實際含義。用我們的方言討論咖啡店用語時,表示咖啡的詞有37 個。但除非你使用的是這37 個詞中的某個,否則你說的話就會讓人迷惑,或者帶來意想不到的後果。

  2

  人造現代機器翻譯的起源

  現在,既然幾乎所有新聞傳播涉及的方面都不再由信差完成,而由電子設備完成,那麼一個很自然的問題就是,為什麼核心工作本身不能同樣用自動翻譯機完成。

  雖然機器翻譯仍處於起步階段,但已經經曆了多舛多變的曆史。機器翻譯出現的曆史背景非常具有戲劇性。機器翻譯並非始於明確的政治意願,比如歐盟的語言規則等,而是始於冷戰初期的恐怖氛圍。當時,美國研製出了原子彈,並付諸使用。在一段時期內,美國壟斷著這種可怕的武器。可這種壟斷會持續多久?蘇聯何時可以趕超?要想推測答案,方法之一就是梳理蘇聯出版的所有研究性期刊,尋找相關學科技術水平的線索。期刊中使用的都是俄語。對此,美國只有兩個選擇:一是培養一批名副其實的俄語—英語科學翻譯團隊;二是發明一種可以為其完成這項工作的機器。

  但要組建一支翻譯人員隊伍並不容易,因為這種語言並非家喻戶曉的語言。1945 年的時候,沒有明確的譯者資源,找不到既接受過英語教育,又能讀懂俄語技術信息的譯者。於是,美國當局便將目光放在了機器上。

  機器翻譯的旅程開始之初,人們可以在電腦上存儲一組單詞,並按照希臘人和羅馬人設計的語法等級分類,在理論上有實現的可能性(很快也就具有了現實的可能性)。同樣,同時存儲兩組單詞也不無可能,一組是俄語單詞,一組是英語單詞,之後告訴計算機與某個英語單詞對應的俄語單詞是什麼。

  為了做到這一點,計算機首先要知道的是某種語言的全部語法規則。必須要告訴計算機整套語法規則中都包含哪些內容。但有誰知道英語的全部語法?每種語言的學習者都很快就會發現,系統性的規則經常被某種特例推翻。每種語言的母語使用者都知道自己可以打破語法“規則”(也經常這樣做)。對任何語言的語法規則進行完整描述完全是一種奢望,而非現實。這是機器翻譯碰壁的兩個原因之一。

  第二個原因就是,即使是人類,假設是完全掌握了其語言語法規則的人類,也需要關於世界的大量知識填補某一表達的含義—而且,尚沒有人知道如何讓機器明白句子到底要表達的是什麼。計算機無法解決的一個經典問題就是如何將正確的含義與以下兩個句子中的單詞相對應:“The pen is in the box”(“筆在盒子裡”)以及“The box is in the pen”(“盒子在筆中”)。理解這兩個句子需要對真實世界中物體的大小有所理解(比如這兩個句子中表示的分別是“鋼筆大小的盒子”以及“羊圈”),但這些內容無法靠字典中的單詞含義和句法規則解釋。

Google翻譯宣傳片截圖。
Google翻譯宣傳片截圖。

  Google翻譯搜索的內容,其實是翻譯人員數百萬個勞動工時所產生的文本。但Google自己的宣傳視頻中卻根本沒有詳述這一點。目前,Google翻譯可以提供58 種語言的雙向翻譯,即3306 種不同的翻譯服務,超越了人類曆史有史以來的最高值。大多數翻譯關係都是由Google翻譯最先開始的—比如冰島語→波斯語、意第緒語→越南語,等等。之前,這些語種之間並沒有翻譯關係存在,因此無論在網絡上還是其他資料中,都沒有匹配的文本。Google在介紹自己服務時提到,語言之間存在巨大差異,其程序可以通過掃瞄尋找答案,但翻譯質量取決於是哪兩種語言。

  這份介紹中沒有強調的是,Google翻譯其實和我們一樣,是世界翻譯流的囚徒。如此令人欽佩的智能概率計算系統只能運用輔助跨文化交際的設備提供3306 種翻譯方向:樞紐或中介語言。英語是主要的樞紐,但並不是因為Google的總部設在加利福尼亞。如果使用統計學方法運算,找到從未有過直接對應的兩種語言的文本,就要借助與譯入語和譯出語均有對應的樞紐。

  Google提供的服務讓語言關係變得扁平化和多樣化,似乎超出了對歐盟語言平等規則最熱忱的支持者的最大期待。但Google翻譯只能通過挖掘、確認、強調世界翻譯文本電子數據庫中最廣為翻譯的語言的中心地位,且該種語言也應該是其他所有中介語言一直使用的譯入語語言。

  3

  人造如何定義理想的翻譯,

  尤其是在文學中

  相較於其他作品類型的譯者,文學作品的譯者對作品的“使用情景”只有一個模糊的概念。實際上,譯者們並不確定自己的作品最終能被使用。很多翻譯作品(包括很多優秀作品)的銷量都非常慘淡,最終消失在黑洞之中。文學翻譯的真正“客戶”是一位只存在於想像中的讀者——每個譯者在自己腦海中想像出來的讀者。

  這一結論是以下情況之所以出現的真正原因:涉及文化產品傳輸時,譯者總會對自己說,我們是在創造對等的效果。

  我們通常提到的翻譯藝術的標準中有兩個問題:“對等”和“效用”。翻譯肯定有其效用。翻譯可能會讓讀者大笑、抽泣,也可能會讓讀者立刻衝向圖書館,尋找更多同類書籍。

  雙語讀者可能可以準確地判斷,翻譯是否完全傳達了原文的內容。但無論這位讀者如何聰明,如何細緻,她能合理說明波德萊爾作品的德語翻譯對自己的影響與波德萊爾的法語詩作有同樣的影響嗎?這種說法根本無法得到論證—在我看來,這種說法也不過是一串毫無意義的單詞。波德萊爾的法語作品在不同的時期對我有不同的影響,顯然對讀者群整體有更廣泛的影響。那麼,翻譯對等的目標又是哪種“效果”呢?

電影《翻譯家》劇照。
電影《翻譯家》劇照。

  文學翻譯的真相是,翻譯作品與其原文本無法比較,文學作品之間也無法比較,個人對小說、詩作、戲劇的閱讀感受只能通過與其他讀者的討論才能得以“衡量”。譯者所做的是為作品的構成單元尋找匹配內容,而非對等內容,期望匹配內容的總和可以產生新的作品,且新作品整體可以作為原作品的替代物。

  運用我們用自己或其他某種語言複述內容的所有或一種方法,就可能找到匹配的內容。

  至於什麼是令人滿意的匹配,完全是仁者見仁,智者見智的問題,永無定數。唯一可以肯定的是,匹配內容永遠無法與被匹配的內容相同。

  如果你想要完全一樣的內容,那也並無不可。直接閱讀原文即可。

關注我們Facebook專頁
    相關新聞
      更多瀏覽