百度宣佈AI同傳最新突破!外媒稱媲美人類翻譯
2018年10月24日20:59

  百度於矽穀宣佈了最新重大突破――一個名為STACL的同傳AI,論文結果優異,Demo效果驚人。

作者 夏乙 栗子 乾明 一璞報導 | 公眾號 QbitAI
作者 夏乙 栗子 乾明 一璞報導 | 公眾號 QbitAI

  同傳AI,剛剛在國內掀起過暴風驟雨。

  但現在,百度於矽穀宣佈了最新重大突破――一個名為STACL的同傳AI,論文結果優異,Demo效果驚人。

  MIT科技評論、IEEE Spectrum等一眾外媒,還紛紛給出好評,這是2016年百度Deep Speech 2發佈以來,又一項讓技術外媒們如此激動的新進展。

  百度自己披露:與現在大多數AI“實時”翻譯系統不同,STACL的特點是能預測和延時可控,能夠在演講者講話後幾秒鍾開始翻譯,並在句子結束後幾秒鍾內完成。

  STACL不走“整句說完再翻譯”的路線,甚至還會預測發言者未來幾秒的內容,於是延時更短,更接近人類同傳。

  究竟能達到什麼程度?IEEE Spectrum採訪後給出類比:跟聯合國會議里的人類同傳相媲美。

  實際效果果真如此?那突破顯然重大。

  Demo展示:翻譯AI會預測△看上去幾乎同時了

  Demo可以看出,百度STACL的翻譯工作延時非常短,與原句只差幾個字。

  雖說這個AI目前只是同步翻譯成文字,還沒有合成譯文的語音,但這不是重點。關鍵是,不知道你有沒有注意到,這種“只差幾個字”有多難得。

  還沒等“美國總統布殊在莫斯科與俄羅斯總統普京在莫斯科會晤。”這句漢語說到莫斯科,自動翻譯的英語已經出現了“meet”,也就是漢語句末的“會晤”。

  這個“meet”,是AI從前半句話裡腦補出來的,依據的是美國總統最可能與其他人發生怎樣的活動。

  因此,百度這個同傳AI,不用等一句話說完,就能開始翻譯了。

  對於翻譯AI來說,預測是一項很罕見的技能。不同語言的語序總有差異,所以,那些沒有預測能力的翻譯AI,通常需要等到人類講完一句話,再開始翻譯。

  再舉一個栗子 ,從“百度在18年前”這半句里,AI預測出了百度創立的內容“started a business”。

  那麼,科學地講,百度AI的預測效果到底怎麼樣?

  衡量翻譯質量,要看BLEU分。

  在中譯英延後5個字的情況下,比起傳統的整句翻譯AI,百度的BLEU分要低了3.4分。

  畢竟是預測,發生錯誤是自然的。而這個差距在百度看來是可以接受的。

  比如,百度AI可能從前半句話裡預測出會面順利進行,而事實可能是會面並不順利。翻譯就容易出現失誤。

  面對這樣的情況,AI目前並沒有糾錯的能力。

  不過,用小小的延時,就可以換取更高的準確度:如從延3個詞到延5個詞。用戶可以根據需求隨意調整。

  而當兩種語言語序相差不多的時候,例如描述戴安娜王妃車禍事件的新聞,STACL和傳統整句翻譯的成績相比,就沒有明顯差異了。

  這種預測能力,是哪來的?

  答案是一個名叫wait-k的模型,它把預測和翻譯無縫整合到了一起,百度把它和兩個翻譯模型結合起來做了實驗,一個是比較早期的RNN翻譯模型,另一個是Google在2017年推出即大熱的Transformer。

  不過,wait-k不僅僅適用於這兩個模型,而是可以用在任何序列映射(sequence-to-sequence)模型上。也就是說,只要有個模型能搞定兩種語言之間的翻譯,加上這個wait-k做一點小改造,就能實現同傳了。

  一個機器翻譯系統,離不開分析輸入語言的編碼器和輸出目標語言的解碼器,而wait-k對機器翻譯模型所做的小改動,就在解碼器上。它讓解碼器在輸出內容的同時,能預測編碼器還沒有輸入的東西。

  百度用這樣一個公式描述了這種解碼策略:

  其中,x代表輸入的內容,y代表輸出,t代表時間步,而k表示的是解碼器比編碼器搶跑的詞數。

  技術細節在論文STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency中有詳細的介紹。

地址:https://arxiv.org/abs/1810.08398
地址:https://arxiv.org/abs/1810.08398

  團隊介紹

By the way,按署名次序,介紹一下9位論文作者。
By the way,按署名次序,介紹一下9位論文作者。

  Mingbo Ma,百度矽穀AI實驗室科學家,擁有三個學校的計算機博士學位,今年8月剛從俄勒岡州立大學博士畢業,另外兩個學位在美國東北大學和紐約城市大學,本科畢業於吉林大學,此前曾在蘋果和IBM實習。

  黃亮,俄勒岡州立大學助理教授,百度美研首席科學家,此前曾就職於IBM和Google,並在紐約城市大學、南加州大學擔任過助理教授,博士畢業於賓夕法尼亞大學。

  Hao Xiong,愛丁堡大學計算機碩士,本科畢業於河海大學,2015年加入百度任軟件工程師,負責大容量數據處理系統和資源調度系統。

  Kaibo Liu,俄勒岡州立大學助理研究員,今年6月剛到百度實習,本科畢業於北大。

  Chuanqiang Zhang,低調的百度技術員工,目前無更多資料。

  何中軍,百度主任架構師,從事機器翻譯研究與開發十餘年,多篇論文發表在本領域權威國際會議ACL、EMNLP、COLING、AAAI等,參與項目曾獲2015年度國家科學技術進步獎二等獎。

  Hairong Liu,百度矽穀AI實驗室科學家,曾就職於三星和普渡大學,華中科大電子電氣博士。

  Xing Li,中科院自然語言處理和機器學習碩士,百度矽穀人工智能實驗室的高級經理,曾任英特爾技術leader,在百度擔任過技術工程經理,領導百度貼吧研發團隊。

  王海峰,百度高級副總裁,e-Staff,百度AIG負責人、百度研究院院長,哈工大計算機博士。

△王海峰第一波評價
△王海峰第一波評價

  百度這次技術突破宣佈後,首先在外媒引發報導。

  有好評。其中評價最高的是IEEE Spectrum,認為百度開發的這個新系統,揭示了一種通過預測未來而保持穩定的翻譯工具,可以與聯合國會議期間提供同傳服務的口譯人員相媲美,讓人們離軟件巴別魚又近了一步。

  有對比。比如將百度的這次突破與Google聯繫起來。南華早報評論:隨著百度新的翻譯系統亮相,百度向Google發起了挑戰。

  還有將百度和Google放一起當“耦合”的。Engadget觀點:

  雖然這個系統仍舊有局限性,而且無法在必要的時候取代人類翻譯。但是它在Google缺席中國的情況下,給出了一種新的選擇。

  SiliconANGLE則援引分析師評論稱:“亞洲的語言翻譯方面仍然存在一定的局限性,看到本地的玩家加入到這個遊戲中來,的確是一件好事。”

  但目前最多的態度是觀望。

  在技術宅密度比較高的Hacker News和Reddit上,百度的這條消息,並沒有引發太多的討論。

  截至早上7點40分,Reddit只有一條評論,Hacker News上有兩條評論――雖然這個消息發佈已有5個多小時。

  Reddit上面的一條評論有點“水”,只是說這個Demo很好。

  Hacker News的兩條評論中,一條比較有技術含量,提出了如何翻譯德語的問題,並給出了一些示例,另一條是說,這個Demo很好。

比較有趣的是,兩個說這個Demo很好的網友,昵稱基本上是一樣的。
比較有趣的是,兩個說這個Demo很好的網友,昵稱基本上是一樣的。

  不過這個技術到底好不好,更多中外關注者馬上都能給出判斷。

  因為百度最快會在下週的年度技術大會上,進行公開展示。

  究竟是重大突破,抑或還只是完美Demo,到時一看便知。

  當然,有科研實力有技術複現的同學,現在就能去試試了。

  歡迎反饋你的測後評價~

  來源:量子位

  原標題:百度宣佈AI同傳最新突破!能預測,低延時,演示效果驚人,外媒稱媲美人類翻譯

關注我們Facebook專頁
    相關新聞
      更多瀏覽