現(xiàn)在位置:主頁 > 國內(nèi) > AI搶同傳飯碗?科大訊飛用一場“誤會”證明:還早得很

AI搶同傳飯碗?科大訊飛用一場“誤會”證明:還早得很

作者:編輯 ? 時間:2018-09-24 ? 瀏覽:人次

顯然,人工智能(AI)做同傳,肯定不是先人工翻譯,再由機器識別并讀出來。

編輯/趙云 每日經(jīng)濟新聞(nbdnews)

昨日(9月21日),一位同傳譯員聲討科大訊飛“AI同傳造假”,在網(wǎng)上引起了軒然大波。

對此,科大訊飛回應稱,科大訊飛從沒講過AI同傳的概念,始終強調(diào)是人機耦合模式。目前人工智能無法替代同傳,只是幫助同傳提升效率,這里有一些誤會。公司隨后表示,在該次會議上,科大訊飛提供的只是會議轉(zhuǎn)寫上屏服務。

21日深夜,科大訊飛又通過旗下微博賬號@訊飛聽見 發(fā)布聲明,同樣強調(diào)“人機耦合”的概念。

而在科大訊飛站到輿論中心的同時,另一個問題也來了——AI同傳如今能力怎么樣了,會不會搶走同傳譯員的飯碗?

同傳譯員質(zhì)疑科大訊飛“AI”同傳造假

9月20日晚間,用戶名為“Bell Wang”的同傳譯員,在知乎發(fā)表了一篇名為《科大訊飛,你的AI同傳操(qi)作(zha)能更風騷一點嗎》的文章,很快引起了網(wǎng)友及媒體關注。

圖片截自知乎

文章稱,9月20日,Bell來到上海國際會議中心,為2018創(chuàng)新與新興產(chǎn)業(yè)發(fā)展國際會議(IEID)的高端裝備技術與產(chǎn)業(yè)分會做現(xiàn)場同傳。

Bell表示,在沒有任何告知的情況下,科大訊飛在上海某會場冒名使用同傳譯員翻譯成果且打上“訊飛聽見”的logo。而后,他還發(fā)現(xiàn)該大會在直播平臺上播出,給出的實時同傳是機器人聲,朗讀的內(nèi)容卻是他和搭檔的翻譯被訊飛識別后轉(zhuǎn)化成的文本。

他同時也表示,科大訊飛事前沒有告訴他和他的搭檔現(xiàn)場會有語音識別的字幕,也沒有告知直播用的同聲傳譯是用機器識別并朗讀他和搭檔的翻譯,更沒有征得他們的同意就冒名使用了他們的翻譯成果。

換句話說,Bell認為,現(xiàn)場所謂的“AI同傳”流程如下:

嘉賓說話—人類同傳譯員翻譯,說出譯文訊飛識別人類說出的譯文—譯文被投放到屏幕和直播中,直播中播出語音合成的人聲。

他很快收到朋友發(fā)給他的直播介紹,上面寫著:“知領直播引入科大訊飛智能語音技術,實現(xiàn)了國際高端會議的中英文頻道切換、智能翻譯和自動語音播報,帶給你不一樣的視聽體驗”。

于是在憤怒之下,Bell發(fā)文揭發(fā)科大訊飛“所謂智能翻譯的真相”,稱這里壓根沒有人工智能翻譯,都是人類智能翻譯。

一石激起千層浪,更多的同聲傳譯工作人員在知乎發(fā)聲,寫下自己見過的“大型翻車現(xiàn)場”。

科大訊飛說的“人機耦合”是什么?

據(jù)多家媒體報道,21日下午,科大訊飛董秘、副總裁江濤回應,科大訊飛從沒講過AI同傳的概念,始終強調(diào)是人機耦合模式。人工智能目前是無法替代同傳的,只是幫助同傳提升效率,這里有一些誤會。

人機耦合是什么意思?字面上看,“耦合”在物理學上指兩個或兩個以上的體系或兩種運動形式間通過相互作用而彼此影響以至聯(lián)合起來的現(xiàn)象——化用到科技圈,“人機耦合”大意即為強調(diào)人與機器的“緊密配合”、“相互影響”。

科大訊飛方面稱,在9月17日的世界人工智能大會上,公司董事長劉慶峰已經(jīng)明確了是人機耦合模式,即機器和人的協(xié)同翻譯。翻譯字幕上中英文同時顯示時是嵌入式機器實時全自動同傳,單個語種顯示時是人工同傳。人工翻譯時,訊飛聽見可以幫助同傳提升效率和水平。

據(jù)澎湃新聞,9月21日18時30分許,科大訊飛給其發(fā)去題為《關于所謂的“同傳造假”,我們有話說》的情況說明。文章稱,因某會議現(xiàn)場機器轉(zhuǎn)寫問題,致同聲傳譯老師對科大訊飛產(chǎn)生誤解。經(jīng)了解,作如下說明:

科大訊飛智能會議系統(tǒng)主要提供兩種解決方案:一種是離線翻譯,現(xiàn)場全自動翻譯并同步展示在屏幕上,沒有任何人工同傳參與。比如在世界人工智能大會上,馬云、馬化騰、李彥宏、雷軍等人的發(fā)言,科大訊飛都是用的這套方案。

另一種是僅提供會議轉(zhuǎn)寫上屏服務,比如這次2018創(chuàng)新與新興產(chǎn)業(yè)發(fā)展國際會議。主辦方考慮到大會專業(yè)技術背景,以及參會者來自不同國家、不同口音等情況,專門配備了專業(yè)同傳譯員。科大訊飛應主辦方要求僅需提供語音識別技術,直接轉(zhuǎn)寫譯員翻譯結(jié)果并在會場大屏呈現(xiàn),同時應主辦方邀約,在直播中合成識別結(jié)果,展示科大訊飛語音合成技術。

但有趣的是,在昨日晚間,“訊飛聽見”發(fā)布的同題文章中,對兩種解決方案的描述卻出現(xiàn)了微妙的調(diào)整,第二種方案出現(xiàn)了早前版本中沒有的“人機耦合”,而“轉(zhuǎn)寫譯員翻譯結(jié)果并呈現(xiàn)”則變?yōu)榱恕疤峁┱Z音撰寫和翻譯結(jié)果給同傳參考”。

每經(jīng)小編檢索發(fā)現(xiàn),在科大訊飛的官方媒體賬號上,對于“人機耦合”的最早表述,出現(xiàn)在2016年6月。當時,科大訊飛高級副總裁杜蘭前往西班牙,出席了第十二屆“中國未來領袖”計劃。在一場研討會上,杜蘭說:

“人類對人工智能不必焦慮。未來,一定是人和機器耦合的時代,“跨界”將會帶來相互合作的無比繁榮的產(chǎn)業(yè)生態(tài)?!?/strong>

一年后,科大訊飛總裁劉慶峰在接受采訪時則說,“人機耦合互動,我認為是未來人工智能最有希望做成的?!?/p>

同傳需要擔心被AI搶飯碗嗎?還早

能做到同傳的人,無疑是語言方面的天才。讓AI去做同傳,則是讓人工智能處理自然語言,但人工智能顯然不具備“天賦”——簡單地說,AI做翻譯,靠的是海量的分析數(shù)據(jù)和幫助AI進行學習的模型及優(yōu)化算法(比如學習根據(jù)場景不同辨別一詞多義,或是理解口語的模糊邏輯)。

但理論層面的東西,比如自然語言處理(NLP)、隱馬爾可夫模型(Hidden Markov Model,HMM)等術語,小編不可能“簡單地”講清楚。因此本文主要根據(jù)媒體公開報道,帶大家了解一下AI同傳的進展。

2017年6月,科大訊飛發(fā)布了全球首款實時中英互譯神器——曉譯翻譯機。當時許多宣傳文章稱,這款產(chǎn)品“可以讓人工同傳消亡”,“是同聲傳譯終結(jié)者”。

這種不切實際的字眼引起廣大同傳工作者的不滿。不過,翻譯機的出現(xiàn)也讓人困惑,一直鬧得火熱的AI同傳停留在了什么層次?距離同傳人員“被下崗”還有多久?

一方面,2017年6月29日,科大訊飛就自己刊文《拒絕神化 人工智能技術需踏實前行》稱:

“目前機器翻譯已經(jīng)取得非常大的進步,在衣食住行等常用生活用語上的中英翻譯可以達到大學六級的水平,能夠幫助人們在一些場景處理語言交流的問題,但距離會議同傳以及高水平翻譯所講究的“信、達、雅”還存在很大的差距?!?/strong>

訊飛一直所努力的,是希望通過語音轉(zhuǎn)寫和翻譯技術幫助同傳提高工作效率、減少失誤,形成人機耦合的同傳新模式,并不是去替代同聲傳譯。

劉慶峰當時在接受采訪時也再三強調(diào),希望外界不要神化人工智能技術?!拔覀儚膩頉]有說過要取代同傳的職位。我想即使是專業(yè)八級的人也不一定能保證說自己就具備了同傳的水平。”

另一方面,今年上半年的博鰲亞洲論壇上,首次出現(xiàn)了AI同傳。然而據(jù)鈦媒體稱,在如此重要的場合,現(xiàn)場配備的騰訊AI同傳卻掉了鏈子,鬧出詞匯翻譯不準確、重復、短語誤用等“烏龍”。

圖為AI同傳內(nèi)容(圖片來源:鈦媒體)

在一片質(zhì)疑聲中,騰訊于4月10日做出回應,承認“騰訊同傳”確實出現(xiàn)了錯誤,答錯了幾道題。據(jù)東方網(wǎng)當時報道,業(yè)內(nèi)人士表示,在大型國際會議上使用機器同傳主要有兩大難點。

一是國際會議同傳是語音識別和文本翻譯的結(jié)合,會場噪音、每個人的停頓語氣詞等語音信號會對后面的翻譯產(chǎn)生影響。

二是會議對于及時性要求很高,不可預知情況很難控制,很難給機器足夠的自我調(diào)整時間。要解決機器翻譯對未知困難的自適應性,相對較難。

但同時也有專家指出:

“機器翻譯類似于一個嗷嗷待哺的小孩,有可能成長為一個擁有和人類智能類似的‘人’。過去幾年,深度學習的普遍應用讓更多的研究者和企業(yè)有了開展機器翻譯的機會。我希望大家能多些耐心,不要一味地教這個小孩過多的算法,而應該耐心地讓這個小孩能多接觸不同情景,發(fā)掘其自身潛力。

“從這個意義上,機器翻譯和人工翻譯是相輔相成的關系,不久以后機器可能會代替一些不專業(yè)的翻譯者,但是專業(yè)的翻譯者很難被替代?!?/strong>

每經(jīng)小編注意到,就在幾天前(9月17日),同樣是在上海舉辦的2018世界人工智能大會上,訊飛聽見和騰訊同傳,兩家語音轉(zhuǎn)文字產(chǎn)品就已展開過一場放在“臺面”上的較量。

據(jù)媒體報道,馬化騰當天在主題演講時表示“騰訊同傳現(xiàn)場采用依靠機器完成,而不是人機協(xié)作”;隨后上臺演講的劉慶峰則說:“我們希望用機器幫助頂尖同傳更好的發(fā)展他的能力,機器和人未來必須是協(xié)同的?!?/p>

在產(chǎn)品表現(xiàn)方面,兩家公司最后打了個平手:

從英文流利程度來看,似乎騰訊同傳更勝一籌。每逢嘉賓進行演講語種切換,而科大訊飛的現(xiàn)場反應速度需要更長時間。

而到了一日本專家發(fā)表演講時,騰訊同傳直接“罷工”,科大訊飛則憑借實時將現(xiàn)場同聲傳譯的中文語音轉(zhuǎn)文字繼續(xù)工作。

但需要注意的是,沒有噱頭也沒有出錯的人類,更像是當天同傳工作的主角。和以往一樣,同傳工作人員被安排在所有座位后方的一間口譯室中,輪流透過耳機接收講者的訊息,然后對著麥克風進行翻譯。坐于會場中的聽眾通過特殊的音訊接收設備,收聽著同聲傳譯員的翻譯。

文章內(nèi)容系作者個人觀點,不代表對觀點贊同或支持;轉(zhuǎn)載請注明作者姓名和來源。

轉(zhuǎn)載請保留原文鏈接:http://parkingblocks4less.com/a/guona/20180924/13289.html上一篇:上一篇:正式拆分后,以 “一核兩翼”為戰(zhàn)略的全美在線前路如何?
下一篇:下一篇:沒有了