上周,在上海接連舉行了兩場高級別的會議——2018世界人工智能大會和中國國際工業(yè)博覽會,其主題論壇的屏幕上,除了PPT還多了一個新角色——科大訊飛的訊飛聽見,為現(xiàn)場提供語音識別和翻譯工作。然而,這場AI落地最直觀的“秀”卻在會議結(jié)束后引發(fā)巨大爭議。
工博會系列活動之2018創(chuàng)新與新興產(chǎn)業(yè)發(fā)展國際會議(IEID)的一場高端裝備技術(shù)與產(chǎn)業(yè)分會上,現(xiàn)場同傳譯員、知乎用戶Bell Wang爆料稱,科大訊飛是在識別出譯員說的中文譯文后,再將譯文投放到屏幕和直播中,此舉事先并沒告知自己,涉嫌冒名使用翻譯成果和侵犯知識產(chǎn)權(quán)。
此后,科大訊飛兩次對此做出回應(yīng),強調(diào)從未“隱瞞”轉(zhuǎn)寫同傳聲音,不存在侵犯同聲傳譯知識產(chǎn)權(quán)的可能性。最新消息稱,科大訊飛已與Bell Wang進行了溝通,Bell Wang接受科大訊飛的解釋。
此事之所以引發(fā)如此風(fēng)波,恰因它戳中了人們對人工智能一直存在的心結(jié):機器人會不會替代人類?哪些工種未來會消失?
人工智能翻譯機自面世以來,就一直被冠以“很好很強大”的標(biāo)簽,譯員被替代似乎也是一件順理成章的事,但事實證明,要想真正做到“信達雅”,AI的能力還遠遠不夠。
翻譯機暫時還不能幫助譯員
當(dāng)Bell Wang爆出科大訊飛翻譯機“引用”了譯員的翻譯成果之后,科大訊飛對此的解釋是“人機耦合”,科大訊飛機器翻譯產(chǎn)品經(jīng)理劉晨璇向媒體表示,“人機耦合”可以降低譯員工作者工作強度、賦能翻譯人員。但是,記者采訪的幾位同傳譯員都表示,基本上不會接收翻譯機給出的信息。
小月(化名)是一名從事同傳工作7年的譯員,在她看來,譯員在工作期間基本用不上翻譯機?!霸谶M行翻譯時,以聽和說為主,同傳間電腦上播放演講者的PPT只是作為參考,還要事先準(zhǔn)備相關(guān)的單詞表,基本沒法分心去看其他資料。而且很多演講者會即興發(fā)揮,此時,譯員必須‘拋棄’手中的材料,邊聽邊譯邊說,集中精力很重要。”更為關(guān)鍵的是,翻譯機無法保證百分之百的準(zhǔn)確率?!坝绕涫桥龅娇谝舯容^重的演講者,翻譯機更容易出錯,如果以翻譯機的翻譯結(jié)果為準(zhǔn),也會出現(xiàn)差錯或帶來干擾?!?小月說道。
德英漢譯員高大玉對此也深有同感,她告訴《IT時報》記者,以進行德漢翻譯為例,如果聽到德語方言,在她腦中,首先要把德語方言轉(zhuǎn)化為標(biāo)準(zhǔn)德語,再把標(biāo)準(zhǔn)德語轉(zhuǎn)化為漢語。如果由翻譯機來翻譯,對于德語方言的把握不一定很準(zhǔn)確,“翻譯機比較固化,設(shè)置德漢翻譯,它只能進行德漢翻譯,如果演講者夾雜說幾句英文,翻譯機就會識別錯誤或者識別不出來。翻譯現(xiàn)場會出現(xiàn)很多意外情況,例如一詞多義,是翻譯機沒有辦法應(yīng)付的?!?span style="box-sizing: border-box; font-weight: 700;">在高大玉看來,翻譯機最適合做的是說明性文章的翻譯,比較硬性,文學(xué)性和口語化程度較低的文章,“人說出的話偏口語化,前后語序會根據(jù)演講者的習(xí)慣變化,譯員會根據(jù)聽到的單詞調(diào)整邏輯順序,翻譯機則不行,形式語言不可能代替自然語言。”
會務(wù)市場譯員地位很牢固
在新技術(shù)不斷迭代的今天,每天都在舉行數(shù)不勝數(shù)的會議、論壇,其中很大一部分需要翻譯,當(dāng)人工智能翻譯機出現(xiàn)后,也有一些會議屏幕上出現(xiàn)了同步翻譯,它們讓譯員們擔(dān)心嗎?
主要承接金融和互聯(lián)網(wǎng)會議的會務(wù)服務(wù)商萬池文化創(chuàng)始人李超告訴《IT時報》記者,目前,很少有客戶在籌辦會議時提出要用翻譯機,基本上大家默認的都是用譯員,因為翻譯機的準(zhǔn)確率、應(yīng)變能力有待考量。“我們會向客戶推薦一些智能產(chǎn)品,但不是翻譯機,目前,翻譯機在會務(wù)用途上的占比還是很低的?!崩畛f,和翻譯機相比,請譯員要付出的成本會高很多,一個資深譯員每小時至少2000元起,而一個翻譯機也就上千元,而且能夠重復(fù)使用,但大家還是傾向于譯員。這個“日進千金”的行業(yè)看似風(fēng)光,實則是對譯員的“腦力壓榨”。
記者采訪了幾家企業(yè),他們均表示籌辦會議時沒有考慮過翻譯機,第一選擇還是譯員。“我們認為譯員比較靠譜,尤其是一些比較技術(shù)性的高端會議或者權(quán)威研討,而翻譯機還是旅游自用比較好?!币患医鹑诳萍计髽I(yè)的相關(guān)人士表示。
數(shù)據(jù)顯示,全球95%的國際高端會議都會采用同聲傳譯的方式進行。陸先生是人工智能語音公司凝趣科技的銷售人員,他告訴《IT時報》記者,他們的產(chǎn)品以個人用戶為主,在會務(wù)上推廣翻譯機的難度很大,“會務(wù)翻譯對于專業(yè)度的要求更高,因此,需要更長的開發(fā)周期和更高的研發(fā)成本,因此市場占有率非常小,對于我們來說營銷難度也比較高?!?/p>
在翻譯圈內(nèi),譯員們的心態(tài)相當(dāng)樂觀,一致認為譯員的飯碗穩(wěn)得很,絕不會被機器搶走。
人機耦合要技術(shù)也要倫理
對于Bell Wang的爆料,一位曾在IEID現(xiàn)場參會的同事告訴記者,科大訊飛董事長劉慶峰在當(dāng)天也有演講,且在演講中坦承,IEID的翻譯采用了人機耦合的方式,并不是機器離線翻譯。這點側(cè)面印證了科大訊飛的回應(yīng)。事實上,現(xiàn)場劉慶峰明確表示,人機耦合是人工智能下一步的關(guān)鍵技術(shù)之一,“人機耦合將協(xié)助我們提高效率,也就是人工智能系統(tǒng)和人類行為協(xié)作結(jié)合大幅提高工作效率,這種方式不僅僅是技術(shù)發(fā)展趨勢,更是社會倫理發(fā)展的需求?!?/p>
之所以如此強調(diào)人機耦合,是因為目前對于語音、語義的識別,人工智能領(lǐng)域內(nèi)仍有很多難以解決的問題。專注于智能語音、語義理解等人工智能技術(shù)研究與應(yīng)用的捷通華聲CTO李健告訴《IT時報》記者,翻譯機不是一個單一的翻譯系統(tǒng),它至少融合了語音識別、機器翻譯以及語音合成三項技術(shù)的復(fù)雜系統(tǒng),在輸入正確的情況下,有些翻譯確實已經(jīng)媲美人類,但在語音識別方面,機器與人的差距明顯,“安靜環(huán)境下,一般語音識別可以達到90%以上的準(zhǔn)確率,但在復(fù)雜環(huán)境下,特別是嘈雜多人的會議場景中,就算目前最頂尖的語音識別公司,識別率也只有70%-80%,這意味著,當(dāng)機器翻譯時已經(jīng)有20%~30%識別是錯誤的,而人類在復(fù)雜環(huán)境下的語音識別率至少在95%以上?!?/p>
此外,單純從翻譯角度來講,目前基于深度學(xué)習(xí)的機器翻譯,對于訓(xùn)練過的文本語料或者類似文本,或許可以翻譯得很好,但對于和訓(xùn)練文本差異很大的文本,翻譯能力便會大幅度下降,機器不具備人類面對復(fù)雜情況的應(yīng)變能力和面對錯誤的糾錯聯(lián)想能力。
李健表示,人機耦合是人和機器的優(yōu)勢互補,達到1+1>2的效果,這點在速記行業(yè)已經(jīng)得到很好驗證,但翻譯是個遠比速記復(fù)雜的系統(tǒng)工作,人工智能目前的學(xué)習(xí)能力還不夠。
在科大訊飛兩次回應(yīng)后,Bell Wang表示接受解釋,但同時他也建議,科大訊飛未來與譯員可能合作時,需要得到譯員的知情同意,并簽訂協(xié)議;需要使用譯員有知識產(chǎn)權(quán)的翻譯內(nèi)容時,也需要得到許可。這其實是對新技術(shù)下的法律和倫理提出了新的要求。
復(fù)旦大學(xué)哲學(xué)系教授徐英瑾認為,即使人機耦合也有倫理責(zé)任,涉及知識產(chǎn)權(quán),“如果人機耦合中,人類并不知道自己的成果被利用,那這并不是真正的人機耦合?!?/p>