兩周前才在烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)秀了一把“實(shí)時(shí)機(jī)器翻譯”,11月30日,搜狗CEO王小川又跑去香港科技大學(xué)再度表演機(jī)器同傳,然而,接連兩次的現(xiàn)場(chǎng)演示卻在網(wǎng)絡(luò)上引發(fā)了一波“偽科技”的質(zhì)疑,主要疑問(wèn)點(diǎn)如下:
追問(wèn)一:搜狗機(jī)器同傳準(zhǔn)確率90%靠譜嗎?
在烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)上,王小川首秀搜狗實(shí)時(shí)機(jī)器翻譯,演講現(xiàn)場(chǎng)不僅實(shí)時(shí)語(yǔ)音識(shí)別顯示中文內(nèi)容,還有機(jī)器同步翻譯成英文,生成雙語(yǔ)滾動(dòng)字幕。據(jù)搜狗方面稱(chēng),其機(jī)器翻譯準(zhǔn)確率達(dá)90%,未來(lái)有望取代人類(lèi)同傳。
真的是這樣嗎?
據(jù)專(zhuān)業(yè)人士介紹,目前國(guó)際機(jī)器翻譯界衡量機(jī)翻水平,主要應(yīng)用的是IBM的watson研究中心在02年提出的BLEU方法,這種方法的思想是用翻譯結(jié)果中連續(xù)出現(xiàn)的N元組(n個(gè)單詞/字或標(biāo)點(diǎn))與參考譯文中出現(xiàn)的N元組進(jìn)行比較,計(jì)算完全匹配的N元組的個(gè)數(shù)與翻譯結(jié)果中N元組的總個(gè)數(shù)的比例。這是一種類(lèi)似準(zhǔn)確率的計(jì)算方法,它允許一個(gè)原文有多個(gè)參考譯文。
然而搜狗的90%準(zhǔn)確率卻并沒(méi)有通過(guò)類(lèi)似的嚴(yán)謹(jǐn)求證,而是僅僅憑借兩次現(xiàn)場(chǎng)展示,以及不時(shí)出現(xiàn)的“中式英語(yǔ)”翻譯,便得出“秒殺同傳、AI里程碑”的結(jié)論。
事實(shí)上,無(wú)論是谷歌微軟,還是百度有道金山等,國(guó)內(nèi)外目前對(duì)于機(jī)器翻譯的準(zhǔn)確率并沒(méi)有一個(gè)準(zhǔn)確的數(shù)據(jù),基本都以“翻譯錯(cuò)誤降低率”來(lái)衡量其進(jìn)步,而搜狗卻直接對(duì)外拋出了90%的準(zhǔn)確率,著實(shí)令業(yè)內(nèi)嘩然。
那么,為何沒(méi)有通過(guò)任何檢驗(yàn)的搜狗機(jī)器同傳,卻有自信在公開(kāi)場(chǎng)合大秀其技呢?
追問(wèn)二:時(shí)而智能時(shí)而業(yè)余,實(shí)時(shí)機(jī)翻有沒(méi)有提前排練過(guò)?
在此前烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)上,雖然翻譯結(jié)果出現(xiàn)了語(yǔ)焉不詳?shù)摹爸惺接⒄Z(yǔ)”,但還是可以勉強(qiáng)看懂。然而此次香港科技大學(xué)演示過(guò)程中,卻出現(xiàn)了前后矛盾的現(xiàn)場(chǎng)BUG。
如圖所示,當(dāng)王小川講到“計(jì)算機(jī)的智能會(huì)去顛覆一個(gè)又一個(gè)的行業(yè)”時(shí),中文字幕中的 “會(huì)”被錯(cuò)誤地識(shí)別為“匯”,然而下方的英文翻譯卻絲毫未受影響。
機(jī)器可以自動(dòng)識(shí)別錯(cuò)別字不受其影響,可謂是實(shí)時(shí)機(jī)翻的一大進(jìn)步,然而在隨后的演示中,搜狗翻譯卻又犯了一個(gè)極其低端的錯(cuò)誤——將“飛機(jī)落地”翻譯成有“墜機(jī)”之意的“fell down”。
盡管事后搜狗方面將其描述為“機(jī)器翻譯偶爾會(huì)犯的小錯(cuò)誤”,并稱(chēng)“比起要求100%的絕對(duì)準(zhǔn)確率,這種從0到1的突破與創(chuàng)新更讓人驚喜”,但這并不能讓人信服。畢竟,能智能地修正錯(cuò)誤中文,卻無(wú)法翻譯出常用詞匯,這顯然是矛盾的。
此外,這些BUG的出現(xiàn)也不禁讓人質(zhì)疑,難不成機(jī)器翻譯早已熟知稿件,而并非根據(jù)實(shí)時(shí)中文來(lái)進(jìn)行翻譯?據(jù)了解,以機(jī)器翻譯界的目前發(fā)展?fàn)顩r,如果將演講稿提前翻譯出來(lái),在短時(shí)間內(nèi)對(duì)機(jī)器進(jìn)行強(qiáng)化訓(xùn)練,也確實(shí)可以達(dá)到演示級(jí)別的效果。比如在上圖中,將“顛覆一個(gè)又一個(gè)的行業(yè)”翻譯成“turn a new industry”,便是較為明顯的人工干預(yù)結(jié)果。
面對(duì)眾說(shuō)紛紜的猜測(cè),搜狗方面并沒(méi)有回應(yīng)。事實(shí)上,想要解釋這個(gè)問(wèn)題并不難,只要讓用戶(hù)來(lái)嘗試一番便能得出最直接的產(chǎn)品評(píng)測(cè),然而,從始至終,不知道你發(fā)現(xiàn)沒(méi)有,搜狗實(shí)時(shí)機(jī)翻的用戶(hù)只有王小川一人。
追問(wèn)三:只聞其聲不見(jiàn)其形,搜狗機(jī)器同傳何時(shí)才能真正落地?
從烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)到香港科技大學(xué),搜狗一路對(duì)外展示實(shí)時(shí)機(jī)器翻譯的黑科技, “準(zhǔn)確率達(dá)90%”、“取代人類(lèi)同傳”等宣傳引起了媒體和用戶(hù)的關(guān)注與好奇,然而卻對(duì)產(chǎn)品技術(shù)真正的落地時(shí)間、何時(shí)實(shí)現(xiàn)大規(guī)模用戶(hù)體驗(yàn)等問(wèn)題三緘其口。
技術(shù)成型卻無(wú)法落地產(chǎn)品,能夠在千人圍觀的發(fā)布會(huì)現(xiàn)場(chǎng)展示卻無(wú)法向用戶(hù)開(kāi)放試用,搜狗此舉不禁讓外界質(zhì)疑是在為用戶(hù)“畫(huà)餅”以增加自己贏得市場(chǎng)的機(jī)會(huì)。
產(chǎn)品未出,概念先行,“猶抱琵琶半遮面”的搜狗實(shí)時(shí)機(jī)器翻譯究竟何時(shí)才能走進(jìn)用戶(hù)視野、帶來(lái)真實(shí)的使用體驗(yàn),目前來(lái)看仍然是一個(gè)謎。
追問(wèn)四:秒殺人類(lèi)同傳,是技術(shù)的自信還是對(duì)翻譯行業(yè)的消費(fèi)?
在搜狗對(duì)實(shí)時(shí)機(jī)器翻譯的傳播中,“秒殺同傳”、“取代人類(lèi)翻譯”的言辭頻頻出現(xiàn),王小川甚至在個(gè)人微博上宣稱(chēng)“機(jī)器人登場(chǎng),以后別讓孩子再報(bào)考同聲傳譯專(zhuān)業(yè)了”。那么,搜狗的實(shí)時(shí)機(jī)器翻譯是否真的可以完全取代人類(lèi)同傳呢?
事實(shí)上,同聲傳譯需要有極高的資格才可以擔(dān)任。根據(jù) AIIC(國(guó)際會(huì)議口譯員協(xié)會(huì))的規(guī)定,同傳譯員需要翻譯出演講者內(nèi)容的80%,(90 %~100 %的“同傳”幾乎不可能)。在同聲傳譯中,譯員需要遵循順句驅(qū)動(dòng)、隨時(shí)調(diào)整、適度超前、信息重組、合理簡(jiǎn)約、信息等值等基本原則,此外,由于演講者講話速度普遍較快,演講中可能摻雜各地口音和方言,同傳譯員還需要調(diào)動(dòng)自己的一切知識(shí)儲(chǔ)備和經(jīng)驗(yàn)全力以赴。
無(wú)論是兩國(guó)外交,還是商業(yè)合作,扮演實(shí)時(shí)溝通角色的同傳都是值得敬畏和尊重的,而這不應(yīng)該作為機(jī)器翻譯成熟路上的“噱頭”來(lái)消費(fèi)。
在知乎上,北京語(yǔ)言大學(xué)高級(jí)翻譯學(xué)院教師PKUCATer表示,從搜狗機(jī)器翻譯的現(xiàn)場(chǎng)表現(xiàn)看, 90%準(zhǔn)確率是很讓人懷疑的,“不客氣的說(shuō),沒(méi)有一句話是翻譯對(duì)的”?磥(lái),搜狗取代人類(lèi)同傳的高調(diào)口號(hào)在短期內(nèi)還只是空談。
追問(wèn)五:過(guò)度的夸張與宣傳 人工智能正在被誰(shuí)消費(fèi)?
人工智能的發(fā)展,迄今已有六十多年,期間經(jīng)歷過(guò)兩次高峰和兩次低谷。上世紀(jì)80年代,“專(zhuān)家系統(tǒng)”的AI程序開(kāi)始為全世界的公司所采納,而“知識(shí)處理”成為了主流AI研究的焦點(diǎn)。1981年,日本經(jīng)濟(jì)產(chǎn)業(yè)省撥款八億五千萬(wàn)美元支持第五代計(jì)算機(jī)項(xiàng)目,其目標(biāo)是造出能夠與人對(duì)話,翻譯語(yǔ)言,解釋圖像,并且像人一樣推理的機(jī)器。
但由于當(dāng)時(shí)計(jì)算機(jī)的運(yùn)算能力的限制和算法的難以收斂直接導(dǎo)致了直到2000年第二次AI的冬天。日本第五代計(jì)算機(jī)的研制最終宣告失敗,并大幅削減投入。
讓備受期待的人工智能跌入低谷,或許是圍觀群眾們的過(guò)度樂(lè)觀,然而更多的責(zé)任卻源于企業(yè)與媒體不負(fù)責(zé)任的夸張與宣傳。
“烏鎮(zhèn)技術(shù)改變世界,搜狗“黑科技”或顛覆同傳產(chǎn)業(yè)”
“王小川WIC演講秀搜狗實(shí)時(shí)機(jī)器翻譯技術(shù) 準(zhǔn)確率90%有望取代人類(lèi)同傳”
“世界互聯(lián)網(wǎng)大會(huì)搜狗秀AI黑科技 實(shí)時(shí)機(jī)器翻譯秒殺同傳”
……
盡管人工智能已成為2016年度熱詞,但對(duì)于大部分人而言,依然沒(méi)有時(shí)間或者機(jī)會(huì)去了解。如果科技公司給予人們太多不切實(shí)際的幻想,那么無(wú)形中也將透支著公眾對(duì)于AI的興趣。
此外,通過(guò)試用國(guó)內(nèi)外其他翻譯軟件我們也會(huì)發(fā)現(xiàn),神經(jīng)機(jī)器翻譯系統(tǒng)目前所能做的只是優(yōu)化翻譯結(jié)果,并不是萬(wàn)能藥,將其作為黑科技大書(shū)特書(shū),過(guò)分拔高人們對(duì)于機(jī)器翻譯實(shí)際水平的期待,實(shí)際上并不可取。
沒(méi)有權(quán)威的考核標(biāo)準(zhǔn),缺乏臨場(chǎng)應(yīng)變的實(shí)力,頻遭翻譯領(lǐng)域人士吐槽……搜狗如今面臨的困境恰如昔日的南郭先生,面對(duì)好合奏的宣王,尚可在人工智能的隊(duì)伍里濫竽充數(shù),然而一旦面臨喜歡獨(dú)奏的的湣王,卻難以承受每一個(gè)用戶(hù)個(gè)體的考驗(yàn)。想要趁早擺脫偽科技公關(guān)秀的帽子,為今之計(jì),只有快速落地產(chǎn)品了。