-
“你打籃球像蔡徐坤”:微信翻譯這個bug是怎么回事?
關(guān)鍵字: 微信翻譯蔡徐坤打籃球bug吳亦凡
硅星人認(rèn)為,微信應(yīng)該進一步、更加詳細(xì)地告知我們:這個bug為什么會出現(xiàn),由哪些因素所導(dǎo)致。
一方面,微信翻譯背后的技術(shù)確實比較復(fù)雜。解釋它,有助于用戶去理解它的工作原理,明白這個翻譯結(jié)果的背后,可能有著十分復(fù)雜的技術(shù)原因。
另一方面,你關(guān)掉了"you are so"句式,還會出現(xiàn)學(xué)校簡稱;關(guān)了學(xué)校簡稱,還會有更多會觸發(fā)bug的詞被發(fā)現(xiàn)。發(fā)現(xiàn)一次關(guān)一次?這樣傷害的是正常使用翻譯功能用戶的體驗,長此以往總不是辦法。
遺憾的是,微信方面表示,以上面微博為準(zhǔn),不再更多置評(或許是因為不想繼續(xù)惹惱蔡徐坤的粉絲吧。)同時,中文互聯(lián)網(wǎng)上完全找不到針對此事靠譜的技術(shù)解答,即便在知乎上,相關(guān)主題下面也都是用戶在分享自己發(fā)現(xiàn)的bug截圖,沒有人解釋原因。
既然這樣,不妨讓硅星人來試試?
我們采訪了多位機器學(xué)習(xí)專家,并在接下來的篇幅里 1)解釋微信翻譯用的到底是什么技術(shù);2)再嘗試回答"you play basketball like caixukun" 這句話,為什么在微信翻譯里被翻錯了。
微信翻譯用的是什么技術(shù)?
硅星人經(jīng)過多方面了解,確信微信英漢互譯系統(tǒng)采用的是目前機器學(xué)習(xí)領(lǐng)域比較火的“神經(jīng)機器翻譯”(Neural Machine Translation, 簡稱 NMT) 技術(shù),由微信AI團隊自研。
從外行人的角度來看,NMT在翻譯一句話時,做了這些事情:
Step 1: 在一定程度上模仿人腦的思維方式,NMT根據(jù)一個單詞在整個句子(可以是長句)當(dāng)中的語境,為這個單詞建立一個神經(jīng)網(wǎng)絡(luò)的模型,形成一個語義表示。
比如單詞是英語的 dog,可以理解為NMT在它的“大腦”里形成了一條狗的印象。
Step 2: 按照在句子甚至段落中的語境,將模型重新轉(zhuǎn)化成另一種語言。
比如 dog 翻譯成法語就是 “l(fā)e chien”;但如果語境是“一條狗生下了小狗”,那么 dog 就會被翻譯成陰性的"la chienne"。
(NMT不是真的在大腦中形成狗的視覺印象,事實上整個過程跟圖像完全沒有任何關(guān)系。這個所謂的“印象”,通過一連串向量 (vector) 表示。狗的例子來自于 Microsoft Translator [1])
NMT的主要優(yōu)勢是對長句子(甚至段落)有著不俗的翻譯能力,閱讀起來上下文連貫程度接近人翻。問世之后,NMT 也逐漸被微軟、Google、百度、騰訊等大公司的翻譯產(chǎn)品所采用。
“機翻技術(shù)一直在不斷迭代更新,以前基于規(guī)則,過去十年主要基于統(tǒng)計,現(xiàn)在我們開始用神經(jīng)網(wǎng)絡(luò)。神經(jīng)機器翻譯是目前機器翻譯上比較火的一項技術(shù)。我們絕大多數(shù)的大語種翻譯已經(jīng)基于這個技術(shù)了,“在美國一家頂級科技公司的研究分支擔(dān)任資深研究員的王夏*告訴硅星人。
”在機翻技術(shù)發(fā)展的每個階段,科研人員都會遇到一些問題。NMT也存在一些問題,比如整個過程的可解釋性是非常低的,”他說。
硅星人翻譯一下這句話的意思:在具體案例的層面上,一個NMT的系統(tǒng)為什么會把一句話 ABCDE 翻譯成 abcde,研究者目前是很難將翻譯過程解釋清楚的。
這句話為什么被翻錯了?
當(dāng)NMT翻錯了的時候,可能發(fā)生了哪些情況?
其實錯沒錯、錯誤嚴(yán)重不嚴(yán)重,都是人來決定的。在機器眼里沒有對錯,選定的答案就是機器認(rèn)為概率最高或最有可能的那個答案,因為一切都按照模型、算法運轉(zhuǎn)著。
接受這一點,你才能理解這句話為什么翻錯。
接下來進入正題
- 原標(biāo)題:“你打籃球像蔡徐坤”:微信翻譯這個bug是怎么回事?
- 責(zé)任編輯:程北墨
- 最后更新: 2019-03-07 10:26:12
-
中國頁巖氣單井日產(chǎn)量創(chuàng)新高
2019-03-07 07:28 能源戰(zhàn)略 -
蘋果供應(yīng)商曬折疊屏大招:正研發(fā)可折玻璃
2019-03-06 21:38 蘋果新“品” -
去年我國研發(fā)經(jīng)費支出近2萬億元,比上年增11.6%
2019-03-06 21:03 科技前沿 -
只差一塊錢,小米9和iQOO到底誰更香?
2019-03-06 17:41 手機 -
中國存儲器能否打破海外壟斷?
2019-03-06 17:29 TMT觀察 -
-
小米盧偉冰總結(jié)魅族Note 9:遺憾還在繼續(xù)
2019-03-06 17:06 -
三星正研發(fā)兩款折疊屏手機,一款類似華為Mate X
2019-03-06 16:22 大公司 -
去年全球智能手機出貨量減少5.1% 北美銳減13.2%
2019-03-06 14:57 手機 -
觀點:提速降費與5G使能兼顧 運營商如何兼顧
2019-03-06 13:30 -
格力手機3代上架官網(wǎng) 售價3600元
2019-03-06 13:22 -
動工在即!華為要用100億打造上海青浦研發(fā)基地
2019-03-06 12:14 大公司 -
“夜視眼藥水” 治色盲有戲
2019-03-06 11:14 -
最新報告:萬億研發(fā)經(jīng)費,中國都花在哪兒了?
2019-03-06 10:28 科技前沿 -
蘋果iPhone XI配置曝光:三攝、水下模式、黑暗模式
2019-03-05 20:10 手機 -
中國空間站安排上了!將首次向國際開放
2019-03-05 19:30 航空航天 -
銷量不佳,iPhone再次全網(wǎng)瘋狂降價
2019-03-05 18:23 手機 -
張小龍請回答:微信這些功能是咋想的?
2019-03-05 14:27 TMT觀察 -
英特爾與紫光展銳5G情斷,2大關(guān)鍵因素露餡
2019-03-05 13:49 TMT觀察 -
紫光展銳自主研發(fā)的春藤510是一款怎樣的5G芯片?
2019-03-05 13:37 科技前沿
相關(guān)推薦 -
最新聞 Hot
-
拉夫羅夫:西方離間中印
-
駐韓美軍放話:我們讓中俄改變算法
-
“俄方反對美國代表參與”
-
臺當(dāng)局我知道你很急,但是你別急…
-
澳大利亞直說了:中國可是我們最大買家,美國你算啥?
-
美企急電:快取消越南、印尼訂單,轉(zhuǎn)回中國
-
加拿大:出人意料,是中國而非美國
-
一個說毫無成果,一個說滿意
-
“日本決定要更硬氣,不然…”
-
跪了?“還沒”
-
終于談上了,俄方要求美土離場
-
“無論承認(rèn)與否,硅谷精英變成‘中國必勝論’擁躉”
-
9500車位、全球最大!首航赴歐洲,“彰顯中國雄心”
-
黃楊鈿甜佩戴高價耳環(huán)引網(wǎng)友質(zhì)疑,經(jīng)紀(jì)公司回應(yīng)
-
槍殺安倍嫌犯將于10月首次公審
-
俄烏土耳其談判將安排兩輪對話:土美烏先聊,土俄烏再談
-