-
訊飛劉慶峰:今天,中國(guó)的大模型底座能力到底怎么樣?
推動(dòng)萬物互聯(lián)時(shí)代人機(jī)交互革命
我們觀察到GPT-4o的發(fā)布,全世界都在進(jìn)一步關(guān)注語音,其實(shí)在去年11月份的時(shí)候,Whisper已經(jīng)發(fā)了他們OpenAI的整體語音技術(shù),并把語音做成一個(gè)非常重要的方向。最近蘋果的手機(jī)大家也看到了語音技術(shù)的進(jìn)步,手機(jī)廠商對(duì)語音技術(shù)進(jìn)一步產(chǎn)生了更大的關(guān)注,而且要用它來改變所有人機(jī)交互的方式。
人類社會(huì)進(jìn)入到了萬物智能互聯(lián)的時(shí)代,越來越多的設(shè)備沒有屏幕,離我們幾米之外,不方便用鍵盤,不方便觸摸。在越來越多的時(shí)候,我們需要更自然的人機(jī)對(duì)話,用戶才能夠得到更好地體驗(yàn),更迅速地學(xué)習(xí),獲得相關(guān)生活中的幫助,我們更需要語音。
星火語音大模型再次升級(jí),會(huì)使得萬物互聯(lián)時(shí)代下人機(jī)交互的革命進(jìn)一步落得更透,這也是科大訊飛在1999年創(chuàng)業(yè)時(shí)就提出來了要實(shí)現(xiàn)人機(jī)信息溝通的無障礙。過去10年,從深度神經(jīng)網(wǎng)絡(luò)出臺(tái)之后,科大訊飛一直引領(lǐng)著語音技術(shù)的發(fā)展。我們是全世界第一個(gè)讓語音識(shí)別超過了專業(yè)速記員水平的公司,像這種會(huì)議轉(zhuǎn)寫的情況,機(jī)器翻譯超過了99%的大學(xué)六級(jí)考生,通過了國(guó)家翻譯師資格考試;個(gè)性化語音合成也給央視的節(jié)目進(jìn)行配音;我們的多語種技術(shù)在2020年代表中國(guó),在美國(guó)把訊飛列入實(shí)體清單之后,對(duì)中國(guó)極限施壓的背景下,多語種技術(shù)依然保持了全球領(lǐng)先,解決了我們的汽車、手機(jī)、智能家居等出海“卡脖子”問題。
我們非常榮幸在幾天前獲得了國(guó)家科技進(jìn)步獎(jiǎng)一等獎(jiǎng),這也是中國(guó)人工智能領(lǐng)域在深度神經(jīng)網(wǎng)絡(luò)之后的第一個(gè)國(guó)家科技進(jìn)步獎(jiǎng)一等獎(jiǎng),當(dāng)然也有中國(guó)科學(xué)技術(shù)大學(xué)、清華大學(xué)、華為、中國(guó)移動(dòng)等合作伙伴共同努力的結(jié)果。
技術(shù)進(jìn)一步發(fā)展使得我們?cè)谌f物互聯(lián)時(shí)代的人機(jī)交互標(biāo)準(zhǔn)被重新定義,它應(yīng)該要實(shí)現(xiàn)多語言多方言的交互,在遠(yuǎn)距離、高噪音場(chǎng)合下也能夠識(shí)別,能夠全雙工隨時(shí)隨地可以打斷,可以支持多模態(tài),語音、手勢(shì)、嘴型等結(jié)合。大家關(guān)注的Open AI發(fā)布的GPT-4o中最重要的一個(gè)全雙工功能,實(shí)際上使用的是科大訊飛2020年就在國(guó)際會(huì)議上提出來,在去年5月正式發(fā)布的國(guó)際標(biāo)準(zhǔn)。
目前,我們的語音識(shí)別在最主流的語種上已經(jīng)繼續(xù)保持了全球領(lǐng)先,這是多語種多方言免切換的演示,在相對(duì)安靜的手機(jī)等各種場(chǎng)景下,還有更極限的場(chǎng)合,例如強(qiáng)干擾情況下“雞尾酒會(huì)”的語音識(shí)別場(chǎng)景都能進(jìn)行識(shí)別。
伴隨著技術(shù)的最新進(jìn)步,我們也有個(gè)專門的訊飛同傳軟硬一體的翻譯系統(tǒng),這個(gè)系統(tǒng)戴上去,我在上面講話,你聽到的就是英語,當(dāng)然我們還有更多語種。同時(shí),這個(gè)翻譯系統(tǒng)是軟硬一體化的,我在后臺(tái)講話,通過語音識(shí)別、翻譯、語音合成,每個(gè)人戴著耳機(jī)就可以聽到,從而實(shí)現(xiàn)大會(huì)同傳、展廳同傳以及各種旅游同傳。一個(gè)人講話所有人聽,我們還會(huì)推出軟硬一體化的設(shè)備,讓各種語言混雜在一起可以隨意開會(huì),要把整個(gè)軟件和硬件結(jié)合在一起,來解決現(xiàn)在社會(huì)的剛需。
將來,我們?nèi)粘5臋C(jī)器人進(jìn)入到各種高噪音環(huán)境下,在各種各樣的服務(wù)場(chǎng)景下,有這樣的能力,我們就不怕機(jī)器聽不懂了。語音識(shí)別進(jìn)入到規(guī)?;褂茫?dāng)年我們?cè)谑謾C(jī)輸入法上,在全球率先提出手機(jī)語音聽寫時(shí)代開始到來,它的標(biāo)志是85%以上的準(zhǔn)確率,到89%就可以全面使用了,現(xiàn)在我們的識(shí)別中,兩個(gè)人混疊場(chǎng)景準(zhǔn)確率已經(jīng)到了91%,遠(yuǎn)超國(guó)際競(jìng)品,三混疊場(chǎng)景準(zhǔn)確率更是完全不一樣,我們準(zhǔn)確率已經(jīng)到了85%以上,但其他的只有20%多。在-5dB的高噪場(chǎng)景,噪音已經(jīng)比我們?nèi)酥v話還要高不少的情況下,我們依然能做到90%以上的準(zhǔn)確率。
因?yàn)檫@些技術(shù)進(jìn)步,我們從去年底到今年的國(guó)際連續(xù)最權(quán)威的語音識(shí)別比賽,一個(gè)是國(guó)際多通道語音分離和識(shí)別大賽CHiME-7,我們繼續(xù)拿了全球第一;另一個(gè)是今年的上半年國(guó)際聲學(xué)、語音和信號(hào)處理會(huì)議ICASSP 2024(International Conference on Acoustics, Speech, and Signal Processing)的旗艦賽事——國(guó)際車載多通道語音識(shí)別挑戰(zhàn)賽(In-Car Multi-Channel Automatic Speech Recognition Challenge,ICMC-ASR) ,科大訊飛是全球第一,這個(gè)不是中文的,是英文和多語種的比賽。
今天,我們的語音交互已經(jīng)搭載了5700多萬輛的汽車,去年中國(guó)500多萬輛汽車出海,成為中國(guó)出海的“新三樣”,其中的多語種智能語音技術(shù)幾乎全是科大訊飛提供的。不僅僅是語音,我們還將語音與大模型結(jié)合,與紅旗、奇瑞、廣汽合作,包括最近又和一汽簽訂了戰(zhàn)略合作協(xié)議,越來越多的車企開始用我們“能聽會(huì)說、能理解會(huì)思考”的汽車方案。
- 責(zé)任編輯: 沐梵 
-
專稿|任正非說的“鹽堿地”,中國(guó)光伏的希望田野
2024-06-28 09:50 -
OpenAI終止對(duì)中國(guó)提供API服務(wù),周鴻祎發(fā)聲
2024-06-26 13:53 人工智能 -
首次!我國(guó)科學(xué)家實(shí)現(xiàn)獼猴全腦尺度神經(jīng)活動(dòng)監(jiān)測(cè)
2024-06-25 18:20 科技前沿 -
習(xí)近平代表黨中央、國(guó)務(wù)院和中央軍委致電祝賀
2024-06-25 14:50 航空航天 -
專稿|不顧一切的脫鉤:美國(guó)國(guó)會(huì)為何瞄準(zhǔn)這家中國(guó)企業(yè)
2024-06-25 09:54 -
2023年度國(guó)家科學(xué)技術(shù)獎(jiǎng)勵(lì)名單公布
2024-06-24 17:46 -
“NASA和波音早就知道這個(gè)問題,但仍發(fā)射了火箭”
2024-06-24 16:23 -
李德仁、薛其坤獲2023國(guó)家最高科技獎(jiǎng)
2024-06-24 10:32 科技前沿 -
我國(guó)科研人員在月壤樣本中首次發(fā)現(xiàn)天然石墨烯
2024-06-24 09:19 嫦娥奔月 -
我國(guó)重復(fù)使用運(yùn)載火箭首次10公里級(jí)垂直起降飛行試驗(yàn)成功
2024-06-23 14:58 航空航天 -
-
全球首臺(tái)!這一重要裝備研制成功
2024-06-22 13:09 中國(guó)精造 -
專稿丨鴻蒙與安卓徹底切割,未來勝算幾何?
2024-06-21 19:35 華為 -
“加拿大決定跟,但也怕…”
2024-06-21 18:08 -
中國(guó)科學(xué)家發(fā)現(xiàn)治療免疫性血小板減少癥突破性新療法
2024-06-21 07:27 -
2024世界人工智能大會(huì)7月4日開幕,特色亮點(diǎn)搶先看!
2024-06-20 16:00 2024世界人工智能大會(huì) -
我國(guó)首個(gè)工業(yè)用途核能供汽項(xiàng)目正式建成投產(chǎn)
2024-06-19 15:17 能源戰(zhàn)略 -
“千里眼”最大“角膜”:相當(dāng)于把北京五環(huán)內(nèi)地面平整到高低差小于1毫米
2024-06-19 09:10 中國(guó)精造 -
全球首臺(tái)全高溫超導(dǎo)托卡馬克裝置在上海建成運(yùn)行
2024-06-19 08:15 -
“美國(guó)在核電技術(shù)上落后中國(guó)10-15年”
2024-06-18 16:42
相關(guān)推薦 -
最新聞 Hot
-
“特朗普夜不能寐,搞定全球問題比想象難得多”
-
靠岸中國(guó)貨船數(shù)“歸零”,美西港口官員驚到了
-
“出軌女下屬”,英國(guó)海軍一把手被免職
-
“聽加州的,否則美國(guó)最大經(jīng)濟(jì)體地位不?!?/a>
-
流浪53年后,蘇聯(lián)金星探測(cè)器墜落地球
-
伊朗官員:美國(guó)不真誠(chéng),一開始就設(shè)陷阱
-
?;鸬谝灰梗“突ハ嘀肛?zé)
-
為什么選出美國(guó)籍教皇?梵蒂岡消息人士:還不是因?yàn)樘乩势?/a>
-
普京提議:15日,俄烏直接談
-
王毅分別同印巴雙方通話
-
印度稱“不想升級(jí)”,巴方想“就此打住”
-
英法德波領(lǐng)導(dǎo)人訪問基輔,將與澤連斯基共同討論?;饐栴}
-
印軍否認(rèn)S-400防空系統(tǒng)被摧毀
-
印度前高官:勸巴基斯坦,中國(guó)的話好使
-
空中爆炸!巴軍通報(bào)7日空戰(zhàn)細(xì)節(jié),含擊落“陣風(fēng)”錄音
-
要松口了?印官員稱將“適時(shí)”公開
-