現(xiàn)在位置:主頁 > 國內(nèi) > 《2021-2022中國智能語音產(chǎn)業(yè)發(fā)展報告》:新需求爆發(fā),市場迎來黃金期

《2021-2022中國智能語音產(chǎn)業(yè)發(fā)展報告》:新需求爆發(fā),市場迎來黃金期

作者:編輯 ? 時間:2023-01-13 ? 瀏覽:人次

image.png

1月11日,由國家工業(yè)信息安全發(fā)展研究中心主辦,科大訊飛股份有限公司、國家語音及圖像識別產(chǎn)品質(zhì)量檢驗檢測中心、國家智能語音創(chuàng)新中心協(xié)辦的中國智能語音產(chǎn)業(yè)發(fā)展高峰論壇暨2022年中國語音產(chǎn)業(yè)聯(lián)盟年會成功舉辦。

工業(yè)和信息化部信息技術(shù)發(fā)展司副司長王威偉,中國科學(xué)院院士姚建銓,國家工業(yè)信息安全發(fā)展研究中心副主任、國家語音及圖像識別產(chǎn)品質(zhì)量檢驗檢測中心主任何小龍,聯(lián)盟理事長、科大訊飛董事長劉慶峰,科大訊飛總裁吳曉如,清華大學(xué)語音和語言技術(shù)中心主任、北京得意音通技術(shù)有限責(zé)任公司董事長鄭方,北京海天瑞聲科技股份有限公司副總經(jīng)理、首席科學(xué)家郝玉峰,國家智能語音創(chuàng)新中心總經(jīng)理吳江照等通過訊飛聽見云會議的形式線上參會。會議由聯(lián)盟秘書長、國家工業(yè)信息安全發(fā)展研究中心人工智能所副所長劉永東主持。

會上,中國語音產(chǎn)業(yè)聯(lián)盟發(fā)布《中國智能語音產(chǎn)業(yè)發(fā)展報告(2021-2022)》,報告指出,我國智能語音產(chǎn)業(yè)整體發(fā)展環(huán)境積極向好,多項關(guān)鍵技術(shù)取得突破,產(chǎn)業(yè)扎根不斷深入,已形成大中小企業(yè)融通創(chuàng)新、協(xié)同發(fā)展的健康生態(tài)。

市場規(guī)模高速增長,龍頭企業(yè)占據(jù)主導(dǎo)份額

智能語音作為智能時代人機交互的關(guān)鍵接口,各行業(yè)爆發(fā)式的場景需求驅(qū)動行業(yè)發(fā)展進入黃金期,技術(shù)突破和應(yīng)用落地不斷深入。從全球范圍來看,2022年全球智能語音產(chǎn)業(yè)規(guī)模將達351.2億美元,保持33.1的高速增長;從我國來看,根據(jù)德勤統(tǒng)計數(shù)據(jù),2022年我國智能語音市場將達341億元,同比增長13.4。

報告指出,以科大訊飛為代表的語音龍頭企業(yè)布局較廣,是行業(yè)創(chuàng)新發(fā)展的支柱,占據(jù)較大市場份額。同時,科大訊飛、百度、阿里等龍頭企業(yè)通過打造技術(shù)能力開放平臺,構(gòu)建開源生態(tài),引領(lǐng)行業(yè)技術(shù)創(chuàng)新和應(yīng)用開發(fā)。以訊飛開放平臺為例,目前已開放545項AI產(chǎn)品及能力,聚集超過380.5萬開發(fā)者團隊,開發(fā)出超過159.5萬個AI應(yīng)用,并從AI龍頭+開發(fā)者的“二維”生態(tài),升級到AI龍頭+行業(yè)龍頭+開發(fā)者的“三維”生態(tài),聯(lián)合行業(yè)龍頭搭建基線系統(tǒng),讓更多開發(fā)者參與到數(shù)字經(jīng)濟浪潮中。

關(guān)鍵技術(shù)突破,筑牢行業(yè)堅實底座

“2022年是智能語音技術(shù)突破的關(guān)鍵年”,報告指出,我國智能語音企業(yè)在多項難點技術(shù)上實現(xiàn)新的突破。縱向上從語音識別、合成、翻譯向計算機視覺、認(rèn)知智能、運動智能領(lǐng)域延伸,橫向上從單點技術(shù)突破模式發(fā)展到機器認(rèn)知、多模式復(fù)雜場景應(yīng)用。

在語音識別方面,視聽融合的多模態(tài)交互技術(shù)成為技術(shù)演進的主要方向。科大訊飛多模語音增強技術(shù)融合語音與視覺的多模感知,讓高噪音場景下的語音交互跨過實用門檻,率先在車載、會議、地鐵購票和醫(yī)療掛號等場景落地。此外,針對低資源語音識別難題,海天瑞聲和科大訊飛分別從語音數(shù)據(jù)和算法層面推動技術(shù)進步。

在語音合成方面,隨著電商直播等行業(yè)的繁榮,語音合成技術(shù)也表現(xiàn)出擬人化、口語化的發(fā)展趨勢。科大訊飛多風(fēng)格多情感語音合成系統(tǒng)SMART-TTS可提供11種強度可調(diào)的情感合成能力。而火山語音的超自然對話語音合成和META的語音對語音翻譯(speech-to-speech translation, S2ST),通過在模型訓(xùn)練中添加副語言數(shù)據(jù),讓語音交互更加自然和個性化。

要促進智能語音技術(shù)持續(xù)突破,與會專家從兩個方向提出了發(fā)展路徑。一方面,姚建銓院士指出,針對智能語音多學(xué)科交叉的學(xué)科特性,研究人員需要探索新原理、新機制、新材料、新工藝和新器件,集成創(chuàng)新推動核心技術(shù)進步;另一方面,語音技術(shù)需要進一步向深度理解延伸,科大訊飛總裁吳曉如表示:“更先進的語音交互系統(tǒng)不僅要‘能聽會說’,還要深度地去理解人的信息”,自然語言理解和知識推理技術(shù)的進步,讓機器可以在越來越多的領(lǐng)域幫助人類解決更專業(yè)和復(fù)雜的問題。

應(yīng)用規(guī)?;涞?,加速與實體經(jīng)濟融合

報告指出,受疫情和產(chǎn)業(yè)數(shù)字化、智能化轉(zhuǎn)型影響,智能語音應(yīng)用場景迅速鋪開。據(jù)德勤統(tǒng)計數(shù)據(jù),預(yù)計到2030年,智能語音消費級和企業(yè)級應(yīng)用市場將分別超過700億和千億規(guī)模。

在消費者產(chǎn)品領(lǐng)域,AI學(xué)習(xí)機、翻譯筆等AI+學(xué)習(xí)產(chǎn)品幫助學(xué)生學(xué)習(xí)減負(fù)增效;智能錄音筆、智能辦公本、智能鼠標(biāo)等AI+辦公產(chǎn)品深受職場人士歡迎;AI翻譯機、智能麥克風(fēng)、智能語音鍵盤、智能耳機、智能助聽器等AI+生活產(chǎn)品,讓更多人享受AI科技的便利。

在汽車領(lǐng)域,智能語音已成人機交互關(guān)鍵環(huán)節(jié),并從車內(nèi)交互衍生車外交互,從單模交互走向多模交互,從被動交互發(fā)展為主動交互,為車企提供全棧技術(shù)賦能。以科大訊飛為代表的國內(nèi)AI龍頭已占據(jù)中國語音交互車端應(yīng)用行業(yè)的領(lǐng)先地位。

在運營商領(lǐng)域,智能語音技術(shù)與健康養(yǎng)老、家庭教育、家庭娛樂等場景結(jié)合,帶來更加智慧的家庭生活體驗。融合5G與機器翻譯技術(shù)的無障礙智能通信,讓普通的 5G 手機用戶,不用下載任何軟件,就可以使用實時翻譯和轉(zhuǎn)寫服務(wù),實現(xiàn)跨語種的無障礙視頻通話。

在教育領(lǐng)域,科大訊飛全球中文學(xué)習(xí)平臺已覆蓋全球183個國家,吸引300多萬海外中文學(xué)習(xí)愛好者使用;利用智能語音和人工智能技術(shù)可實現(xiàn)英語聽說教、學(xué)、考、評、管一站式服務(wù),減少無效訓(xùn)練。

在醫(yī)療領(lǐng)域,去年疫情期間,科大訊飛電話機器人助力全國31個省112個地市疫情排查,累計服務(wù)超1.1億人次;智能外呼和智醫(yī)助理可用于獨居老人、留守兒童的日常關(guān)愛和兜底保障。

在城市領(lǐng)域,智能語音技術(shù)已在安徽省一體化網(wǎng)上政務(wù)服務(wù)平臺、聊城城市大腦、三亞市崖州灣科技城智慧產(chǎn)城園區(qū)、天津市AI銀發(fā)智能服務(wù)平臺等創(chuàng)新示范項目中應(yīng)用。姚建銓院士指出,智能語音與建設(shè)智慧城市的要求完全吻合,可以實現(xiàn)各種語音高效轉(zhuǎn)換和智能處理,為智慧城市進一步建設(shè)帶來新的機遇。

在工業(yè)領(lǐng)域,我國打造了包括國家智能語音創(chuàng)新中心在內(nèi)的一批語音技術(shù)創(chuàng)新“國家隊”, 開展工業(yè)聲學(xué)、多語種、AI語音芯片等關(guān)鍵共性技術(shù)研究工作。科大訊飛聯(lián)合國家智能語音創(chuàng)新中心打造的工業(yè)聽診器、聲學(xué)成像儀、工業(yè)設(shè)備衛(wèi)士、智能巡檢機器人等“工業(yè)六感”產(chǎn)品,已廣泛應(yīng)用到生產(chǎn)、質(zhì)檢、巡檢等多個工業(yè)環(huán)節(jié)。

在金融領(lǐng)域,聲紋識別技術(shù)已經(jīng)被應(yīng)用在各類身份認(rèn)證環(huán)節(jié)。得意音通董事長鄭方表示,聲紋是目前除DNA外,最可靠的身份認(rèn)證方式,相比傳統(tǒng)方法具有明顯優(yōu)勢。此外,科大訊飛智能客服機器人、智能聯(lián)絡(luò)中心AICC等AI+金融應(yīng)用,幫助金融機構(gòu)提升客服和運營效率。

展望智能語音產(chǎn)業(yè)未來發(fā)展,報告認(rèn)為,后競爭時代亟需關(guān)注新增的不確定性因素,包括核心關(guān)鍵技術(shù)能力仍需提升,開源生態(tài)培育仍需加大投入,重點應(yīng)用場景落地仍需提速,傳統(tǒng)行業(yè)開放場景動能不足等。

轉(zhuǎn)載請保留原文鏈接:http://parkingblocks4less.com/a/guona/20230113/74594.html上一篇:上一篇:智算中心如何“好用、用好”?《智算中心創(chuàng)新發(fā)展指南》給出建議
下一篇:下一篇:沒有了