現(xiàn)在位置:主頁 > 社會 > 搜狗語音:科技向善的愿景與落地

搜狗語音:科技向善的愿景與落地

作者:編輯 ? 時間:2018-10-29 ? 瀏覽:人次

在人類歷史的車輪中,「科技」始終都是最為舉足輕重的碾壓與推動力,其對于社會底層民眾及弱勢群體也有著雙刃劍般的意義。

宏觀科技發(fā)展推動下的生產(chǎn)力進步自然會為整個社會帶來下限整體提高的福祉,這一點早已從過往數(shù)次工業(yè)革命的顛覆性影響中得到了印證。

但另一方面,生產(chǎn)力越發(fā)達,那些更難適應(yīng)生產(chǎn)力變化的弱勢群體所面臨的問題就更多,這不僅僅體現(xiàn)在生產(chǎn)效率的提升會讓底層勞動者面臨被淘汰的厄運,對于老年人、殘障人士等弱勢群體而言,他們想要跟上時代的步伐就要付出更多努力。

僅以最近一次科技革命為例,互聯(lián)網(wǎng)技術(shù)的普及應(yīng)用呈現(xiàn)出了顛覆知識分配體系以及信息溝通渠道為核心的特色,前者將信息變成了最重要的生產(chǎn)資料之一,并且將它的分配形式進行了重塑,也正是這一威力巨大的特征讓學者們詬病,認為科技正在制造社會中的斷層 —— 弱勢群體正面對比以往更可怕的機會差異。

在這樣的背景下,那些掌握著先進技術(shù)與社會話語權(quán)的科技企業(yè)們,其自身形象就映射著社會走向 —— 能否讓包括但不限于弱勢群體在內(nèi)的任何人都有權(quán)力、平等、方便地享受到科技進步的普惠成果,將決定文明社會的最終高度。

10 月 17 日重陽節(jié)當天 —— 也是中國傳統(tǒng)意義上的敬老節(jié) —— 搜狗圍繞「阿茲海默」主題發(fā)布了《以聲相伴,讓愛常在》的公益短片,通過搜狗語音合成技術(shù)實現(xiàn)家人聲音的復(fù)刻與重現(xiàn),倡導(dǎo)國人關(guān)愛和陪伴罹患阿茲海默癥的老年人。

播放

據(jù)了解,俗稱老年癡呆的阿茲海默癥至今病因不明,亦無能夠有效逆轉(zhuǎn)病情進展的藥物,患病者的記憶會逐步衰退,繼而行動遲緩、情緒淡漠乃至生活不能自理。因此其堪稱是對老年人群體危害最大的疾病之一,而我國阿茲海默癥患者人數(shù)超千萬,位居全球首位。

基于此,家人對于阿茲海默群體的重視與關(guān)愛顯得尤為必要 —— 老年人群體本身就多渴望子女的陪伴和照顧,家人可以與罹患阿茲海默癥的老年人一起回顧以前那些美好的事,撫慰老人的心理情緒,培養(yǎng)積極樂觀的健康心理,共同守護記憶。

而搜狗本次所展現(xiàn)的語音合成技術(shù)同時也可以幫助那些日常工作繁忙的上班族們,以聲音的陪伴緩解不能留在父母身旁所帶來的愧疚和無奈。即使自己不能時刻陪在父母左右,能讓他們時常聽聽自己的聲音也是一種慰藉。

這樣提升幸福感的技術(shù),是搜狗基于國際領(lǐng)先的 WaveNet / WaveRNN 的語音合成技術(shù),不僅可以將文字轉(zhuǎn)化為清晰自然、富有表現(xiàn)力的語音朗讀出來,而且只需要 10MIN 以內(nèi)的少量數(shù)據(jù)即可生成用戶的說話音色,可支持離 / 在線、男 / 女、中 / 英等多達 23 種不同的音色。

彼時,機器還只能冷冰冰地發(fā)出毫無波瀾的聲音;此時,AI 已經(jīng)可以用你的聲音,說出你的特色。

值得一提的是,搜狗還在業(yè)內(nèi)獨創(chuàng)了語音合成情感遷移技術(shù),可實現(xiàn)說話人風格遷移,讓將機器對人類聲音的模仿更加惟妙惟肖,簡單地說,這意味著用戶不再需要預(yù)先錄制語音片段,只需留下足夠的語音訓練數(shù)據(jù),即可結(jié)合使用場景需求由機器播放對應(yīng)語音,這無疑是激發(fā)了數(shù)據(jù)的活性應(yīng)用,也能夠滿足更多陪伴老年人的語音需求。

正如克萊頓 · 克里斯坦森在其著作《創(chuàng)新者的窘境》中所指出的,「很多時候技術(shù)發(fā)展與用戶需求的關(guān)系并非必要條件,而是充分條件 —— 技術(shù)發(fā)展往往并非由用戶需求驅(qū)動的,反而是由于新技術(shù)的產(chǎn)生和應(yīng)用,刺激和帶來了新需求的增長?!?/p>

事實上,搜狗多年來始終堅持對 AI 技術(shù)的研發(fā)推進和落地應(yīng)用,僅在本次所展現(xiàn)的語音合成技術(shù)方面,搜狗就斬獲了 Blizzard Challenge 2018 語音合成大賽中可懂度和語音停頓這兩項任務(wù)的冠軍,更重要的是,我們也能從搜狗呼吁倡導(dǎo)全社會關(guān)愛阿茲海默群體中看到其踐行先進科技公益向善的愿景落地。

值得一提的是,搜狗語音合成技術(shù)不僅可應(yīng)用于公益事業(yè),助力企業(yè)更好的擔負起社會責任,另一方面也可以滿足相當程度的特殊人群用戶市場需求,達成公益與商業(yè)的雙贏。

這一點早已在其他國家得到過印證,以美國為例,根據(jù)美國人口普查數(shù)據(jù)顯示,全美接近 20% 的人患有不同程度的殘疾,其中一半以上是重度殘疾。

在今年 5 月舉辦的微軟 Build 2018 開發(fā)者大會上,微軟宣布斥資 2500 萬美元推出為期五年的 AI for Accessibility 項目,鼓勵那些致力于改善殘疾人群生活的 AI 功能開發(fā)設(shè)計。Airbnb 則在今年年初,推出了一項包括 21 種無障礙設(shè)施篩選器在內(nèi)的更新,來幫助殘障用戶更好的找到適合自己的房子,包括無障礙淋浴間、輪椅通道、殘疾人車位等。

而根據(jù)世界銀行的數(shù)據(jù)顯示,全球范圍內(nèi)約有 15% 的人是殘障人士,我國殘障人群數(shù)量則多達 8500 萬人。此外,人口老齡化大勢所趨的今天,我國 65 歲以上老年人群已經(jīng)突破 1.36 億人,提升科技產(chǎn)品對于這些弱勢群體的實用性,無疑具備著相當廣闊的市場前景。

與之相對應(yīng)的,是搜狗已經(jīng)上線的個性化語音合成小程序「搜狗制音坊」,可在獲取一定時長人的聲音之后,快速合成用該音色進行新聞播報、閱讀兒童讀物、閱讀私人書單等語音播報。

這無疑將在諸如語音早教、虛擬助手等更多領(lǐng)域為包括但不限于上述弱勢群體在內(nèi)的大眾用戶服務(wù),借由先進技術(shù)拉近人與人之間的距離,讓家人的陪伴與關(guān)愛能夠真正做到無視時間與空間的限制。

美國政治哲學家約翰 · 羅爾斯在其所提出的著名理論「無知之幕」中指出,「當每一個人都不知道自己在這個社會組織中處于什么樣的角色之時,所制定的政策才能夠保證強者不會得到過度的利益,弱者能夠受到最大程度的保護?!?/p>

換言之,強調(diào)對于弱勢群體的照拂才是真正意義上的社會公平,而在數(shù)字信息時代,諸如搜狗這樣的科技企業(yè)能夠讓新興技術(shù)真正惠及少數(shù)派群體,這展現(xiàn)的不僅是企業(yè)在盈利能力之外所具備的善良屬性,更是科技發(fā)展普惠民眾的終極目標。

來源:ZAKER

轉(zhuǎn)載請保留原文鏈接:http://parkingblocks4less.com/a/shehui/2018/1029/16379.html上一篇:上一篇:京東電器“220V帶電新人類”:找尋狂拽炫酷吊炸天的科技感
下一篇:下一篇:沒有了