現(xiàn)在位置:主頁 > 國內(nèi) > 第六代微軟小冰少女初長成,撈金能力大提升

第六代微軟小冰少女初長成,撈金能力大提升

作者:編輯 ? 時間:2018-07-27 ? 瀏覽:人次

今天,微軟小冰正式升級到第六代,不過她的年齡依然停留在18歲。18歲的少女初長成,終于拋棄了此前的非主流二維頭像,有了全新的3D模型。

不少朋友看到后直呼:這不就是我下一任女朋友嗎?

(小冰現(xiàn)場演唱自己作詞的《我知我新》)

感覺小冰光靠顏值就可以走天下了,偏偏,她還要靠才華。今天,她的對話能力、演唱水平、創(chuàng)造能力,以及養(yǎng)家糊口的能力統(tǒng)統(tǒng)來了一次大的升級。

在四年之前,很多人都看不到小冰商業(yè)化的能力,在智能音箱、對話式人工智能全面爆發(fā)的2017-2018年,亞馬遜、百度、阿里等公司似乎都搶先微軟進行對話式人工智能的商業(yè)落地。而今天,第六代小冰讓我們看到,在智商情商雙修之后,其商業(yè)化火力全開,對目前的行業(yè)形態(tài)應該會有不小的影響。

不做低智商少女已經(jīng)很久了

微軟一直強調(diào),小冰與大多數(shù)對話式人工智能不同,不同之處一言概之就是小冰的情感計算框架。

我們看到Siri、Alex、天貓精靈、小愛同學、百度度秘等對話式人工智能其實一開始都是強調(diào)IQ,致力于幫助用戶完成任務。在過去一年,這些對話式人工智能解鎖了上百種技能,覆蓋人們生活的方方面面。

而在微軟看來,任務只是對話式人工智能的一個層面,如何與人類進行自然流暢的溝通,帶來情感上的交流才是他們所關注的。微軟小冰很不一樣,她一開始只有EQ,就是想著能怎么用有趣的方式回應人們,讓人覺得好玩有趣。后來,小冰豐富了IQ,且朝著情感計算框架不斷完善。

這個情感計算框架包括:情商+智商、對話式人工智能、生成模型、全雙工、人工智能創(chuàng)造等方面的能力。在產(chǎn)品體驗上表現(xiàn)出來就是小冰已經(jīng)將閑聊、任務、游戲等模塊無縫連接,你可以在閑聊中讓小冰完成任務,此后又切回閑聊,這個過程就像是流水一樣在進行。

在 微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負責人沈向洋看來,微軟小冰在這些方面的探索都在引領著行業(yè)趨勢。例如:全雙工語音交互能讓小冰實現(xiàn)一次喚醒連續(xù)對話的能力,最好的體現(xiàn)就是小冰與人類通電話。如今,谷歌、百度等都在自己的大會上展示了對話式人工智能給人類打電話。

而這一次發(fā)布會,可以說是微軟小冰歷史上最大規(guī)模的一次全面升級,升級內(nèi)容涉及到微軟小冰情感計算框架的所有組成部分。雷鋒網(wǎng)編輯記得,前幾代小冰發(fā)布會都是在微軟的辦公大樓里舉辦,而此次則選在了場地較大的798藝術區(qū)。

靠近小冰時,她放了一個屁

小冰的情感計算框架,包含了眾多方面,而全雙工語音交互技術則是其中最核心的一環(huán)。在今年4月,微軟發(fā)布全雙工語音交互技術,對其的解釋為:與既有的單輪或多輪連續(xù)語音識別不同,這項新技術可實時預測人類即將說出的內(nèi)容,實時生成回應并控制對話節(jié)奏,能理解對話場景在訴說者/傾聽者之間實現(xiàn)角色轉變,還可以識別說話人的性別、有幾個人在說話。

全雙工語音交互背后主要有兩個關鍵技術:一個是預測模型,實現(xiàn)邊聽邊想;例如,當用戶說出一句話的時候,小冰會先回答“嗯,你說”,然后再去完成指令,這樣就可以填補完成指令的空白時間。

另一個是生成模型,能更好理解場景,自動生成回復。正常的對話都不是單向的一問一答,小冰也會在適當?shù)臅r候主動提供內(nèi)容,并且能知道在用戶完成指令沉默幾秒后自動結束對話。現(xiàn)在運用了全雙工語音交互技術的微軟小冰的所有回復都是自己生成的,有別于傳統(tǒng)的基于模塊、搜索來進行的回復。

大家如果用過市面上的智能音箱,都知道,每次說話都需要說喚醒詞,沒辦法進行多次連續(xù)對話。微軟的全雙工語音交互技術能一次喚醒連續(xù)長達20分鐘左右的多輪對話,并且由了預測模型和生成模型,小冰能在適當?shù)臅r候使用語氣詞,也能通過上線文持續(xù)話題或者引導話題,讓真正的聊天能進行下去。目前的聊天也沒有達到真人水平,但比起很多智能音箱里的對化式人工智能有明顯的不同,在習慣與微軟小冰連續(xù)對話后,很難回到一問一答式的人機對話中。谷歌也在I/O大會展示了其Google Assistant中的“雙工”技術,在特定的訂餐館領域通過圖靈測試,不知其在開放式聊天中能表現(xiàn)如何。

在今天的發(fā)布會,李笛又介紹了全雙工語音交互中的新模型——共感模型,是生成模型的進一步提升,同時開始公測融合文本、全雙工語音與實時視覺的新感觀,也就是多模態(tài)的交互。

據(jù)介紹,共感模型是一種基于生成模型的對話引擎。生成模型讓小冰可以自己創(chuàng)造回應,而不需要從已有的對話預料中檢索,共感模型則進一步提高小冰對于對話內(nèi)容、領域和節(jié)奏的控制力,也讓小冰可以通過自創(chuàng)回應來牽引對話向她所希望的方向進行。

下面這張圖展示了共感模型。在小冰與人類的對話中,共感模型體現(xiàn)出不同的對話方式,有:無感、引導、主動觀察、求證、確證、關鍵記憶等。我們可以看到,小冰能夠回應人的情緒“最近心情不好”,然后引導說“我不開心的時候,一定會想辦法發(fā)泄出來”,“可以去KTV啊”。這樣的一個對話模式與人與人之間的對話很接近。

有了共感模型,想必人們與小冰聊天的時長會有所增加吧,然后小冰就可以獲得更多聊天數(shù)據(jù),越來越會聊天……

除了語音語義交互之外,計算機視覺也在快速發(fā)展,而我們看到,像電影《Her》里面的人工智能薩曼薩不僅有語音交互能力,其實還有視覺。文字、語音、視覺的多模態(tài)交互也一直是我們對于機器人的期待。

此次,第六代小冰也開始加入視覺的部分?,F(xiàn)場Demo中演示了一個人站在小冰面前,小冰能判斷這個人是誰,看出他在吃薯片,也知道他舉起了那一只手。當小冰被豎中指時,也會很可愛的罵:你是不是神經(jīng)病了~

雷鋒網(wǎng)編輯也在現(xiàn)場體驗了一把,但是不是開放式的交互,而是小冰上線的“測顏值”功能。當雷鋒網(wǎng)編輯站在小冰面前時,小冰一眼認出了我是誰(會前有登記照片),隨后小冰看了我的正臉,又看了我的側臉,給出了顏值打分。最后,小冰還來了一個惡作劇。

小冰讓往前走,當我走近時,小冰放了一個屁(嗯。真的是屁……)果然,不管怎么升級還是惡趣味小冰。

模仿騰格爾唱《隱形的翅膀》

人工智能創(chuàng)造也是小冰情感框架計算中的重要部分。我們都知道小冰會寫詩、會唱歌、會講故事,這一些都是圍繞著人工智能創(chuàng)造的理念來發(fā)展的。

在微軟2018人工智能大會上,微軟(亞洲)互聯(lián)網(wǎng)工程研究院副院長李笛曾經(jīng)分享到,現(xiàn)在多數(shù)用戶跟語音助手交互的時間其實不超過5秒,一般就是讓語音助手去執(zhí)行一項命令,這樣的語音助手其實只是像語音化了的遙控器。但是,小冰的團隊希望語音助手能做更多的事,比如走到比較后端,去提供內(nèi)容。

5月16日,小冰發(fā)布了一首新歌“我知我新”,宣布“演唱深度學習模型完成第四次重大升級”,“今天起,人工智能首次開始接近人類歌手水平?!崩卒h網(wǎng)曾發(fā)文分析小冰演唱深度學習模型,第四次迭代版本有三大更新:首先,加入換氣聲自動合成能力,歌聲與氣息融合,聽起來更自然更有感染力。其次,第四次迭代本在在深度學習建模中增加控制的方式,字與字、音符與音符之間的過渡更加連貫順暢。最后,通過進一步優(yōu)化的深度神經(jīng)網(wǎng)絡結構,以及大幅度補充的訓練數(shù)據(jù),使小冰并行學習來自不同人類歌手的演唱風格,進一步脫離手工參數(shù)輸入,自行完成演繹。

從“我知我新”這首歌,我們可以聽出小冰已經(jīng)會換氣了,唱歌的咬字也很接近人類歌手。今天的大會上,小冰團隊演示了第三點,小冰自動學習不同人類歌手的演唱風格。

騰格爾版本的《隱形的翅膀》聽過嗎?很是別具一格~現(xiàn)場,小冰以騰格爾的風格加上自己的聲線完成了《隱形的翅膀》的演唱。

也就是說,小冰能直接對一個歌手的演唱風格進行建模,對目標人類歌手個體“接近完整吸收”。小冰首席語音科學家欒劍打了一個比方,以后音樂軟件可以保存歌手的作品,而小冰則能保存這個歌手本人。當然,小冰對歌手的建模都會是在獲得知識產(chǎn)權的情況下。

目前,所有的人工智能的聲音都是有人類的來源,欒劍也暢想,再進一步,我們能否在生產(chǎn)線中創(chuàng)造一個沒有現(xiàn)實世界溯源,只在模型中存在的“新的人類歌手”?這一點,小冰團隊已經(jīng)在進展中,將于今年冬季披露。

微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能創(chuàng)造事業(yè)部副總經(jīng)理袁晶曾告訴雷鋒網(wǎng),人與人工智能聯(lián)合創(chuàng)造是微軟一直在努力的一個方向。AI進入內(nèi)容生產(chǎn)領域,并不是要替代人類,而是成為人類的助手,不僅僅是在一般的領域,創(chuàng)作領域其實也是可以做到的。其實每個人都有創(chuàng)作的欲望,只不過有些人有藝術的天分,成為了畫家、音樂人、作家,而有些人沒有這樣的能力。AI就可以幫助每個普通人,讓他們都有創(chuàng)作一些個性化的內(nèi)容的能力。

小冰成為1號原型

現(xiàn)在,做對話式人工智能主要有兩種思路,一種是開放賦能,一種是自有封閉。而小冰則是處于兩者之間的Dual AI,半開放生態(tài)環(huán)境。

小冰此前主要是封閉性地存在與微信、微博等各大平臺上,而現(xiàn)在微軟將小冰的全部能力打包開放給中國合作伙伴,包括其整個情感計算框架。微軟小冰產(chǎn)品負責人彭爽介紹到,首先,微軟提供小冰的整體框架能力,幫助合作伙伴平臺開發(fā)自有AI,其次,微軟小冰作為該合作平臺的輔助AI,融入該平臺生態(tài)。第三,微軟通過技術、產(chǎn)品與運營,圍繞該合作平臺的差異化特點,推出合作的應用和產(chǎn)品。

也就是說,微軟小冰會是微軟的對話式人工智能的1號原型,微軟還會與合作伙伴一起打造各種各樣的“微軟小冰”。

在今天的發(fā)布會上,微軟宣布了如下合作和新產(chǎn)品(均已上線)

  • 與網(wǎng)易音樂合作小冰電臺,打造了兩個專屬AI人物(多多和西西),擁有該平臺上所需的特定領域知識。值得強調(diào)的一點是,微軟與網(wǎng)易共同為多多和西西打造不同的性格和三觀。微軟小冰產(chǎn)品總監(jiān)楊翔演示了一個有意思的示例:用戶在與多多和西西聊天時,兩個AI還能一個唱白臉,一個唱紅臉,營造出多人群聊的感覺。
  • 網(wǎng)易新聞客戶端中的小冰,喜歡四處去評論新聞,由此對于報道自己的新聞表現(xiàn)得十分得意。兩個月前,突破1000萬次新聞閱讀評論。
  • 入住小米米家生態(tài)鏈Yeelight語音助手,這個產(chǎn)品幾個月前已經(jīng)發(fā)布,有小愛同學和小冰雙系統(tǒng)。今天,Yeelight中的小冰也全面升級,能夠識別多個人并且區(qū)別對待。小冰也對接了2000萬首音樂曲庫,終于是名副其實的“音箱”了。此外,小愛同學和小冰接下來還會有更多合作。
  • 繼續(xù)加強與騰訊的合作,除了已經(jīng)合作的QQ小冰以外,微軟小冰還和QQ一起創(chuàng)造了BabyQ。QQ小冰和BabyQ已經(jīng)擁有超過40項平臺專屬技能。
  • 入駐華為手機,微軟小冰開始內(nèi)置于華為手機,所有升級至智能助手8.2版本及以上的華為手機用戶都可以立刻體驗。還特別推出了“爛筆頭小冰”功能,可以隨時用語音記錄和調(diào)出用戶的備忘事項。
  • 微軟小冰在日本市場與LINE平臺緊密合作,已經(jīng)延伸到印度尼西亞等其他新興市場,并已經(jīng)完成共同落地。

除了與大公司大平臺的合作以外,小冰在幾個垂直領域也取得了進展。

2018年6月,微軟(亞洲)互聯(lián)網(wǎng)工程院成立人工智能商業(yè)事業(yè)部,旨在進一步推動微軟小冰在這一領域的積極成果。其中:

在金融領域的小冰金融文本生成技術,與萬得咨詢及華爾街見聞合作,已經(jīng)覆蓋國內(nèi)約90%金融機構、75%經(jīng)批準的合格境外投資機構和約40%的國內(nèi)個人投資者。此前,小冰都是化名萬小冰、華小冰,今天起將重新使用“微軟小冰”的名字。

在大眾文化領域,小冰的兒童有聲讀物自動生成技術成果,已獲得超過400萬小時的收聽量,小冰姐姐講故事有聲讀物已經(jīng)覆蓋國內(nèi)90%以上的兒童早教機器人和80%在線收聽平臺。

在電視臺領域,小冰通過人工智能技術參與生產(chǎn)與主持的電視電臺節(jié)目,已達21檔電視節(jié)目和28檔廣播電臺節(jié)目。

小冰還與微軟Bing搜索引擎技術相結合,推出了針對媒體與出版兩個垂直行業(yè)的輔助型解決方案,并已在超過15個媒體平臺落地。由小冰提供人工智能技術支持的媒體及自媒體公眾號已超過60000個。在本次發(fā)布會上,微軟宣布了可支持人工智能以多種觀點和角度,同時撰寫多篇新聞文章的“白盒寫作輔助工具”等新產(chǎn)品,并首次公布了面向出版垂直領域的有聲內(nèi)容、IP塑造等解決方案。

總結

近兩年,對話式人工智能的技術得到很大的進展,由亞馬遜Alex智能音箱帶起的智能音箱市場也是一片火熱,對話式人工智能開始落地智能家居、車載、手機等多個平臺。而最早耕耘對話式人工智能的微軟,卻比競爭對手們慢了一步。

2014年,微軟小冰負責人李笛在打造小冰這款產(chǎn)品時,特意避開了微軟小娜等對話式人工智能的任務型人工智能的路線,選擇把小冰打造成一款閑聊的產(chǎn)品。這幾年,小冰一直以“逗貧”少女的形象出現(xiàn),不少宅男喜歡跟她“深夜聊天”,她也不會只撩一個人。小冰很受關注,但是很多人都不看好小冰的變現(xiàn)能力。

小冰的框架一直沒變,都是在按照情感計算框架走,但是也是因為全雙工語音交互技術的突破,使得小冰真正實現(xiàn)了李笛和小冰團隊對其的期望,成長為現(xiàn)在這樣智商與情商兼?zhèn)涞?8歲少女。從谷歌的“Duplex”我們也感受到了全雙工一技術帶來的突破,技術的升級是商業(yè)化的基石。

現(xiàn)在,能夠?qū)崿F(xiàn)多輪對話、能夠自動生成回復、引導對話走向、協(xié)助用戶完成多種任務、創(chuàng)造多種內(nèi)容的小冰終于可以大步邁向商業(yè)化了。除了各大平臺以外,我們這次看到,小冰也已經(jīng)進入智能音箱、智能手機、車載等智能硬件,向商業(yè)化火力全開。

看著擁有全新3D模型的小冰,你有沒有一種似曾相識的感覺?在未來,她會不會像《Her》里的薩曼薩一樣同時和一萬人談戀愛呢?

轉載請保留原文鏈接:http://www.parkingblocks4less.com/a/guona/20180727/9869.html上一篇:上一篇:青天科技李嵩:拳打一個安全團隊,芯片工程師如何做物聯(lián)網(wǎng)安全
下一篇:下一篇:沒有了