現(xiàn)在位置:主頁 > 國內(nèi) > 音樂家:誰能解我情衷?AI說我能

音樂家:誰能解我情衷?AI說我能

作者:編輯 ? 時間:2018-09-25 ? 瀏覽:人次

人的耳朵能夠輕松分辨出歌曲的各種情緒,未來,機器也能如此。為了讓機器人也能聽懂人類創(chuàng)作的歌曲,法國在線音樂網(wǎng)站Deezer的研究人員開發(fā)了一種人工智能系統(tǒng),可以將某些音軌與情緒聯(lián)系起來。

Deezer的研究人員在Arxiv.org網(wǎng)站上發(fā)表了一篇新論文《基于音頻歌詞與深度神經(jīng)網(wǎng)絡(luò)的音樂情緒檢測》,在論文中,他們描述了這項工作的細節(jié)。研究人員表示,智能音樂情緒檢測在過去二十年里一直是一個活躍的研究領(lǐng)域,它包括自動確定聽音樂時感受到的情緒。在這項工作中,他們將專注于基于音頻信號和音軌、歌詞的多模態(tài)情緒檢測。

該團隊引用心理學(xué)研究結(jié)果,表示在分析音樂所表達的情緒時,歌詞是密不可分的考慮因素,所以他們設(shè)計了一個神經(jīng)網(wǎng)絡(luò),分別提供音頻信號和word2vec(一種用于生成單詞嵌入的相關(guān)模型)嵌入訓(xùn)練160萬首歌詞。為了教它確定歌曲的情感,形成共鳴,他們選擇了一組超過100萬主流歌曲元數(shù)據(jù)的Million Song Dataset (MSD),這個數(shù)據(jù)庫和Last.fm(在線音樂服務(wù)商)的標簽相關(guān)聯(lián),它們大多和描述情緒有關(guān),形成標簽推薦的數(shù)據(jù)集,同時還用人工智能對標簽中的14000個英語單詞進行標記,包括從負面到正面和從平靜到激情程度,作為歌曲情緒強度的標記。

由于MSD不包含音頻信號和歌詞,因此團隊將歌曲元數(shù)據(jù)映射到Deezer的目錄 - 特別是歌曲標題,藝術(shù)家姓名和專輯標題。其中大約60%的結(jié)果數(shù)據(jù)集 (總共18,644個音軌) 被用于訓(xùn)練模型,其中40%用于驗證和測試。

與描繪和情緒相關(guān)的詞匯的經(jīng)典系統(tǒng)相比,深度學(xué)習(xí)模型在檢測方面更優(yōu)越。研究人員表示:“看起來這種性能的提升要歸功于我們的模型能夠揭示并使用音頻和歌詞之間的中級相關(guān)性,特別是在預(yù)測效價的時候”。

轉(zhuǎn)載請保留原文鏈接:http://parkingblocks4less.com/a/guona/20180925/13318.html上一篇:上一篇:曝Windows 10更新十月版RTM將是Build 17763
下一篇:下一篇:沒有了