現(xiàn)在位置:主頁 > 國內(nèi) > 2018機(jī)器閱讀理解技術(shù)競賽“發(fā)榜” 百度開放數(shù)據(jù)集成就“頭號玩家”

2018機(jī)器閱讀理解技術(shù)競賽“發(fā)榜” 百度開放數(shù)據(jù)集成就“頭號玩家”

作者:編輯 ? 時間:2018-05-28 ? 瀏覽:人次

近日,由中國中文信息學(xué)會(CIPS)、中國計算機(jī)學(xué)會(CCF)和百度公司聯(lián)手舉辦的“2018機(jī)器閱讀理解技術(shù)競賽”落下帷幕。來自北京奇點(diǎn)機(jī)智科技有限公司的韋琬和劉家驊組成的Naturali團(tuán)隊?wèi){借在自然語言處理(NLP)領(lǐng)域多年的積累與沉淀,從國內(nèi)外1000多支報名隊伍中脫穎而出榮獲第一名。大賽更多排名信息,可登錄2018機(jī)器閱讀理解技術(shù)競賽官網(wǎng)http://mrc2018.cipsc.org.cn/查看。

云圖片

本次競賽旨在推動語言理解和人工智能領(lǐng)域技術(shù)和應(yīng)用的發(fā)展,通過機(jī)器閱讀文本,進(jìn)而回答和閱讀內(nèi)容相關(guān)的問題。比賽涉及到了語言理解、知識推理、摘要生成等復(fù)雜技術(shù),極具挑戰(zhàn)。大賽有效推動了機(jī)器閱讀理解技術(shù)的發(fā)展,更為下一屆機(jī)器閱讀理解技術(shù)競賽的舉辦積累了寶貴經(jīng)驗。競賽將在第三屆“語言與智能高峰論壇”舉辦技術(shù)交流和頒獎,數(shù)據(jù)集論文可登錄https://arxiv.org/abs/1711.05073查看,供業(yè)界交流使用。

云圖片

用行動見初心,百度提供迄今規(guī)模最大的中文閱讀理解數(shù)據(jù)集

本次大賽受到了全球機(jī)器閱讀理解領(lǐng)域研究者的廣泛關(guān)注,具有覆蓋面廣,參與度高,活躍度強(qiáng)的特點(diǎn)。競賽注冊報名團(tuán)隊共達(dá)1062支,累計收到系統(tǒng)結(jié)果1489份。競賽基于測試集的人工標(biāo)注答案,采用ROUGH-L和BLEU4作為評價指標(biāo),以ROUGH-L為主評價指標(biāo)。比賽期間排行榜高分不斷刷新,ROUGE-L評價指標(biāo)由最初的35.96提升至終賽的63.38,接近半數(shù)的系統(tǒng)結(jié)果超過了基線系統(tǒng)。在各團(tuán)隊的不懈努力下,參賽系統(tǒng)整體水平得到了顯著提升。

為了給予參賽者最大力度支持,本次競賽數(shù)據(jù)集來自搜索引擎真實應(yīng)用場景,其中的問題為百度搜索用戶的真實問題,每個問題對應(yīng)5個候選文檔文本及人工整理的優(yōu)質(zhì)答案,這是目前為止最大、最具挑戰(zhàn)性的中文閱讀理解數(shù)據(jù)集。

云圖片

眾所周知,近幾年來人工智能技術(shù)的迅速發(fā)展,離不開大量可供機(jī)器學(xué)習(xí)的數(shù)據(jù)的發(fā)布。此次百度公開閱讀理解數(shù)據(jù)集為學(xué)術(shù)界提供了迄今為止最大規(guī)模的真實應(yīng)用場景下的數(shù)據(jù),也帶來了相對深層次的答案細(xì)節(jié)標(biāo)注。數(shù)據(jù)中涵蓋的豐富信息,可覆蓋大量閱讀理解及問答的研究需求,并為其他的研究方向提供了大量可發(fā)掘利用的信息。毫無疑問,此次百度公開數(shù)據(jù)集對于推動機(jī)器閱讀理解技術(shù)乃至人工智能技術(shù)的發(fā)展都有著積極且重要的作用。

助力人才培養(yǎng),百度用“中國速度”輸送精英人才

依托在人工智能領(lǐng)域的發(fā)展,百度通過本次“2018機(jī)器閱讀理解技術(shù)競賽”為學(xué)術(shù)界和工業(yè)界提供了一個公開的閱讀理解技術(shù)交流平臺,協(xié)同多方力量共同打磨機(jī)器閱讀理解這一項人工智能的關(guān)鍵技術(shù),共同發(fā)展共同進(jìn)步,推動學(xué)術(shù)界和工業(yè)界最新研究成果轉(zhuǎn)化為實際生產(chǎn)力。

百度此次與學(xué)界、業(yè)界共同舉辦中文閱讀理解技術(shù)競賽,對人才發(fā)掘與培養(yǎng)的決心顯而易見。通過開展諸如機(jī)器閱讀理解技術(shù)競賽、百度之星開發(fā)者大賽、PaddlePaddle AI大賽等眾多人工智能行業(yè)競賽,開放海量優(yōu)質(zhì)AI數(shù)據(jù)資源與行業(yè)資源賦能AI行業(yè)的優(yōu)質(zhì)人才,為研究者提供強(qiáng)大的學(xué)習(xí)驅(qū)動力與創(chuàng)造力。正如本次評測委員會成員劉凱所言,“本次競賽期望進(jìn)一步普及機(jī)器閱讀理解技術(shù)、降低技術(shù)門檻,吸引并培養(yǎng)更多的技術(shù)人才,推動我國人工智能的學(xué)術(shù)和產(chǎn)業(yè)的發(fā)展?!?/p>

本次競賽結(jié)束后,對AI數(shù)據(jù)集有興趣的技術(shù)人才可以在百度BROAD平臺自由下載已公開的閱讀理解數(shù)據(jù)集,并通過平臺提交測試集結(jié)果進(jìn)行系統(tǒng)效果測試,持續(xù)了解和關(guān)注百度閱讀理解數(shù)據(jù)集。除了閱讀理解數(shù)據(jù)集,百度AI公開數(shù)據(jù)集計劃BROAD(Baidu Research Open-Access Dataset)還發(fā)布了視頻和圖像數(shù)據(jù)集。

我們有理由相信,未來,百度將繼續(xù)在AI人才培養(yǎng)中發(fā)揮重要作用,聯(lián)合產(chǎn)學(xué)研各方開展研究,培養(yǎng)人工智能領(lǐng)域的精英技術(shù)人才。

轉(zhuǎn)載請保留原文鏈接:http://parkingblocks4less.com/a/guona/20180528/8365.html上一篇:上一篇:天津伊美爾整形醫(yī)院優(yōu)質(zhì)服務(wù)鑄就醫(yī)美典范
下一篇:下一篇:沒有了