MS MARCO 排行榜
MS MARCO 官方 twitter 發(fā)出的祝賀
據(jù)了解,百度NLP在MARCO提交的V-NET模型,使用了一種新的多候選文檔聯(lián)合建模表示方法,通過注意力機制使不同文檔產(chǎn)生的答案之間能夠產(chǎn)生交換信息,互相印證,從而更好的預(yù)測答案。此外,此次百度是單模型(single model)拿到了第一,并沒有提交更容易拿高分的多模型集成(ensemble)結(jié)果。
百度自然語言處理首席科學(xué)家兼百度技術(shù)委員會主席吳華表示,此次在MARCO的測試中取得第一,只是百度機器閱讀理解技術(shù)經(jīng)歷的一次小考,我們希望能夠與領(lǐng)域內(nèi)的其他同行者一起,推進機器閱讀理解技術(shù)和應(yīng)用的研究,使AI能夠理解人類的語言、用自然語言與人類交流。
據(jù)悉,微軟MARCO是微軟基于搜索引擎BING構(gòu)建的大規(guī)模英文閱讀理解數(shù)據(jù)集,包含10萬個問題和20萬篇不重復(fù)的文檔。MARCO數(shù)據(jù)集中的問題全部來自于 BING 的搜索日志,根據(jù)用戶在BING 中輸入的真實問題模擬搜索引擎中的真實應(yīng)用場景,是該領(lǐng)域有應(yīng)用價值的數(shù)據(jù)集之一。官方微博
官方微信公眾號
官方百家號