百度AI新戰(zhàn)績：NLP登微軟MARCO機器閱讀理解第一

據(jù)介紹，百度自然語言處理團隊研發(fā)的V-Net模型以46.15的 Rouge-L得分登上微軟的MS MARCO（Microsoft MAchine Reading COmprehension）機器閱讀理解測試排行的第一。

MS MARCO 排行榜

MS MARCO 官方 twitter 發(fā)出的祝賀

據(jù)了解，百度NLP在MARCO提交的V-NET模型，使用了一種新的多候選文檔聯(lián)合建模表示方法，通過注意力機制使不同文檔產(chǎn)生的答案之間能夠產(chǎn)生交換信息，互相印證，從而更好的預(yù)測答案。此外，此次百度是單模型（single model）拿到了第一，并沒有提交更容易拿高分的多模型集成（ensemble）結(jié)果。

百度自然語言處理首席科學(xué)家兼百度技術(shù)委員會主席吳華表示，此次在MARCO的測試中取得第一，只是百度機器閱讀理解技術(shù)經(jīng)歷的一次小考，我們希望能夠與領(lǐng)域內(nèi)的其他同行者一起，推進機器閱讀理解技術(shù)和應(yīng)用的研究，使AI能夠理解人類的語言、用自然語言與人類交流。

據(jù)悉，微軟MARCO是微軟基于搜索引擎BING構(gòu)建的大規(guī)模英文閱讀理解數(shù)據(jù)集，包含10萬個問題和20萬篇不重復(fù)的文檔。MARCO數(shù)據(jù)集中的問題全部來自于 BING 的搜索日志，根據(jù)用戶在BING 中輸入的真實問題模擬搜索引擎中的真實應(yīng)用場景，是該領(lǐng)域有應(yīng)用價值的數(shù)據(jù)集之一。

官方微博
官方微信公眾號
官方百家號

蒙公網(wǎng)安備 15010302000178號蒙ICP備19002419號-1

泰州市

江达县

北辰区

南城县

广东省

海宁市

河源市

灌南县

宝鸡市

洪洞县

桦南县

涪陵区

西贡区

洛宁县