97成人免费视频,97视频免费公开成人福利,免费视频99,99婷婷,国产伊人久久,亚洲视频欧美,国产精品福利久久

您當前的位置是:  首頁 > 資訊 > 國內 >
 首頁 > 資訊 > 國內 >

華為云奪得國際權威大賽WSDM Cup 2020金牌

2020-02-21 13:55:24   作者:   來源:CTI論壇   評論:0  點擊:


  近日,在美國休斯敦閉幕的第13屆網絡搜索與數據挖掘國際會議(WSDM 2020)上,華為云帶領的聯合團隊摘得WSDM Cup 2020大賽“論文引用意圖識別任務”金牌。

  WSDM被譽為全球信息檢索領域最有影響力也最權威的會議之一,會議關注社交網絡上的搜索與數據挖掘,尤其關注搜索與數據挖掘模型、算法設計與分析、產業(yè)應用和提升準確性與效果的實驗分析。今年已經是WSDM的第十三屆會議。

  本次WSDM Cup共有三個賽題任務,華為云奪金賽題內容為“論文引用意圖識別”:

  “比賽提供一個論文庫(約含80萬篇論文),同時提供對被引用論文的引用文本描述,參賽選手需要根據論文引用描述從論文庫中匹配三篇最相關的論文。”

  論文是人類最前沿知識的媒介,如果可以理解論文中的數據,可以極大地擴充計算機理解知識的能力和范圍。

  在論文中,作者經常會引用其他論文,并對被引論文做出對應描述。如果通過計算機可以自動地理解、識別描述對應的被引論文,不僅可以加深我們對科研脈絡的理解,還能在科研知識圖譜、科研自動問答系統(tǒng)和自動摘要系統(tǒng)等領域有所進步。

  華為云語音語義創(chuàng)新Lab帶領華南理工大學、華中科技大學、武漢大學、江南大學學生組成的聯合團隊,針對該問題制定了“整體召回+重排+集成”的方案。

  在整體召回階段:

  通過輕量化的文本相似度計算方法(如BM25、TFIDF、Word2Vec等),以較少的計算代價從大規(guī)模論文庫中檢索出給定查詢的可能相關的論文集合。

  在重排階段:

  通過計算量大但更準確的方法對這些候選論文中的每一篇論文計算和引用描述的相似度值并重新排序,例如采用基于深度學習的預訓練語言模型BERT等。華為云團隊觀察到,賽題中所給語料都是生物醫(yī)學領域,因此采用了基于生物醫(yī)藥和科學領域語料進行預訓練的BioBERT和SciBERT語言模型對論文進行重排。

  在集成階段:

  通過對所有模型的結果進行集成,最終得到三篇最相關的論文。

  華為云在本次比賽中運用的文本匹配技術,可廣泛用于搜索、對話機器人、知識圖譜構建等領域。

  憑借在自然語言處理領域的全棧技術積累,華為云連續(xù)斬獲了多個相關領域權威比賽冠軍。

  2019年10月華為云在DigSci科學數據挖掘大賽(學術論文搜索匹配大賽)上奪冠,精準率超過第二名5個百分點。

  在2019 CCF大數據與計算智能大賽決賽中,華為云獲得金融實體級情感分析大賽冠軍,體現了在文本情感分析和知識圖譜領域的實力。

  目前,華為云語音語義相關服務已經成功應用于政務、金融、油氣、醫(yī)療、汽車、物流、保險、電商、稅務、媒體等具有語音識別、語言理解、知識管理等需求的業(yè)務領域。
 

【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題

CTI論壇會員企業(yè)

晋江市| 深州市| 武强县| 萝北县| 广安市| 太谷县| 云南省| 阿瓦提县| 陈巴尔虎旗| 池州市| 武定县| 商丘市| 英德市| 永胜县| 甘泉县| 高平市| 东乡族自治县| 深泽县| 读书| 黎城县| 石嘴山市| 通辽市| 韶山市| 河曲县| 新建县| 疏附县| 北安市| 黄平县| 武清区| 东港市| 綦江县| 白银市| 舟山市| 鹤峰县| 旌德县| 化州市| 新津县| 泉州市| 古田县| 四平市| 普安县|