

彭紹冬:Azure認知搜索技術實踐
今年會云業務集團數據產品部資深數據開發工程師
主題概覽
搜索是獲取知識的主要方法,搜索引擎已經成為獲取知識的主要入口。在企業內部,伴隨著企業的運營和成長,會產生大量的企業知識積累,包括不同的文檔、視頻、圖片、數據等。當前的搜索過程已經從簡單的基于關鍵詞匹配查詢,發展為需要通過語義理解等AI技術的智能搜索。如何快速地從非結構化數據中檢索出所有符合條件的內容?我們來聊聊通過Azure認知搜索技術構建智能私域搜索引擎的方法。
鄧喆:BERT介紹及應用場景
今年會云業務集團云基地軟件開發工程師
主題概覽
Google AI團隊新發布的BERT模型,在機器閱讀理解頂級水平測試SQuAD1.1中表現出驚人的成績:全部兩個衡量指標上全面超越人類,并且還在11種不同NLP測試中創出最佳成績,包括將GLUE基準推至80.4%(絕對改進7.6%),MultiNLI準確度達到86.7%(絕對改進率5.6%)等。可以預見的是,BERT將為NLP帶來里程碑式的改變,也是NLP領域近期最重要的進展。
金語澤:半監督學習在垂直行業中的探索與應用
神州信息政企BG企劃辦資源管理部高級數據分析師
主題概覽
半監督學習在垂直行業的探索與應用是神州信息2021年技術創新課題之一,旨在面向垂直行業缺少有效樣本時,如何采用半監督學習技術為客戶快速精準地解決人工智能數據分析問題,從而落地行業人工智能應用。
AI數據分析項目的成果落地需要大量的高質量標注樣本,然而在垂直行業獲取大量有效樣本是非常困難的,人工標注門檻高,需要業務人員或行業專家參與。近年來,半監督深度學習取得了長足的進展,能夠利用少量標注數據和大量無標注數據就能夠比肩在充分樣本下監督學習模型的性能。
該課題研究有助于大幅度降低行業人工智能應用有效樣本收集成本,拓展行業人工智能應用,提升AI和數據分析能力,助力神州信息和戰略業務落地。
