針對漢語,本書提出了意合圖語義表示的方案。意合圖可以描述漢語的事件結構和實體結構。其中,事件結構是考察重點,定義了事件的構成要素,包括核心論元、邊緣論元和情態信息等。意合圖可以將句子、段落、篇章等不同層級的語言處理對象進行一致性的形式化描述。基於網格的語言結構分析框架(Grid based Language Structure Parsing Frame Work,GPF),本書採取了構造意合圖的中間結構策略,即從語法的組塊依存結構轉換為語義的意合圖。如何構造意合圖一些典型子任務,本書對此給出了 GPF 實現示例。本書適合自然語言處理、計算語言學,以及與語言學本體研究有關專業的學生當作教材,也可以作為高等院校人工智能、信息科學研究、大數據分析等相關專業的參考書,還適合對漢語句法語義分析與應用感興趣的人員閱讀。
自然語言在語法、語義和語用三個平面上的結構統稱為語言結構,通過計算得到語言結構是自然語言理解的核心任務。語言結構計算可以泛化為識別語言單元和建立語言單元之間的關係、為語言單元和關係賦予屬性的過程。本書利用網格結構分析語言單元和關係,通過鍵值方式對其屬性進行描述和計算,採用數據表解析不同類型的知識,借助有限狀態自動機剖析語言的具體應用場景。這種基於網格的自然語言結構分析框架(Grid based Parsing Framework,GPF)具有良好的包容性,通過可編程的腳本和數據交換標準接口,融合了深度學習的參數計算和基於符號的知識計算。GPF為自然語言處理研究和應用提供了新的研究思路和計算框架。 本書適合專業為自然語言處理、計算語言學以及與語言學本體研究有關的學生當作教材,也可以作為高等院校人工智能、信息科學研究、大數據分析等相關專業的參考書。同時,本書也適合對語料庫建設與應用感興趣的人員閱讀。