TOP
從紙書中看見香港,指定港書滿888再折100
R自然語言處理導論(簡體書)
滿額折

R自然語言處理導論(簡體書)

商品資訊

人民幣定價:78 元
定價
:NT$ 468 元
優惠價
87407
海外經銷商無庫存,到貨日平均30天至45天
下單可得紅利積點 :12 點
商品簡介

商品簡介

這部著作包括十一章內容,遵循由易到難、循序漸進的原則。第一章是R語言入門,第二章介紹字符串處理。第三章介紹常見的文本統計方法,包括統計文本詞數、句子數和平均句長、繪製詞頻表以及詞頻分布圖。
第四章依據R數據包koRpus介紹與討論文本詞匯多樣性測量方法,包括傳統的類符-形符比和平均分段類符-形符比等。第五章同第四章一樣利用R數據包koRpus,重點介紹文本可讀性多種測量方法和一種聽力文本難易度的測量方法,包括自動化可讀性指數(ARI)和Flesch閱讀難易度等。
第六章聚焦於n元組和關鍵詞提取方法,內容包括文本詞語關鍵性檢驗方法(如卡方檢驗和似然比檢驗)、比較學生故事復述文本與原文本中使用的關鍵詞以及比較美國總統就職演說文本中的關鍵詞等。第七章介紹兩種特殊形式的n元組,即搭配和搭配構式。第八章介紹文檔或文本相似度和距離測量,包括余弦相似度、Jaccard相似度、歐式距離、Minkowski距離和潛在語義分析等。第九章著重介紹基於整潔文本的自然語言處理技術,是本著作內容最為豐富的一章,包括整潔數據的特徵和整潔數據包tidyr的使用等。第十章介紹中文自然語言處理技術,包括調用jiebaR包時如何通過自定義詞典進行分詞、調用jiebaR包開展基礎統計分析,計算文本長度、句子數和平均句長以及繪製高頻詞分布條形圖等。第十一章是本書的最後一章,介紹如何對文本詞匯開展詞類標注和句法成分依存分析,包括數據包udpipe的安裝與初試、詞語共現和快速自動關鍵詞提取等。

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 407
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區