資料介紹
作為一個(gè)自然語言處理的初學(xué)者,看書看到“訓(xùn)練模型”,這模型那模型的,一直不知道模型究竟是什么東西??戳诉@本書,從預(yù)處理數(shù)據(jù)到提取特征集,訓(xùn)練模型,測(cè)試修改等,一步一步實(shí)際操作了之后,才對(duì)模型一詞有了直觀的認(rèn)識(shí)(算法的中間結(jié)果,存儲(chǔ)在計(jì)算機(jī)中的一個(gè)個(gè) pkl 文件,測(cè)試的時(shí)候直接用,前面計(jì)算過的就省了)。以后聽人談“模型”的時(shí)候也有了底氣。當(dāng)然,模型還有很多其他含義。還有動(dòng)詞的“配價(jià)”、各種搭配、客觀邏輯對(duì)根據(jù)文法生成的句子的約束如何實(shí)現(xiàn)?不上機(jī)動(dòng)手做做,很難真正領(lǐng)悟。
自然語言處理理論書籍很多,講實(shí)際操作的不多,能講的這么系統(tǒng)的更少。從這個(gè)角度講,本書是目前世界上最好的自然語言處理實(shí)踐教程。初學(xué)者若在看過理論之后能精讀本書,必定會(huì)有獲益。這也是翻譯本書的目的之一。
?
PYTHON 自然語言處理
從輸入法聯(lián)想提示(pre dictive text)、email 過濾到自動(dòng)文本摘要、機(jī)器翻譯,大量的語言相關(guān)的技術(shù)都離不開自然語言處理的支持,而這本書提供了自然語言處理非常方便的入門指南。通過它,你將學(xué)到如何寫能處理大量非結(jié)構(gòu)化文本的 Python 程序。你將獲得有豐富標(biāo)注的涵蓋語言學(xué)各種數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)集,而且你將學(xué)到分析書面文檔內(nèi)容和結(jié)構(gòu)的主要算法。
這是一本關(guān)于自然語言處理的書。所謂“自然語言”,是指人們?nèi)粘=涣魇褂玫恼Z言,如英語,印地語,葡萄牙語等。相對(duì)于編程語言和數(shù)學(xué)符號(hào)這樣的人工語言,自然語言隨著一代人傳給另一代人而不斷演化,因而很難用明確的規(guī)則來刻畫。從廣義上講,“自然語言處理”(Natural Language Processing 簡(jiǎn)稱 NLP)包含所有用計(jì)算機(jī)對(duì)自然語言進(jìn)行的操作,從最簡(jiǎn)單的通過計(jì)數(shù)詞出現(xiàn)的頻率來比較不同的寫作風(fēng)格,到最復(fù)雜的完全“理解”人所說的話,至少要能達(dá)到對(duì)人的話語作出有效反應(yīng)的程度。
基于 NLP 的技術(shù)應(yīng)用日益廣泛。例如:手機(jī)和手持電腦支持輸入法聯(lián)想提示和手寫識(shí)別;網(wǎng)絡(luò)搜索引擎能搜到非結(jié)構(gòu)化文本中的信息;機(jī)器翻譯能把中文文本翻譯成西班牙文。通過提供更自然的人機(jī)界面和更復(fù)雜的存儲(chǔ)信息獲取手段,語言處理正在這個(gè)多語種的信息社會(huì)中扮演更核心的角色。這本書提供自然語言處理領(lǐng)域非常方便的入門指南。它可以用來自學(xué),也可以作為自然語言處理或計(jì)算語言學(xué)課程的教科書,或是人工智能、文本挖掘、語料庫(kù)語言學(xué)課程的補(bǔ)充讀物。本書的實(shí)踐性很強(qiáng),包括幾百個(gè)實(shí)際可用的例子和分級(jí)練習(xí)。本書基于 Python 編程語言及其上的一個(gè)名為自然語言工具包(Natural Language Toolk it,簡(jiǎn)稱 NLTK)的開源庫(kù)。NLTK 包含大量的軟件、數(shù)據(jù)和文檔,所有這些都可以從 http:/ /www.nltk.org/免費(fèi)下載。NLTK 的發(fā)行版本支持 Windows、Macintosh 和 Unix 平臺(tái)。我們強(qiáng)烈建議你下載 Python 和 NLTk,與我們一起嘗試書中的例子和練習(xí)。
本書前幾章按照概念的難易程度編排。先是實(shí)用性很強(qiáng)的語言處理的入門介紹,講述如何使用很短的 Python 程序分析感興趣的文本信息(1-3 章)。接著是結(jié)構(gòu)化程序設(shè)計(jì)章節(jié)(第 4 章),用來鞏固散布在前面幾章中的編程要點(diǎn)。之后,速度加快,我們用一系列章節(jié)講述語言處理的主要內(nèi)容:標(biāo)注、分類和信息提?。?-7 章)。接下來的三章探索分析句子、識(shí)別句法結(jié)構(gòu)和構(gòu)建表示句意的方法(8-10 章)。最后一章講述如何有效管理語言數(shù)據(jù)(第 1 1 章)。本書結(jié)尾處的后記簡(jiǎn)要討論了 NLP 的過去和未來。
每一章中我們都在兩種不同的敘述風(fēng)格間切換。一種風(fēng)格是以自然語言為主線。我們分析語言,探索語言學(xué)概;在討論中使用編程的例子。我們經(jīng)常會(huì)使用尚未系統(tǒng)介紹的 Pytho n 結(jié)構(gòu),這樣你可以在鉆研這些程序如何運(yùn)作的細(xì)節(jié)之前了解它們的效能。就像學(xué)習(xí)一門外語的慣用表達(dá)一樣,你能夠買到好吃的糕點(diǎn)而不必先學(xué)會(huì)復(fù)雜的提問句型。敘述的另一種風(fēng) 17 格是以程序設(shè)計(jì)語言為主線。我們將分析程序、探索算法,而語言學(xué)例子將扮演配角。每章結(jié)尾都有一系列分級(jí)練習(xí),用于鞏固學(xué)到的知識(shí)。練習(xí)按照如下的標(biāo)準(zhǔn)分級(jí):○初級(jí)練習(xí):對(duì)范例代碼作稍微修改等簡(jiǎn)單的練習(xí);?中級(jí)練習(xí):深入探索材料的一個(gè)方面,需要仔細(xì)的分析和設(shè)計(jì);●高級(jí)練習(xí):開放的任務(wù),挑戰(zhàn)你對(duì)材料的理解并迫使你獨(dú)立思考解決的方案(新學(xué)編程的讀者應(yīng)該跳過這些)
- 半導(dǎo)體收音機(jī)淺談的PDF電子書免費(fèi)下載 196次下載
- 深度學(xué)習(xí)入門:基于Python的理論與實(shí)現(xiàn)電子書 35次下載
- 光學(xué)諧振腔的圖解分析與設(shè)計(jì)方法的PDF電子書免費(fèi)下載 137次下載
- 簡(jiǎn)明python教程的中文版PDF電子書免費(fèi)下載 0次下載
- MATLAB函數(shù)速查手冊(cè)PDF電子書免費(fèi)下載 162次下載
- 高級(jí)語言程序設(shè)計(jì)從菜鳥到大師深入C語言程序設(shè)計(jì)PDF電子書免費(fèi)下載 189次下載
- 寫給文科生看的編程入門Python管窺PDF電子書免費(fèi)下載 8次下載
- python入門教材電子書合集免費(fèi)下載 37次下載
- SHARP電子元器件綜合目錄中文版PDF電子書免費(fèi)下載 0次下載
- 數(shù)字信號(hào)處理算法C語言實(shí)現(xiàn)PDF電子書免費(fèi)下載 81次下載
- 電冰箱快速維修PDF電子書免費(fèi)下載 56次下載
- 家電維修1128例PDF電子書免費(fèi)下載 289次下載
- STM8 C語言精品編程100例PDF版電子書免費(fèi)下載 0次下載
- 數(shù)字信號(hào)處理算法C語言實(shí)現(xiàn)PDF版電子書免費(fèi)下載 0次下載
- 《史蒂夫-喬布斯傳》官方正式中文版電子書 0次下載
- 自然語言處理前饋網(wǎng)絡(luò)綜述 1.2k次閱讀
- Transformer架構(gòu)在自然語言處理中的應(yīng)用 2.2k次閱讀
- 使用Python進(jìn)行自然語言處理 1.1k次閱讀
- 用于自然語言處理的神經(jīng)網(wǎng)絡(luò)有哪些 3.2k次閱讀
- 什么是自然語言處理 (NLP) 3.7k次閱讀
- 自然語言處理技術(shù)的原理的應(yīng)用 1.7k次閱讀
- 神經(jīng)網(wǎng)絡(luò)在自然語言處理中的應(yīng)用 1.3k次閱讀
- 如何開始使用PyTorch進(jìn)行自然語言處理 3.1k次閱讀
- 自然語言處理是什么?有什么用? 6.9k次閱讀
- 多個(gè)視角對(duì)自然語言處理領(lǐng)域進(jìn)行全面梳理 4.3k次閱讀
- 自然語言處理的ELMO使用 3.9k次閱讀
- 自然語言處理研究的基本問題及發(fā)展趨勢(shì) 9.3k次閱讀
- 自然語言處理的優(yōu)點(diǎn)有哪些_自然語言處理的5大優(yōu)勢(shì) 3.1w次閱讀
- RNN在自然語言處理中的應(yīng)用 6.1k次閱讀
- 從語言學(xué)到深度學(xué)習(xí)NLP,一文概述自然語言處理 7.1k次閱讀
下載排行
本周
- 1新一代網(wǎng)絡(luò)可視化(NPB 2.0)
- 3.40 MB | 1次下載 | 免費(fèi)
- 2MDD品牌三極管MMBT3906數(shù)據(jù)手冊(cè)
- 2.33 MB | 次下載 | 免費(fèi)
- 3MDD品牌三極管S9012數(shù)據(jù)手冊(cè)
- 2.62 MB | 次下載 | 免費(fèi)
- 4聯(lián)想flex2-14D/15D說明書
- 4.92 MB | 次下載 | 免費(fèi)
- 5收音環(huán)繞擴(kuò)音機(jī) AVR-1507手冊(cè)
- 2.50 MB | 次下載 | 免費(fèi)
- 624Pin Type-C連接器設(shè)計(jì)報(bào)告
- 1.06 MB | 次下載 | 免費(fèi)
- 7MS1000TA 超聲波測(cè)量模擬前端芯片技術(shù)手冊(cè)
- 0.60 MB | 次下載 | 免費(fèi)
- 8MS1022高精度時(shí)間測(cè)量(TDC)電路數(shù)據(jù)手冊(cè)
- 1.81 MB | 次下載 | 免費(fèi)
本月
- 1愛華AIWA HS-J202維修手冊(cè)
- 3.34 MB | 37次下載 | 免費(fèi)
- 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊(cè)
- 1.63 MB | 23次下載 | 免費(fèi)
- 3NB-IoT芯片廠商的資料說明
- 0.31 MB | 22次下載 | 1 積分
- 4H110主板CPU PWM芯片ISL95858HRZ-T核心供電電路圖資料
- 0.63 MB | 6次下載 | 1 積分
- 5UWB653Pro USB口測(cè)距通信定位模塊規(guī)格書
- 838.47 KB | 5次下載 | 免費(fèi)
- 6技嘉H110主板IT8628E_BX IO電路圖資料
- 2.61 MB | 4次下載 | 1 積分
- 7蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
- 0.04 MB | 4次下載 | 1 積分
- 8100W準(zhǔn)諧振反激式恒流電源電路圖資料
- 0.09 MB | 2次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191439次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183353次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評(píng)論