機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)離不開(kāi)數(shù)學(xué),本文從數(shù)學(xué)基礎(chǔ)的角度入手,推薦了數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)方面的七本參考書(shū)以及兩本補(bǔ)充讀物。相信對(duì)打好數(shù)學(xué)基礎(chǔ)的相關(guān)人士會(huì)有所幫助。
大多數(shù)人學(xué)習(xí)數(shù)據(jù)科學(xué)的人都會(huì)把重點(diǎn)放在編程上,實(shí)際上編程能力確實(shí)是機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)領(lǐng)域的重要技能。但是,要真正精通數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí),必然不能忽視的數(shù)據(jù)科學(xué)背后的數(shù)學(xué)基礎(chǔ)。
出于這個(gè)目的,本文介紹了七本在注重打好數(shù)據(jù)科學(xué)的數(shù)學(xué)基礎(chǔ)上的技術(shù)讀物。當(dāng)然,涉及到數(shù)學(xué),往往閱讀體驗(yàn)可能不會(huì)很舒服,但要搞好機(jī)器學(xué)習(xí),數(shù)學(xué)基礎(chǔ)是必須要打牢的,所以努力讀書(shū)吧!
先說(shuō)一說(shuō)為什么在數(shù)據(jù)科學(xué)學(xué)習(xí)時(shí)打好數(shù)學(xué)基礎(chǔ)。
以下是我總結(jié)的幾個(gè)原因:
AI領(lǐng)域無(wú)時(shí)無(wú)刻不在迅速變化。Hinton認(rèn)為,我們也許應(yīng)該重新思考反向傳播。掌握牢固的數(shù)學(xué)知識(shí)有助于更好地理解AI的演變。一個(gè)數(shù)學(xué)基礎(chǔ)深厚的人,對(duì)AI的理解和認(rèn)識(shí)與其他僅從表面認(rèn)識(shí)AI的人有很大的區(qū)別。此外,掌握數(shù)學(xué)知識(shí)還能更好地了解AI技術(shù)帶來(lái)知識(shí)產(chǎn)權(quán)的潛力。最后,了解數(shù)據(jù)科學(xué)背后的數(shù)學(xué)知識(shí),也可以讓人更容易獲得AI和數(shù)據(jù)科學(xué)的高端職位。
此外,作者推薦這幾本書(shū),還有兩點(diǎn)個(gè)人原因:
1.作者在牛津大學(xué)教授物聯(lián)網(wǎng)數(shù)據(jù)科學(xué)的課程,也包括一些AI技術(shù)應(yīng)用方面的教學(xué)事務(wù),在教學(xué)過(guò)程中涉及到數(shù)學(xué)基礎(chǔ)知識(shí)和課程。
2.其次,作者在寫(xiě)一本書(shū)來(lái)簡(jiǎn)述人工智能,從數(shù)學(xué)的角度入手,目標(biāo)讀者是14到18歲的少年。要深入了解數(shù)學(xué)科學(xué)和人工智能數(shù)學(xué)的數(shù)學(xué)基礎(chǔ),你需要了解四個(gè)方面知識(shí):線性代數(shù),概率論,多元微積分和優(yōu)化。目前在高中階段至少會(huì)教授這些課程的一部分內(nèi)容。因此,我試圖將高中數(shù)學(xué)與人工智能和數(shù)據(jù)科學(xué)聯(lián)系起來(lái),重點(diǎn)是數(shù)學(xué)建模。
下面進(jìn)入正題:
(1) The Nature Of Statistical Learning Theory《統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)》
作者:VladimirVapnik
PDF資源:
https://statisticalsupportandresearch.files.wordpress.com/2017/05/vladimir-vapnik-the-nature-of-statistical-learning-springer-2010.pdf
如果說(shuō)要列一份關(guān)于數(shù)學(xué)的書(shū)單,這本書(shū)是繞不過(guò)去的。本書(shū)單中排名第一的就是俄羅斯著名數(shù)學(xué)家VladimirVapnik的《統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)》。在這份清單中的所有書(shū)籍中,Vapnik這本是最不好找的。VladimirVapnik是支持向量機(jī)(SVM)的創(chuàng)始人。他的維基百科頁(yè)面中提供了更多關(guān)于他研究成果的介紹。
(2)Pattern Classification(2007-12-24)《模式分類》
作者:RichardODuda
PDF資源:
https://cds.cern.ch/record/683166/files/0471056693_TOC.pdf
就像Vapnik的著作一樣,Duda的著作時(shí)另一個(gè)時(shí)代的另一部經(jīng)典。本書(shū)初版于1973年,在二十多年后的2000年才推出第二版,此后一直未再版。時(shí)隔近二十年,本書(shū)仍然是一個(gè)重要資源。本書(shū)采用模式識(shí)別方法,并涵蓋了廣泛的算法。
(3)
MachineLearning:AnAlgorithmicPerspective,SecondEdition(Chapman&Hall/CrcMachineLearning&PatternRecognition)
《機(jī)器學(xué)習(xí):算法視角》
PDF資源:
https://doc.lagout.org/science/Artificial%20Intelligence/Machine%20learning/Machine%20Learning_%20An%20Algorithmic%20Perspective%20%282nd%20ed.%29%20%5BMarsland%202014-10-08%5D.pdf
這本書(shū)現(xiàn)在已經(jīng)出版了第二版。此書(shū)第一版是我讀過(guò)的最早的書(shū)關(guān)于機(jī)器學(xué)習(xí)和算法的著作之一,第二版增加了更多Python代碼。與前兩本書(shū)一樣,本書(shū)也非常強(qiáng)調(diào)算法。
(4)
TheElementsofStatisticalLearning:DataMining,Inference,andPrediction,SecondEdition
《統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ):數(shù)據(jù)挖掘、推理和預(yù)測(cè)》(第二版)
作者:TrevorHastie,RobertTibshirani,JeromeFriedman
PDF資源:https://web.stanford.edu/~hastie/Papers/ESLII.pdf
另一本經(jīng)典之作,可以作為參考書(shū)。
(5)Pattern Recognition and Machine Learning (Information Science and Statistics)
《模式識(shí)別與機(jī)器學(xué)習(xí)(信息科學(xué)與統(tǒng)計(jì))》
作者:ChristopherM.Bishop
PDF資源:http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf
ChristopherM.Bishop的模式識(shí)別和機(jī)器學(xué)習(xí)(信息科學(xué)和統(tǒng)計(jì)學(xué))也是一本深入而精心設(shè)計(jì)的參考書(shū)。
(6)
MachineLearning:TheArtandScienceofAlgorithmsthatMakeSenseofData
作者:PeterFlach
PDF資源:http://www.cs.put.poznan.pl/tpawlak/files/ZMIO/W02.pdf
我喜歡PeterFlach的書(shū),盡管亞馬遜網(wǎng)站上的一些評(píng)論說(shuō)這書(shū)寫(xiě)得太羅嗦,而且代碼量顯得不足。我特別喜歡這本書(shū)中的算法分組(邏輯模型,線性模型,概率模型)章節(jié)以及這些主題的整體講述方式。
最后,是我最推薦的一本書(shū):
(7)Deep Learning《深度學(xué)習(xí)》
作者:Goodfellow、Bengio、Corville
相關(guān)資源:https://www.deeplearningbook.org/
如果你在找一本值得逐頁(yè)讀完的書(shū),就是它了!這本書(shū)既詳細(xì),又有現(xiàn)代感,書(shū)中內(nèi)容幾乎涵蓋了你能想到的關(guān)于深度學(xué)習(xí)的一切知識(shí)。
補(bǔ)充兩本書(shū):
A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition) by Simon Rogers, Mark Girolami
作者:SimonRogers,MarkGirolami
我覺(jué)得這本書(shū)并不太適合初學(xué)者,但它仍然是一本好書(shū)(特別是第二版)
MachineLearning:AProbabilisticPerspective
作者:KevinMurphy
這本書(shū)中評(píng)價(jià)也很高,但我個(gè)人沒(méi)有讀過(guò)(因此沒(méi)有收集)。
寫(xiě)在最后:
除了最后一本《深度學(xué)習(xí)》之外,我建議其他書(shū)不必逐頁(yè)閱讀,而是將其作為參考書(shū),根據(jù)需要按相應(yīng)主題閱讀相應(yīng)的書(shū)籍。這些書(shū)教會(huì)了我時(shí)刻保持謙遜。無(wú)論我們現(xiàn)在知道了多少,掌握了多少知識(shí),都總能在閱讀過(guò)程中發(fā)現(xiàn),這個(gè)領(lǐng)域原來(lái)是如此的龐大和復(fù)雜。
這些書(shū)已經(jīng)超越了時(shí)間。VladimirVapnik現(xiàn)年已經(jīng)81歲。Duda的著作初版于1973年。我預(yù)計(jì)50年以后,這個(gè)行業(yè)里的人們?nèi)匀粫?huì)閱讀這些著作。就像與那些經(jīng)歷了時(shí)間考驗(yàn)的老朋友們重逢一樣。多年之后,也許你會(huì)發(fā)現(xiàn),在眼花繚亂的技術(shù)、模型和框架背后,數(shù)學(xué)是永恒的。
-
AI
+關(guān)注
關(guān)注
91文章
41479瀏覽量
302795 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
67文章
8567瀏覽量
137288 -
數(shù)據(jù)科學(xué)
+關(guān)注
關(guān)注
0文章
168瀏覽量
10828
原文標(biāo)題:【薦書(shū)】提升機(jī)器學(xué)習(xí)數(shù)學(xué)基礎(chǔ),這7本書(shū)一定要讀(附pdf資源)
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
使用NORDIC AI的好處
算力賦能,打造生命科學(xué)云上新范式
從手工到自動(dòng):焊球剪切測(cè)試的技術(shù)演進(jìn)與科學(xué)原理
不止于數(shù)學(xué):實(shí)際部署是筑牢后量子安全的關(guān)鍵環(huán)節(jié)
Channel Sounding技術(shù)
AES加解密算法邏輯實(shí)現(xiàn)及其在蜂鳥(niǎo)E203SoC上的應(yīng)用介紹
利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護(hù)科學(xué)
用FPGA實(shí)現(xiàn)DDR控制模塊介紹
Photonis 科學(xué)圖像增強(qiáng)器介紹
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用
能量收集技術(shù)在物聯(lián)網(wǎng)設(shè)備上的應(yīng)用與解決方案
介紹七本在注重打好數(shù)據(jù)科學(xué)的數(shù)學(xué)基礎(chǔ)上的技術(shù)讀物
評(píng)論