近日,Github出爐報(bào)告,統(tǒng)計(jì)了2018年最受歡迎的編程語(yǔ)言、使用最廣的軟件包和貢獻(xiàn)者最多的熱門(mén)項(xiàng)目Top10。Python、Numpy和Tensorflow分別位列第一,可謂眾望所歸。C++、Java、Pandas、Scikit-learn等熱門(mén)語(yǔ)言、庫(kù)和項(xiàng)目均進(jìn)入Top10。
在我們2018年的Octoverse報(bào)告中,機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)成為GitHub上的熱門(mén)話題。 tensorflow是貢獻(xiàn)最大的項(xiàng)目之一,pytorch 是增長(zhǎng)最快的項(xiàng)目之一,Python是GitHub上第三大最受歡迎的語(yǔ)言。我們決定在GitHub上繼續(xù)深入研究機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)的現(xiàn)狀。
我們抓取了2018年1月1日到2018年12月31日之間的貢獻(xiàn)數(shù)據(jù)。這里的貢獻(xiàn)可能包括推送代碼、提出問(wèn)題或提取請(qǐng)求,評(píng)論問(wèn)題或提取請(qǐng)求,或?qū)彶樘崛≌?qǐng)求。對(duì)于大多數(shù)導(dǎo)入包,我們使用了依賴(lài)關(guān)系圖中的數(shù)據(jù),其中包括所有公共存儲(chǔ)庫(kù)和已選擇加入依賴(lài)關(guān)系圖的全部私有存儲(chǔ)庫(kù)。
最受歡迎的機(jī)器學(xué)習(xí)編程語(yǔ)言:Python居首
2018年GitHub上最受歡迎的機(jī)器學(xué)習(xí)語(yǔ)言
我們查看了使用“機(jī)器學(xué)習(xí)”主題標(biāo)記的存儲(chǔ)庫(kù)的貢獻(xiàn)者,并對(duì)存儲(chǔ)庫(kù)中最常見(jiàn)的主要語(yǔ)言進(jìn)行了排名。Python是機(jī)器學(xué)習(xí)資源庫(kù)中最常用的語(yǔ)言,也是GitHub上第三常用的語(yǔ)言。然而,并非所有機(jī)器學(xué)習(xí)項(xiàng)目都使用Python:GitHub上的一些最常見(jiàn)的語(yǔ)言也是機(jī)器學(xué)習(xí)項(xiàng)目的通用語(yǔ)言。
C ++,JavaScript,Java,C#,Shell和TypeScript等語(yǔ)言都位列GitHub上最常使用的語(yǔ)言前10名,它們也位列機(jī)器學(xué)習(xí)項(xiàng)目最常用語(yǔ)言的前10名。
Julia、R和Scala等語(yǔ)言也位列機(jī)器學(xué)習(xí)項(xiàng)目的前10名,但沒(méi)有進(jìn)入整個(gè)GitHub使用語(yǔ)言的前十。 Julia和R都是數(shù)據(jù)科學(xué)家常用的語(yǔ)言,而Scala在與Apache Spark等語(yǔ)言在大數(shù)據(jù)系統(tǒng)交互下的應(yīng)用越來(lái)越普遍。
使用最廣泛的機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)軟件包:Numpy第一
2018年導(dǎo)入Github資源庫(kù)的頂級(jí)軟件包
我們從依賴(lài)圖中提取數(shù)據(jù),計(jì)算出導(dǎo)入流行Python包的機(jī)器學(xué)習(xí)或數(shù)據(jù)科學(xué)主題的項(xiàng)目百分比。上面的列表顯示了這些項(xiàng)目導(dǎo)入的前十個(gè)包。結(jié)果如下圖所示:
Numpy是一個(gè)支持多維數(shù)據(jù)數(shù)學(xué)運(yùn)算的軟件包,是被導(dǎo)入次數(shù)最多的包,被用于近四分之三的機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)項(xiàng)目中。
Scipy是一個(gè)用于科學(xué)計(jì)算的軟件包,Pandas是一個(gè)用于管理數(shù)據(jù)集的軟件包,matplotlib是一個(gè)可視化庫(kù),這三個(gè)包被用于超過(guò)40%的機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)項(xiàng)目中。
Scikit-learn是一種非常流行的機(jī)器學(xué)習(xí)包,包含大量機(jī)器學(xué)習(xí)算法實(shí)現(xiàn),近40%的項(xiàng)目使用它。
Tensorflow是一種用于處理神經(jīng)網(wǎng)絡(luò)的軟件包,有近四分之一的軟件包使用它。
前十名中的其他包都是功能性程序包:其中六個(gè)是Python 2和3兼容性庫(kù),python-dateutil和pytz是用于處理日期的包。
最受歡迎的機(jī)器學(xué)習(xí)項(xiàng)目:Tensorflow折桂
2018年GitHub上的頂級(jí)機(jī)器學(xué)習(xí)項(xiàng)目
我們還考察了2018年“機(jī)器學(xué)習(xí)”標(biāo)簽下貢獻(xiàn)者最多的開(kāi)源項(xiàng)目。Tensorflow是迄今為止最受歡迎的項(xiàng)目,是排名第二的scikit-learn的貢獻(xiàn)者數(shù)量的5倍多。
explosion/spaCy和RasaHQ /rasa_nlu這兩個(gè)項(xiàng)目專(zhuān)注于自然語(yǔ)言處理問(wèn)題。
另外四個(gè)項(xiàng)目,CMU-Perceptual-Computing-Lab / openpose,thtrieu / darkflow,ageitgey / face_recognition和tesseract-ocr / tesseract,專(zhuān)注于圖像處理。 Julia語(yǔ)言源代碼項(xiàng)目也是2018年貢獻(xiàn)者最多的項(xiàng)目之一。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
67文章
8567瀏覽量
137265 -
GitHub
+關(guān)注
關(guān)注
3文章
489瀏覽量
18770 -
數(shù)據(jù)科學(xué)
+關(guān)注
關(guān)注
0文章
168瀏覽量
10827
原文標(biāo)題:Github機(jī)器學(xué)習(xí)年度熱門(mén)排行:最熱編程語(yǔ)言Python第一
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
RT-Thread任務(wù)+消息訂閱管理框架軟件包:thread_manager+event_loop
RT-Thread Vector軟件包:嵌入式開(kāi)發(fā)的動(dòng)態(tài)數(shù)組容器 | 技術(shù)集結(jié)
瑞薩靈活配置軟件包FSP 6.2.0版本的更新內(nèi)容
Github2018年最熱語(yǔ)言\軟件包\項(xiàng)目top 10盤(pán)點(diǎn)
評(píng)論