日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

數(shù)據(jù)分析中最常用、最好用的20個Python庫分享

電子設計 ? 來源:Yingying,李大囧 ? 作者:ActiveWizards ? 2021-01-03 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導讀】Python在解決數(shù)據(jù)科學任務和挑戰(zhàn)方面處于領先地位。而一些方便易用的庫則幫助了開發(fā)人員高效開發(fā)。在這里我們整理了20個在深度學習、數(shù)據(jù)分析中最常用、最好用的Python庫,供大家一起學習。

作者| ActiveWizards

編譯|專知

整理|Yingying,李大囧

核心庫與統(tǒng)計

NumPy

我們從科學應用程序庫開始說起,NumPy是該領域的主要軟件包之一。 它旨在處理大型多維數(shù)組和矩陣,并且廣泛的高級數(shù)學函數(shù)和實現(xiàn)的方法集合,使得可以使用這些對象執(zhí)行各種操作。

在這一年中,NumPy有很多更新。 除了錯誤修復和兼容性問題之外,關鍵更新還包括NumPy對象的打印格式。此外,某些函數(shù)現(xiàn)在可以處理Python中可用的任何編碼的文件。

SciPy

另一個科學計算核心庫是SciPy。它基于NumPy,并擴展了其功能。 SciPy主數(shù)據(jù)結構又是一個多維數(shù)組,由Numpy實現(xiàn)。該軟件包包含有助于解決線性代數(shù),概率論,積分計算和更多任務的工具。

SciPy可以適配不同的操作系統(tǒng)。這一年,Scipy帶來了許多函數(shù)的更新,尤其是優(yōu)化器也更新了。此外,封裝了許多新的BLAS和LAPACK函數(shù)。

Pandas

Pandas提供了高級數(shù)據(jù)結構和各種分析工具。該軟件包的一大特色是能夠將相當復雜的數(shù)據(jù)操作轉換為一個或兩個命令。 Pandas包含許多用于分組,過濾和組合數(shù)據(jù)的內置方法,以及時間序列功能。

Pandas在這一年的更新包括數(shù)百個新功能,bug修復和API的更改。

StatsModels

Statsmodels是一個統(tǒng)用于統(tǒng)計數(shù)據(jù)分析的方法,例如統(tǒng)計模型估計,執(zhí)行統(tǒng)計測試等。在它的幫助下,您可以實現(xiàn)許多機器學習方法。

這個庫在不停的更新。今年帶來了時間序列改進和新的計數(shù)模型,即GeneralizedPoisson,零膨脹模型和NegativeBinomialP,以及新的多變量方法 - 因子分析,MANOVA和ANOVA中的重復測量。

可視化

Matplotlib

Matplotlib是一個用于創(chuàng)建二維圖表和圖形的低級庫。 借助它的幫助,您可以構建各種圖表,從直方圖和散點圖到非笛卡爾坐標圖。 此外,許多流行的繪圖庫被設計為與matplotlib一起使用。

顏色,尺寸,字體,圖例的樣式等都有變化。比如軸圖例的自動對齊,和更友好的配色。

pIYBAF9uKKOAZAQaAAEltPVFels346.png

Seaborn

Seaborn本質上是基于matplotlib庫的更高級別的API。 它包含有豐富的可視化圖庫,包括時間序列,聯(lián)合圖和小提琴圖(展示數(shù)據(jù)密度分布)等復雜類型。

seaborn更新主要包括bug修復。 此外,F(xiàn)acetGrid或PairGrid與增強的交互式matplotlib后端之間的兼容性有所改進,為可視化添加了參數(shù)和選項。

o4YBAF9uKKWAJTbuAAFnnWiR5ak704.png

Plotly

Plotly是一個流行的庫,可以讓您輕松地構建復雜的圖形。 該軟件包適用于交互式Web應用程序。 其可視化效果包括輪廓圖形,三元圖和3D圖表。

今年該庫的更新包括對“多鏈接視圖”以及動畫和串擾集成的支持。

Bokeh

Bokeh庫使用JavaScript小部件在瀏覽器中創(chuàng)建交互式和可伸縮的可視化。 該庫提供了多種圖形,樣式及鏈接圖形式的交互能力,定義回調以及更多有用的功能。

Bokeh可以提供改進的交互式功能,例如分類刻度標簽的旋轉,以及小縮放工具和自定義工具提示字段增強功能。

pIYBAF9uKKiADl8nAAJgUugR2a8987.png

Pydot

Pydot是Graphviz的一個接口,用純Python編寫。 在它的幫助下,可以顯示圖形的結構,這在構建神經(jīng)網(wǎng)絡和基于決策樹的算法時會經(jīng)常用到。

pIYBAF9uKKuASmz2AAGODhkEbXg177.png

機器學習

Scikit-learn

這個基于NumPy和SciPy的Python模塊是處理數(shù)據(jù)的最佳庫之一。它為許多標準機器學習和數(shù)據(jù)挖掘任務提供算法,例如聚類,回歸,分類,降維和模型選擇。

今年這個庫的更新包括:修改交叉驗證,提供了使用多個指標的功能;最近鄰和邏輯回歸等幾種訓練方法有一些小的改進。

XGBoost / LightGBM / CatBoost

Boosting是最流行的機器學習算法之一,其在于構建基本模型的集合,即決策樹。因此,有專門的庫設計用于快速方便地實現(xiàn)該方法。XGBoost,LightGBM和CatBoost值得特別關注。這些庫提供高度優(yōu)化,可擴展和快速的梯度增強實現(xiàn),這使得它們在數(shù)據(jù)科學家和Kaggle競賽中非常受歡迎。

Eli5

通常,機器學習模型預測的結果并不完全清楚,而eli5庫有助與解決問題。它是一個可視化調試機器學習模型的包,并逐步跟蹤算法的工作過程。它可與scikit-learn,XGBoost,LightGBM,lightning和sklearn-crfsuite庫兼容。

深度學習

TensorFlow

TensorFlow是一個流行的深度和機器學習框架,由Google Brain開發(fā)。它提供了使用具有多個數(shù)據(jù)集的人工神經(jīng)網(wǎng)絡的能力。最受歡迎的TensorFlow應用包括對象識別,語音識別等。

這個庫在新版本中很快,引入了新功能和新功能。最新的修復包括潛在的安全漏洞和改進的TensorFlow和GPU集成,例如您可以在一臺計算機上的多個GPU上運行Estimator模型。

PyTorch

PyTorch是一個大型框架,允許使用GPU加速執(zhí)行張量計算,創(chuàng)建動態(tài)計算圖并自動計算梯度。在此之上,PyTorch提供了豐富的API,用于解決與神經(jīng)網(wǎng)絡相關的應用。

該庫基于Torch,這是一個用C語言實現(xiàn)的開源深度學習庫,在Lua中有一個包裝器。 Python API于2017年推出,從那時起,該框架越來越受歡迎并吸引了越來越多的數(shù)據(jù)科學家。

Keras

Keras是一個用于處理神經(jīng)網(wǎng)絡的高級庫,運行在TensorFlow,Theano之上?,F(xiàn)在它也可以使用CNTK和MxNet作為后端。它簡化了許多特定任務,并大大減少了單調代碼的數(shù)量。但是,它可能不適合某些復雜的事情。

該庫在性能,可用性,文檔和API都有一定改進。一些新功能是Conv3DTranspose層,新的MobileNet應用程序和自我規(guī)范化網(wǎng)絡。

分布式深度學習

Dist-keras / elephas / spark-deep-learning

使用像Apache Spark這樣的分布式計算系統(tǒng)可以更輕松地處理如此大量的數(shù)據(jù),這再次擴展了深度學習的可能性。因此,dist-keras,elephas和spark-deep-learning正在迅速發(fā)展。這些軟件包可以在Apache Spark的幫助下直接基于Keras庫訓練神經(jīng)網(wǎng)絡。 Spark-deep-learning還提供了使用Python神經(jīng)網(wǎng)絡創(chuàng)建管道的工具。

自然語言處理

NLTK

NLTK是一組庫,是自然語言處理的完整平臺。 在NLTK的幫助下,您可以通過各種方式處理和分析文本,標記文本,提取信息等。NLTK還用于原型設計和構建研究系統(tǒng)。

這個庫的附魔包括API和兼容性的微小變化以及CoreNLP的新界面。

SpaCy

SpaCy是一個自然語言處理庫,包含優(yōu)秀的demo,API文檔和演示應用程序。該庫是用Cython語言編寫的,它是Python的C擴展。它支持近30種語言,提供簡單的深度學習集成,并保證了穩(wěn)健性和高準確性。 SpaCy的另一個重要特性它是為整個文檔處理而設計的,而不會將文檔分成短語。

Gensim

Gensim是一個用于強大語義分析,主題建模和向量空間建模的Python庫,基于Numpy和Scipy構建。它提供了流行的NLP算法的實現(xiàn),例如word2vec。

數(shù)據(jù)抓取

Scrapy

Scrapy是一個用于創(chuàng)建掃描網(wǎng)站頁面和收集結構化數(shù)據(jù)的爬蟲庫。此外,Scrapy可以從API中提取數(shù)據(jù)。由于其可擴展性和可移植性,該庫恰好非常方便。

結論
與去年相比,一些新的庫越來越受歡迎,而那些已成為數(shù)據(jù)科學任務經(jīng)典庫正在不斷改進。

表格中列出了這些庫的github活動的詳細統(tǒng)計信息。

o4YBAF9uKK-AYCGJAAOx6nNMTIY255.png

編輯:hfy


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • python
    +關注

    關注

    58

    文章

    4889

    瀏覽量

    90327
  • 深度學習
    +關注

    關注

    73

    文章

    5610

    瀏覽量

    124652
  • 自然語言處理

    關注

    1

    文章

    630

    瀏覽量

    14735
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    瓴羊Quick BI V6.1智能小Q深度進化,超級數(shù)據(jù)分析師如何更好用?

    自25年8月發(fā)布以來,瓴羊Quick BI智能小Q作為數(shù)據(jù)分析Agent的先行者,已在零售、金融、制造等行業(yè)的百余業(yè)務場景中完成價值驗證,讓“人人擁有超級數(shù)據(jù)分析師”從愿景走向現(xiàn)實。但在應用場
    的頭像 發(fā)表于 03-18 10:18 ?144次閱讀
    瓴羊Quick BI V6.1智能小Q深度進化,超級<b class='flag-5'>數(shù)據(jù)分析</b>師如何更<b class='flag-5'>好用</b>?

    API數(shù)據(jù)分析:淘寶流量來源分析,渠道優(yōu)化!

    優(yōu)化渠道策略。我們將使用Python作為工具,結合數(shù)據(jù)分析和統(tǒng)計方法,確保過程真實可靠。 1. 理解淘寶流量來源 淘寶流量主要來自多個渠道,包括: 直接訪問 :用戶直接輸入淘寶網(wǎng)址或從收藏夾訪問。 搜索引擎 :如百度或淘寶內搜索,貢獻
    的頭像 發(fā)表于 01-23 13:42 ?426次閱讀
    API<b class='flag-5'>數(shù)據(jù)分析</b>:淘寶流量來源<b class='flag-5'>分析</b>,渠道優(yōu)化!

    利用拼多多用戶API進行粉絲數(shù)據(jù)分析,有效提升用戶粘性

    這些API進行粉絲數(shù)據(jù)分析,并基于分析結果制定增強用戶粘性的策略。 一、 拼多多用戶API概覽 拼多多開放平臺提供了豐富的API接口,涵蓋商品、交易、用戶、物流等多個維度。對于粉絲數(shù)據(jù)分析,以下幾個API尤為關鍵: 粉絲明細查詢
    的頭像 發(fā)表于 12-30 10:38 ?384次閱讀
    利用拼多多用戶API進行粉絲<b class='flag-5'>數(shù)據(jù)分析</b>,有效提升用戶粘性

    淘寶數(shù)據(jù)分析API:用戶行為洞察,精準營銷決策!

    。本文將探討如何利用這些API實現(xiàn)用戶行為的深度洞察,并轉化為實際的營銷價值。 一、用戶行為數(shù)據(jù)的價值:從流量到洞察 用戶進入店鋪或瀏覽商品的每一動作,都蘊含著豐富的信息。傳統(tǒng)的數(shù)據(jù)分析可能停留在流量、轉化率等宏觀層面
    的頭像 發(fā)表于 12-25 14:12 ?426次閱讀
    淘寶<b class='flag-5'>數(shù)據(jù)分析</b>API:用戶行為洞察,精準營銷決策!

    經(jīng)營數(shù)據(jù)分析可以通過哪些方式

    在數(shù)聚股份看來,提起經(jīng)營數(shù)據(jù)分析,大家往往會聯(lián)想到一些密密麻麻的數(shù)字表格,或是高級的數(shù)據(jù)建模手法,再或是華麗的數(shù)據(jù)報表。其實,“ 分析 ”本身是每個人都具備的能力,對于業(yè)務決策者而言,
    的頭像 發(fā)表于 12-05 16:31 ?750次閱讀

    廣立微DE-G零斷檔重構智能數(shù)據(jù)分析

    近日,數(shù)據(jù)分析領域被一則消息推上風口浪尖:一家老牌軟件巨頭將撤出中國。在此背景下,其旗下以靈活著稱的數(shù)據(jù)分析軟件,在中國市場的未來將面臨極大的不確定性。
    的頭像 發(fā)表于 11-07 10:39 ?843次閱讀

    【產(chǎn)品介紹】Altair RapidMiner數(shù)據(jù)分析與人工智能平臺

    AltairRapidMiner賦能組織解鎖數(shù)據(jù)洞察,運用數(shù)據(jù)分析和先進的人工智能自動化,提供可擴展的面向未來的解決方案。Altair數(shù)據(jù)分析和人工智能平臺包括數(shù)據(jù)準備、
    的頭像 發(fā)表于 09-18 17:56 ?1046次閱讀
    【產(chǎn)品介紹】Altair RapidMiner<b class='flag-5'>數(shù)據(jù)分析</b>與人工智能平臺

    普迪飛 Exensio?數(shù)據(jù)分析平臺 | Test Operations解鎖半導體測試新紀元

    TestOperations是Exensio數(shù)據(jù)分析平臺的四主要模塊之一。T-Ops模塊旨在幫助集成器件制造商(IDM)、無晶圓廠半導體公司(Fabless)和外包半導體(產(chǎn)品)封測廠(OSAT
    的頭像 發(fā)表于 08-19 13:53 ?1751次閱讀
    普迪飛 Exensio?<b class='flag-5'>數(shù)據(jù)分析</b>平臺 | Test Operations解鎖半導體測試新紀元

    如何通過數(shù)據(jù)分析識別設備故障模式?

    通過數(shù)據(jù)分析識別設備故障模式,本質是從聲振溫等多維數(shù)據(jù)中提取故障特征,建立 “數(shù)據(jù)特征 - 故障類型” 的映射關系,核心可通過特征提取、模式匹配、趨勢分析三步實現(xiàn),精準定位故障根源與發(fā)
    的頭像 發(fā)表于 08-19 11:14 ?1145次閱讀
    如何通過<b class='flag-5'>數(shù)據(jù)分析</b>識別設備故障模式?

    技能+1!如何在樹莓派上使用C++控制GPIO?

    在使用樹莓派時,你會發(fā)現(xiàn)Python和Scratch是許多任務(包括GPIO編程)中最常用的編程語言。但你知道嗎,你也可以使用C++進行GPIO編程,而且這樣做還有不少好處。借助WiringPi
    的頭像 發(fā)表于 08-06 15:33 ?4518次閱讀
    技能+1!如何在樹莓派上使用C++控制GPIO?

    Oracle數(shù)據(jù)恢復—格式化分區(qū)導致Oracle數(shù)據(jù)庫報錯的數(shù)據(jù)恢復案例

    完成后將所有硬盤按照原樣還原到原服務器中,后續(xù)的數(shù)據(jù)分析數(shù)據(jù)恢復操作基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。基于鏡像文件分析所有硬盤底層
    的頭像 發(fā)表于 07-22 14:06 ?538次閱讀
    Oracle<b class='flag-5'>數(shù)據(jù)</b>恢復—格式化分區(qū)導致Oracle<b class='flag-5'>數(shù)據(jù)庫</b>報錯的<b class='flag-5'>數(shù)據(jù)</b>恢復案例

    構建自定義電商數(shù)據(jù)分析API

    ? 在電商業(yè)務中,數(shù)據(jù)是驅動決策的核心。隨著數(shù)據(jù)量的增長,企業(yè)需要實時、靈活的分析工具來監(jiān)控銷售、用戶行為和庫存等指標。一自定義電商數(shù)據(jù)分析
    的頭像 發(fā)表于 07-17 14:44 ?738次閱讀
    構建自定義電商<b class='flag-5'>數(shù)據(jù)分析</b>API

    AI數(shù)據(jù)分析儀設計原理圖:RapidIO信號接入 平板AI數(shù)據(jù)分析

    AI數(shù)據(jù)分析儀, 平板數(shù)據(jù)分析儀, 數(shù)據(jù)分析儀, AI邊緣計算, 高帶寬數(shù)據(jù)輸入
    的頭像 發(fā)表于 07-17 09:20 ?900次閱讀
    AI<b class='flag-5'>數(shù)據(jù)分析</b>儀設計原理圖:RapidIO信號接入 平板AI<b class='flag-5'>數(shù)據(jù)分析</b>儀

    如何使用協(xié)議分析儀進行數(shù)據(jù)分析與可視化

    使用協(xié)議分析儀進行數(shù)據(jù)分析與可視化,需結合數(shù)據(jù)捕獲、協(xié)議解碼、統(tǒng)計分析及可視化工具,將原始數(shù)據(jù)轉化為可解讀的圖表和報告。以下是詳細步驟及關鍵
    發(fā)表于 07-16 14:16

    達夢數(shù)據(jù)庫常用管理SQL命令詳解

    達夢數(shù)據(jù)庫常用管理SQL命令詳解
    的頭像 發(fā)表于 06-17 15:12 ?7686次閱讀
    達夢<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>常用</b>管理SQL命令詳解
    龙门县| 鄯善县| 定州市| 武汉市| 泸州市| 织金县| 庆阳市| 襄樊市| 盐边县| 侯马市| 汉寿县| 昌平区| 文化| 错那县| 科尔| 太谷县| 黎平县| 泸西县| 唐河县| 白山市| 逊克县| 洪洞县| 嘉黎县| 江阴市| 从江县| 如皋市| 清河县| 剑川县| 竹溪县| 湖南省| 玛纳斯县| 珠海市| 增城市| 改则县| 抚松县| 宿州市| 朝阳市| 清新县| 彝良县| 乌拉特中旗| 西畴县|