日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python工具pandas篩選數(shù)據(jù)的15個(gè)常用技巧

數(shù)據(jù)分析與開發(fā) ? 來(lái)源:數(shù)據(jù)分析與開發(fā) ? 作者:數(shù)據(jù)分析與開發(fā) ? 2021-03-30 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

pandas是Python數(shù)據(jù)分析必備工具,它有強(qiáng)大的數(shù)據(jù)清洗能力,往往能用非常少的代碼實(shí)現(xiàn)較復(fù)雜的數(shù)據(jù)處理

今天,總結(jié)了pandas篩選數(shù)據(jù)的15個(gè)常用技巧,主要包括5個(gè)知識(shí)點(diǎn):

比較運(yùn)算:==、《、》、》=、《=、!=

范圍運(yùn)算:between(left,right)

字符篩選:str.contains(pattern或字符串,na=False)

邏輯運(yùn)算:&(與)、|(或)、not(取反)

比較函數(shù):eq, ne, le, lt, ge, gt(相當(dāng)于==,=!,《=,《,》=,》)

apply和isin函數(shù)

”下面以超市運(yùn)營(yíng)數(shù)據(jù)為例,給大家逐個(gè)講解首先讀取數(shù)據(jù):

import pandas as pd

data=pd.read_excel(‘超市運(yùn)營(yíng)數(shù)據(jù)模板.xlsx’)

data

8820b96c-8e33-11eb-8b86-12bb97331649.png

先看一下各列的數(shù)據(jù)類型:

data.dtypes

商品ID int64

類別ID int64

門店編號(hào) object

單價(jià) float64

銷量 float64

訂單ID object

日期 datetime64[ns]

時(shí)間 object

dtype: object

下面以實(shí)際應(yīng)用場(chǎng)景為例開始講解:

1.篩選門店編號(hào)為‘CDXL’的運(yùn)營(yíng)數(shù)據(jù)①第一種方法,用比較運(yùn)算符‘==’:

data[data.門店編號(hào)==‘CDXL’]

8bb1a37a-8e33-11eb-8b86-12bb97331649.png

②第二種方法,用比較函數(shù)‘eq’:

data[data[‘門店編號(hào)’].eq(‘CDXL’)]

8d57158e-8e33-11eb-8b86-12bb97331649.png

2.篩選單價(jià)小于等于10元的運(yùn)營(yíng)數(shù)據(jù)③第一種方法,用比較運(yùn)算符‘《=’:

data[data.單價(jià)《=10]

90a6426e-8e33-11eb-8b86-12bb97331649.png

④第二種方法,用比較函數(shù)‘le’:

data[data[‘單價(jià)’].le(10)]

928adb4e-8e33-11eb-8b86-12bb97331649.png

3.篩選銷量大于2000的運(yùn)營(yíng)數(shù)據(jù)⑤第一種方法,用比較運(yùn)算符‘》=’:

data[data.銷量》2]

92f569a0-8e33-11eb-8b86-12bb97331649.png

⑥第二種方法,用比較函數(shù)‘ge’:

data[data[‘銷量’].ge(2)]

92f569a0-8e33-11eb-8b86-12bb97331649.png

4.篩選除門店‘CDXL’外的運(yùn)營(yíng)數(shù)據(jù)⑦第一種方法,用比較運(yùn)算符‘!=’:

data[data.門店編號(hào)!=‘CDXL’]

9345c238-8e33-11eb-8b86-12bb97331649.png

⑧第二種方法,用比較函數(shù)‘ne’:

data[data[‘門店編號(hào)’].ne(‘CDXL’)]

9397ac38-8e33-11eb-8b86-12bb97331649.png

5.篩選2020年5月的運(yùn)營(yíng)數(shù)據(jù)首先將日期格式化:

data[‘日期’]=data[“日期”].values.astype(‘datetime64’) #如果已為日期格式則此步驟可省略

data[‘日期’]

import datetime

s_date = datetime.datetime.strptime(‘2020-04-30’, ‘%Y-%m-%d’).date() #起始日期

e_date = datetime.datetime.strptime(‘2020-06-01’, ‘%Y-%m-%d’).date() #結(jié)束日期

⑨第一種方法,用邏輯運(yùn)算符號(hào)‘》’ ‘《’和‘&’:

Pandasdatetime64[ns]不能直接與datetime.date相比,需要用pd.Timestamp進(jìn)行轉(zhuǎn)化

data[(data.日期》pd.Timestamp(s_date))&(data.日期《pd.Timestamp(e_date))]

93dc75ca-8e33-11eb-8b86-12bb97331649.png

⑩第二種,用比較函數(shù)‘gt’‘lt’和‘&’:

data[(data[‘日期’].lt(pd.Timestamp(e_date)))&(data[‘日期’].gt(pd.Timestamp(s_date)))]

94be8c4e-8e33-11eb-8b86-12bb97331649.png

?第三種,用apply函數(shù)實(shí)現(xiàn):

id_a=data.日期.apply(lambda x: x.year ==2020 and x.month==5)

data[id_a]

950240e2-8e33-11eb-8b86-12bb97331649.png

?第四種,用between函數(shù)實(shí)現(xiàn):

id_b=data.日期.between(pd.Timestamp(s_date),pd.Timestamp(e_date))

data[id_b]

953ad6f0-8e33-11eb-8b86-12bb97331649.png

6.篩選“類別ID”包含‘000’的數(shù)據(jù)?第一種,用contains函數(shù):

data[‘類別ID’]=data[‘類別ID’].values.astype(‘str’) #將該列轉(zhuǎn)換為字符數(shù)據(jù)類型

id_c=data.類別ID.str.contains(‘000’,na=False)

data[id_c]

95c1ec76-8e33-11eb-8b86-12bb97331649.png

?第二種,用isin函數(shù):

id_i=data.類別ID.isin([‘000’]) #接受一個(gè)列表

data[id_i]

很遺憾,isin函數(shù)搞不定,因?yàn)樗荒芘袛嘣摿兄性厥欠裨诹斜碇?/p>

7.篩選商品ID以“301”開頭的運(yùn)營(yíng)數(shù)據(jù)?需要用contains函數(shù)結(jié)合正則表達(dá)式使用:

data[‘商品ID’]=data[‘商品ID’].values.astype(‘str’) #將該列轉(zhuǎn)換為字符數(shù)據(jù)類型

id_c2=data.商品ID.str.contains(‘301d{5}’,na=False)

data[id_c2]

95c1ec76-8e33-11eb-8b86-12bb97331649.png

為了方便大家學(xué)習(xí),我已經(jīng)將本文數(shù)據(jù)及代碼打包好,請(qǐng)關(guān)注 數(shù)據(jù)分析與開發(fā) 公眾號(hào)在后臺(tái)回復(fù)關(guān)鍵字:篩選數(shù)據(jù) 獲取。

原文標(biāo)題:一次性總結(jié)了pandas提取數(shù)據(jù)的15種方法,統(tǒng)統(tǒng)只需1行代碼!

文章出處:【微信公眾號(hào):數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1523

    瀏覽量

    36373
  • python
    +關(guān)注

    關(guān)注

    58

    文章

    4889

    瀏覽量

    90330

原文標(biāo)題:一次性總結(jié)了pandas提取數(shù)據(jù)的15種方法,統(tǒng)統(tǒng)只需1行代碼!

文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Python AI 數(shù)字化實(shí)戰(zhàn):從 Pandas 自動(dòng)化到 DeepSeek “星邏系統(tǒng)”開發(fā),無(wú)密

    告別低效辦公:Pandas自動(dòng)化數(shù)據(jù)處理的技術(shù)內(nèi)幕與思維升維 在數(shù)字化辦公的洪流中,無(wú)數(shù)職場(chǎng)人正被困在“復(fù)制、粘貼、排序、篩選”的無(wú)限循環(huán)里。面對(duì)動(dòng)輒數(shù)十萬(wàn)行、跨多張表格的龐雜數(shù)據(jù),
    發(fā)表于 04-30 13:43

    廣東宏展科技ESS應(yīng)力篩選箱:助力生產(chǎn)線可靠性篩選提質(zhì)增效

    在電子、汽車電子、軍工配套等批量生產(chǎn)環(huán)節(jié),對(duì)每一件產(chǎn)品進(jìn)行快速溫變環(huán)境應(yīng)力篩選(ESS)已成為質(zhì)量控制的必要手段。然而,傳統(tǒng)試驗(yàn)設(shè)備在產(chǎn)線應(yīng)用中常面臨溫變速率不足、裝卸耗時(shí)、能耗偏高等問(wèn)題,導(dǎo)致篩選
    的頭像 發(fā)表于 04-25 10:20 ?584次閱讀
    廣東宏展科技ESS應(yīng)力<b class='flag-5'>篩選</b>箱:助力生產(chǎn)線可靠性<b class='flag-5'>篩選</b>提質(zhì)增效

    【分享】CAE前后處理數(shù)據(jù)太多?試試Simcenter HyperMesh這3個(gè)快速數(shù)據(jù)處理工具

    ,如何快速獲取數(shù)據(jù)無(wú)從下手;前處理模型與后處理結(jié)果數(shù)據(jù)割裂,對(duì)照查看、快速數(shù)據(jù)提取特別麻煩;后處理多工況結(jié)果查看,海量數(shù)據(jù)無(wú)從篩選,高風(fēng)險(xiǎn)點(diǎn)
    的頭像 發(fā)表于 04-21 17:35 ?267次閱讀
    【分享】CAE前后處理<b class='flag-5'>數(shù)據(jù)</b>太多?試試Simcenter HyperMesh這3<b class='flag-5'>個(gè)</b>快速<b class='flag-5'>數(shù)據(jù)處理工具</b>

    [VirtualLab] 使用Python進(jìn)行跨平臺(tái)參數(shù)掃描

    摘要 VirtualLab Fusion允許外部訪問(wèn)其建模技術(shù)、求解器和結(jié)果。這有助于應(yīng)用其他數(shù)據(jù)處理或優(yōu)化工具來(lái)進(jìn)一步研究光學(xué)模擬。在本示例中,我們演示如何使用Python腳本運(yùn)行參數(shù)掃描,以及
    發(fā)表于 03-31 09:36

    1688 商品詳情 API 調(diào)用與數(shù)據(jù)解析 Python 實(shí)戰(zhàn)

    你想要的是 1688 商品詳情 API 的 Python 調(diào)用與數(shù)據(jù)解析實(shí)戰(zhàn)方案,核心是完成 API 憑證配置、接口請(qǐng)求(含簽名)、響應(yīng)數(shù)據(jù)解析、異常處理 的全流程落地,我會(huì)提供可直接運(yùn)行的代碼,并
    的頭像 發(fā)表于 02-10 11:23 ?408次閱讀

    Linux進(jìn)程管理不用愁!這6個(gè)工具幫你搞定90%場(chǎng)景

    在 Linux 系統(tǒng)中,進(jìn)程是資源分配的基本單位,無(wú)論是服務(wù)器運(yùn)維、程序調(diào)試還是日常使用,掌握進(jìn)程管理工具都是必備技能。今天就帶大家梳理 6 個(gè)常用的進(jìn)程管理工具,從查看進(jìn)程到控制進(jìn)
    的頭像 發(fā)表于 02-04 16:23 ?3061次閱讀
    Linux進(jìn)程管理不用愁!這6<b class='flag-5'>個(gè)</b><b class='flag-5'>工具</b>幫你搞定90%場(chǎng)景

    Linux Shell文本處理神器合集:15個(gè)工具+實(shí)戰(zhàn)例子,效率直接翻倍

    在 Linux 系統(tǒng)中,文本是數(shù)據(jù)交互的 “通用語(yǔ)言”—— 日志文件、配置文件、數(shù)據(jù)報(bào)表、程序輸出幾乎都以文本形式存在。手動(dòng)編輯文本不僅繁瑣,還容易出錯(cuò),而掌握 Shell 文本處理工具,能讓你用幾行命令完成批量
    的頭像 發(fā)表于 02-03 15:42 ?2932次閱讀
    Linux Shell文本處理神器合集:<b class='flag-5'>15</b><b class='flag-5'>個(gè)</b><b class='flag-5'>工具</b>+實(shí)戰(zhàn)例子,效率直接翻倍

    如何使用Python讀取不間斷數(shù)據(jù),并將其傳輸?shù)絃abVIEW進(jìn)行處理?

    使用Python讀取Count,如何將讀取到的數(shù)據(jù)傳輸至Labview;傳輸過(guò)程中Python要保持讀取的動(dòng)作,不能停止。
    發(fā)表于 01-23 11:09

    合同審查、簡(jiǎn)歷篩選、審核中小企業(yè)AI審核工具怎么選?

    寫在前面 去年幫朋友公司選AI審核工具,踩了不少坑。今天把經(jīng)驗(yàn)總結(jié)一下,給需要做合同審查、簡(jiǎn)歷篩選、內(nèi)容審核的中小企業(yè)做個(gè)參考。 先說(shuō)結(jié)論: 需要多種審核工具、預(yù)算有限、擔(dān)心數(shù)據(jù)安全的
    的頭像 發(fā)表于 12-18 13:43 ?537次閱讀

    應(yīng)用生命周期管理Perforce ALM 產(chǎn)品更新詳解:標(biāo)簽和篩選功能

    Perforce ALM更新標(biāo)簽與篩選功能!支持自定義標(biāo)簽、收藏常用項(xiàng)、高級(jí)條件組合,網(wǎng)頁(yè)端和桌面端體驗(yàn)全面升級(jí),讓復(fù)雜的需求管理更高效、追溯更清晰。
    的頭像 發(fā)表于 11-25 11:08 ?707次閱讀
    應(yīng)用生命周期管理Perforce ALM 產(chǎn)品更新詳解:標(biāo)簽和<b class='flag-5'>篩選</b>功能

    Python 給 Amazon 做“全身 CT”——可量產(chǎn)、可擴(kuò)展的商品詳情爬蟲實(shí)戰(zhàn)

    一、技術(shù)選型:為什么選 Python 而不是 Java? 結(jié)論: “調(diào)研階段用 Python,上線后如果 QPS 爆表再考慮 Java 重構(gòu)。” 二、整體架構(gòu)速覽(3 分鐘看懂) 三、開發(fā)前準(zhǔn)備(5
    的頭像 發(fā)表于 10-21 16:59 ?639次閱讀
    用 <b class='flag-5'>Python</b> 給 Amazon 做“全身 CT”——可量產(chǎn)、可擴(kuò)展的商品詳情爬蟲實(shí)戰(zhàn)

    有哪些工具可以用于復(fù)核裝置數(shù)據(jù)?

    復(fù)核裝置數(shù)據(jù)需根據(jù)裝置類型(電氣、機(jī)械、工業(yè)自動(dòng)化等)和數(shù)據(jù)特性(實(shí)時(shí)性、精度要求)選擇工具,以下是覆蓋全場(chǎng)景的專業(yè)工具及應(yīng)用方法: 一、電氣參數(shù)復(fù)核
    的頭像 發(fā)表于 09-25 14:03 ?704次閱讀
    有哪些<b class='flag-5'>工具</b>可以用于復(fù)核裝置<b class='flag-5'>數(shù)據(jù)</b>?

    termux調(diào)試python猜數(shù)字游戲

    用termux做一個(gè)猜數(shù)字游戲 下面是在Termux中創(chuàng)建猜數(shù)字游戲的步驟及完整實(shí)現(xiàn)方案,結(jié)合Python實(shí)現(xiàn)(最適配Termux環(huán)境): ? 一、環(huán)境準(zhǔn)備(Termux基礎(chǔ)配置) 1.
    發(fā)表于 08-29 17:15

    termux如何搭建python游戲

    安裝Python及包管理工具 ```bash apt install -y python python-pip# 自動(dòng)安裝Python3
    發(fā)表于 08-29 07:06

    基礎(chǔ)篇3:掌握Python中的條件語(yǔ)句與循環(huán)

    Python編程語(yǔ)言中,條件語(yǔ)句和循環(huán)是構(gòu)成復(fù)雜邏輯和數(shù)據(jù)處理的基石。本篇基礎(chǔ)教程將幫助您深入了解Python中的條件語(yǔ)句和循環(huán)結(jié)構(gòu),讓您能夠更好地控制程序流程。 條件語(yǔ)句 條件語(yǔ)句允許程序根據(jù)
    發(fā)表于 07-03 16:13
    汾阳市| 永仁县| 札达县| 界首市| 瑞金市| 比如县| 仙居县| 天峨县| 永登县| 黄大仙区| 沿河| 宁安市| 灵寿县| 三穗县| 灵山县| 盘锦市| 荔浦县| 绥滨县| 边坝县| 云龙县| 衡南县| 沛县| 荣成市| 安陆市| 定州市| 湄潭县| 桐城市| 夏邑县| 德清县| 新丰县| 江永县| 准格尔旗| 香格里拉县| 南溪县| 仁怀市| 鄯善县| 咸丰县| 巨野县| 靖江市| 哈巴河县| 平原县|