日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

八種不同類型的抽樣技術(shù)介紹

汽車玩家 ? 來源:人工智能遇見磐創(chuàng) ? 作者:人工智能遇見磐創(chuàng) ? 2020-05-04 08:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

介紹

你肯定很熟悉以下情況:你下載了一個(gè)比較大的數(shù)據(jù)集,并開始分析并建立你的機(jī)器學(xué)習(xí)模型。當(dāng)加載數(shù)據(jù)集時(shí),你的計(jì)算機(jī)會(huì)爆出"內(nèi)存不足"錯(cuò)誤。

即使是最優(yōu)秀的人也會(huì)遇到這種事。這是我們?cè)跀?shù)據(jù)科學(xué)中面臨的最大障礙之一,在受計(jì)算限制的計(jì)算機(jī)上處理大量數(shù)據(jù)(并非所有人都擁有Google的資源實(shí)力!)。

那么我們?nèi)绾慰朔@個(gè)問題呢?是否有一種方法可以選擇數(shù)據(jù)的子集并進(jìn)行分析,并且該子集可以很好地表示整個(gè)數(shù)據(jù)集?

這種方法稱為抽樣。我相信你在學(xué)校期間,甚至在你的職業(yè)生涯中,都會(huì)遇到這個(gè)名詞很多次。抽樣是合成數(shù)據(jù)子集并進(jìn)行分析的好方法。但是,那我們只是隨機(jī)取一個(gè)子集呢?

我們將在本文中進(jìn)行討論。我們將討論八種不同類型的抽樣技術(shù),以及每種方法的使用場(chǎng)景。這是一篇適合初學(xué)者的文章,會(huì)介紹一些統(tǒng)計(jì)的知識(shí)

目錄

什么是抽樣?

為什么我們需要抽樣?

抽樣步驟

不同類型的抽樣技術(shù)

概率抽樣的類型

非概率抽樣的類型

什么是抽樣?

讓我們從正式定義什么是抽樣開始。

抽樣是一種方法,它使我們能夠基于子集(樣本)的統(tǒng)計(jì)信息來獲取總體信息,而無需調(diào)查所有樣本。

上圖完美地說明了什么是抽樣。讓我們通過一個(gè)例子更直觀的進(jìn)行理解。

我們想要找到Delhi這個(gè)城市所有成年男性的平均身高。Delhi的人口大約為3千萬,男性大約為1500萬(這些都是假想數(shù)據(jù),不要當(dāng)成實(shí)際情況了)。你可以想象,要找到Delhi所有男性的身高來計(jì)算平均身高幾乎是不可能的。

我們不可能接觸到所有男性,因此我們無法真正分析整個(gè)人口。那么,什么可以我們做的呢?我們可以提取多個(gè)樣本,并計(jì)算所選樣本中個(gè)體的平均身高。

但是,接下來我們又提出了一個(gè)問題,我們?nèi)绾稳?我們應(yīng)該隨機(jī)抽樣嗎?還是我們必須問專家?

假設(shè)我們?nèi)セ@球場(chǎng),以所有職業(yè)籃球運(yùn)動(dòng)員的平均身高作為樣本。這將不是一個(gè)很好的樣本,因?yàn)橐话銇碚f,籃球運(yùn)動(dòng)員的身高比普通男性高,這將使我們對(duì)普通男性的身高沒有正確的估計(jì)。

這里有一個(gè)解決方案,我們?cè)陔S機(jī)的情況下隨機(jī)找一些人,這樣我們的樣本就不會(huì)因?yàn)樯砀叩牟煌a(chǎn)生偏差。

為什么我們需要抽樣?

我確定你在這一點(diǎn)上已經(jīng)有了直覺的答案。

抽樣是為了從樣本中得出關(guān)于群體的結(jié)論,它使我們能夠通過直接觀察群體的一部分(樣本)來確定群體的特征。

選擇一個(gè)樣本比選擇一個(gè)總體中的所有個(gè)體所需的時(shí)間更少

樣本選擇是一種經(jīng)濟(jì)有效的方法

對(duì)樣本的分析比對(duì)整個(gè)群體的分析更方便、更實(shí)用

抽樣步驟

將概念形象化是在記憶的好方法。因此,這是一個(gè)以流程圖形式逐步進(jìn)行抽樣的流程圖!

讓我們以一個(gè)有趣的案例研究為例,將這些步驟應(yīng)用于執(zhí)行抽樣。幾個(gè)月前,我們?cè)谟《扰e行了大選。你一定看過當(dāng)時(shí)每個(gè)新聞?lì)l道的民意調(diào)查:

這些結(jié)果是根據(jù)全國9億選民的意見得出的還是根據(jù)這些選民的一小部分得出的?讓我們看看是怎么做的。

第一步

抽樣過程的第一步是明確定義目標(biāo)群體。

因此,為了進(jìn)行民意調(diào)查,投票機(jī)構(gòu)僅考慮18歲以上且有資格在人口中投票的人。

第二步

抽樣框架(Sampling Frame)–這是構(gòu)成樣本總體的個(gè)體列表。

因此,這個(gè)例子的抽樣框架將是是名字出現(xiàn)在一個(gè)選區(qū)的所有投票人列表。

第三步

一般來說,使用概率抽樣方法是因?yàn)槊恳粡堖x票都有相等的價(jià)值。不考慮種姓、社區(qū)或宗教,任何人都可以被包括在樣本中。不同的樣品取自全國各地不同的地區(qū)。

第四步

樣本量(Sample Size)-是指樣本中所包含的個(gè)體的數(shù)量,這些個(gè)體的數(shù)量需要足量以對(duì)期望的準(zhǔn)確度和精度進(jìn)行推斷。

樣本量越大,我們對(duì)總體的推斷就越準(zhǔn)確。

在民意調(diào)查中,各機(jī)構(gòu)試圖讓盡可能多的不同背景的人參與抽樣調(diào)查,因?yàn)檫@有助于預(yù)測(cè)一個(gè)政黨可能贏得的席位數(shù)量。

第五步

一旦確定了目標(biāo)人群,抽樣框架,抽樣技術(shù)和樣本數(shù)量,下一步就是從樣本中收集數(shù)據(jù)。

在民意測(cè)驗(yàn)中,機(jī)構(gòu)通常會(huì)向人民提出問題,例如他們要投票給哪個(gè)政黨或前政黨做了什么工作,等等。

根據(jù)答案,各機(jī)構(gòu)試圖解釋選民投票給誰,以及一個(gè)政黨要贏得多少席位。

不同類型的抽樣技術(shù)

這里是另一個(gè)圖解!這一個(gè)是關(guān)于我們可以使用的不同類型的采樣技術(shù):

概率抽樣: 在概率抽樣中,總體中的每個(gè)個(gè)體都有相等的被選中的機(jī)會(huì)。概率抽樣給了我們最好的機(jī)會(huì)去創(chuàng)造一個(gè)真正代表總體的樣本

非概率抽樣:在非概率抽樣中,所有元素被選中的機(jī)會(huì)都不相等。因此,有一個(gè)顯著的風(fēng)險(xiǎn),即最終得到一個(gè)不具代表性的樣本,它不會(huì)產(chǎn)生可推廣的結(jié)果

例如,假設(shè)我們的人口由20個(gè)人組成。每個(gè)個(gè)體的編號(hào)從1到20,并由特定的顏色(紅色、藍(lán)色、綠色或黃色)表示。在概率抽樣中,每個(gè)人被選中的概率是1/20。

對(duì)于非概率抽樣,這些概率是不相等的。一個(gè)人被選中的機(jī)會(huì)可能比別人大?,F(xiàn)在我們對(duì)這兩種抽樣類型有了一定的了解,讓我們分別深入了解每種抽樣類型,并理解每種抽樣的不同類型。

概率抽樣的類型

簡(jiǎn)單隨機(jī)抽樣

這是你一定要遇到的一種抽樣技術(shù)。在這里,每個(gè)人都是完全由隨機(jī)選擇的,人口中的每個(gè)成員都有被選擇的機(jī)會(huì)。

簡(jiǎn)單的隨機(jī)抽樣可減少選擇偏差。

這種技術(shù)的一大優(yōu)點(diǎn)是它是最直接的概率抽樣方法。但它有一個(gè)缺點(diǎn),它可能不會(huì)選擇特別多我們真正感興趣的個(gè)體元素。蒙特卡羅方法采用重復(fù)隨機(jī)抽樣的方法對(duì)未知參數(shù)進(jìn)行估計(jì)。

系統(tǒng)抽樣

在這種類型的抽樣中,第一個(gè)個(gè)體是隨機(jī)選擇的,其他個(gè)體是使用固定的“抽樣間隔”選擇的。讓我們舉一個(gè)簡(jiǎn)單的例子來理解這一點(diǎn)。

假設(shè)我們的總體大小是x,我們必須選擇一個(gè)樣本大小為n的樣本,然后,我們要選擇的下一個(gè)個(gè)體將是距離第一個(gè)個(gè)體的x/n個(gè)間隔。我們可以用同樣的方法選擇其余的。

假設(shè),我們從第3個(gè)人開始,樣本容量是5。因此,我們要選擇的下一個(gè)個(gè)體將是(20/5)= 4,從第3個(gè)人開始,即7(3+4),依此類推。

3、3+4=7、7+4=11、11+4=15、15+4=19 . 3、7、11、15、19

系統(tǒng)抽樣比簡(jiǎn)單隨機(jī)抽樣更方便。然而,如果我們?cè)谌巳褐羞x擇項(xiàng)目時(shí)存在一種潛在的模式,這也可能導(dǎo)致偏差(盡管這種情況發(fā)生的幾率非常低)。

分層抽樣

在這種類型的抽樣中,我們根據(jù)不同的特征,如性別、類別等,把人口分成子組(稱為層)。然后我們從這些子組中選擇樣本:

在這里,我們首先根據(jù)紅、黃、綠、藍(lán)等不同的顏色將我們的種群分成不同的子組。然后,從每一種顏色中,我們根據(jù)它們?cè)谌丝谥械谋壤x擇一個(gè)個(gè)體。

當(dāng)我們想要從總體的所有子組中得到表示時(shí),我們使用這種類型的抽樣。然而,分層抽樣需要適當(dāng)?shù)娜丝谔卣鞯闹R(shí)。

整群抽樣

在整群抽樣中,我們使用總體的子組作為抽樣單位,而不是個(gè)體。全體樣本被分為子組,稱為群,并隨機(jī)選擇一個(gè)完整的群作為抽樣樣本。

在上面的例子中,我們將人口分為5個(gè)群。每個(gè)群由4個(gè)個(gè)體組成,我們?cè)跇颖局羞x取了第4個(gè)群。我們可以根據(jù)樣本大小包含更多的群。

當(dāng)我們集中在一個(gè)特定領(lǐng)域或區(qū)域時(shí),就會(huì)使用這種類型的抽樣。

非概率抽樣的類型

便利抽樣

這可能是最簡(jiǎn)單的抽樣方法,因?yàn)閭€(gè)人的選擇是基于他們的可用性和參與意愿。

這里,假設(shè)編號(hào)為4、7、12、15和20的個(gè)體想要成為樣本的一部分,因此,我們將把它們包含在樣本中。

便利抽樣容易產(chǎn)生顯著的偏見,因?yàn)槌闃涌赡懿荒艽碇T如宗教或人口的性別等具體特征。

配額抽樣

在這種抽樣中,我們根據(jù)預(yù)先確定的總體特征來選擇樣本??紤]到我們必須為我們的樣本我們選擇一個(gè)倍數(shù)為4的個(gè)體:

因此,編號(hào)為4、8、12、16和20的個(gè)人已經(jīng)為我們的樣本保留。

在配額抽樣中,選擇的樣本可能不是未考慮的人口特征的最佳代表。

判斷抽樣

這也稱為選擇性抽樣。在選擇要求參加者時(shí),取決于專家判斷。

假設(shè),我們的專家認(rèn)為,應(yīng)該將編號(hào)為1、7、10、15和19的人作為我們的樣本,因?yàn)樗鼈兛梢詭椭覀兏玫赝茢嗳丝凇D憧梢韵胂?,配額抽樣同樣也容易受到專家的偏見,不一定具有代表性。

雪球抽樣

我很喜歡這種抽樣方法?,F(xiàn)有的人被要求推薦更多他們認(rèn)識(shí)的人,這樣樣本的大小就會(huì)像滾雪球一樣增加。當(dāng)抽樣框架難以識(shí)別時(shí),這種采樣方法是有效的。

在這里,我們隨機(jī)選擇了1個(gè)人作為樣本,然后他推薦了6個(gè)人,6個(gè)人推薦了11個(gè)人,依此類推。

1-> 6-> 11-> 14-> 19

雪球抽樣有很大的選擇偏見風(fēng)險(xiǎn),因?yàn)楸灰玫膫€(gè)體將與推薦他們的個(gè)體具有共同的特征。

結(jié)尾

在本文中,我們了解了抽樣的概念,抽樣所涉及的步驟以及不同類型的抽樣方法。抽樣在統(tǒng)計(jì)世界和現(xiàn)實(shí)世界中都有廣泛的應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1817

    瀏覽量

    60661
  • 抽樣
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    7354
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    光伏系統(tǒng)接地故障的主要類型與測(cè)試方法

    光伏系統(tǒng)的接地故障具有多種不同類型,需要采用不同的測(cè)試技術(shù)來識(shí)別和定位。要第一時(shí)間確定哪種測(cè)試方法能提供最快且最準(zhǔn)確的結(jié)果,往往頗具挑戰(zhàn)性。無論系統(tǒng)類型或規(guī)模如何,接地故障都是光伏系統(tǒng)中最常見的問題之一。
    的頭像 發(fā)表于 03-19 09:10 ?781次閱讀
    光伏系統(tǒng)接地故障的主要<b class='flag-5'>類型</b>與測(cè)試方法

    大常見芯片封裝類型及應(yīng)用!

    個(gè)常見芯片封裝類型在芯片封裝就像半導(dǎo)體的“保護(hù)殼”,不僅能保護(hù)芯片核心,還直接決定芯片適配哪些產(chǎn)品、發(fā)揮多少性能。不管是日常用的手機(jī)、電腦,還是工業(yè)設(shè)備里的芯片,都離不開合適的封裝。今天就用通俗
    的頭像 發(fā)表于 02-02 15:01 ?1596次閱讀
    <b class='flag-5'>八</b>大常見芯片封裝<b class='flag-5'>類型</b>及應(yīng)用!

    MUN12AD03-SH:完美替代TI與艾諾(Aino)同類型芯片

    MUN12AD03-SH:完美替代TI與艾諾(Aino)同類型芯片在當(dāng)前芯片國產(chǎn)化替代加速的背景下,MUN12AD03-SH作為一款高性能DC/DC電源模塊,憑借其高效率、智能控制等優(yōu)勢(shì),可替代多款
    發(fā)表于 01-16 10:11

    同類型的電能質(zhì)量在線監(jiān)測(cè)裝置在多維度統(tǒng)計(jì)報(bào)表功能上有哪些差異?

    同類型的電能質(zhì)量在線監(jiān)測(cè)裝置(基礎(chǔ)型 / 增強(qiáng)型 / 電網(wǎng)級(jí))在多維度統(tǒng)計(jì)報(bào)表功能上的差異,核心圍繞 “統(tǒng)計(jì)維度豐富度、報(bào)表類型覆蓋、定制化能力、輸出集成、合規(guī)適配” 展開,本質(zhì)是匹配不同應(yīng)用場(chǎng)
    的頭像 發(fā)表于 12-12 13:59 ?609次閱讀

    同類型功放芯片對(duì)音箱音質(zhì)的核心影響

    功放芯片的核心作用是 “將弱電信號(hào)放大為足以驅(qū)動(dòng)喇叭的強(qiáng)電信號(hào)”,其電路結(jié)構(gòu)、放大原理、元件選擇的差異,會(huì)直接影響音質(zhì)的 “失真度、動(dòng)態(tài)范圍、頻響完整性、音色風(fēng)格”。不同類型的功放板,對(duì)音箱(尤其是
    的頭像 發(fā)表于 11-18 11:39 ?2829次閱讀

    堆棧指針SP介紹

    SP 堆棧指針:8位寄存器,用來指示堆棧的位置,可由軟件修改。 堆棧的介紹堆棧是一按“先進(jìn)后出”規(guī)律操作的存儲(chǔ)結(jié)構(gòu)。不同類型的處理器其堆棧的設(shè)計(jì)各不相同: SP寄存器作為堆棧指針。這種結(jié)構(gòu)的特點(diǎn)是
    發(fā)表于 11-17 06:07

    多個(gè)Vector同類型VN設(shè)備固定硬件通道分配問題

    同類型VN設(shè)備(如多個(gè)1640A)同時(shí)使用時(shí),出現(xiàn)再次運(yùn)行工程時(shí),硬件通道和邏輯通道不匹配的情況。需要手動(dòng)再次匹配,影響使用體驗(yàn)和效率,此時(shí)需要重新“channel mapping”,當(dāng)涉及到一個(gè)測(cè)試臺(tái)架有多個(gè)VN設(shè)備時(shí),極其影響使用體驗(yàn),增加工作量。
    的頭像 發(fā)表于 11-02 17:08 ?1401次閱讀
    多個(gè)Vector<b class='flag-5'>同類型</b>VN設(shè)備固定硬件通道分配問題

    同類型的電能質(zhì)量在線監(jiān)測(cè)裝置數(shù)據(jù)存儲(chǔ)方式有哪些優(yōu)缺點(diǎn)?

    同類型的電能質(zhì)量在線監(jiān)測(cè)裝置數(shù)據(jù)存儲(chǔ)方式,核心差異體現(xiàn)在 數(shù)據(jù)控制權(quán)、實(shí)時(shí)性、運(yùn)維成本、擴(kuò)展性 上,主要分為 本地存儲(chǔ)、云端存儲(chǔ)、混合存儲(chǔ) 三類。每類方式的優(yōu)缺點(diǎn)需結(jié)合電能質(zhì)量數(shù)據(jù)特征(時(shí)序性
    的頭像 發(fā)表于 10-30 10:00 ?462次閱讀

    HDMI接口類型介紹

    我們都知道USB接口有很多類型,然而熟悉的HDMI接口,它也有很多不一樣的接口,本文將圍繞HDMI的不同接口類型進(jìn)行解析。
    的頭像 發(fā)表于 10-28 16:11 ?7001次閱讀
    五<b class='flag-5'>種</b>HDMI接口<b class='flag-5'>類型</b><b class='flag-5'>介紹</b>

    同類型的暫態(tài)事件(如電壓暫降、電壓暫升、諧波等)在捕捉方法上有何異同?

    要分析不同類型暫態(tài)事件(需先明確:電壓暫降、電壓暫升、脈沖暫態(tài)屬于 “短時(shí)突發(fā)暫態(tài)”,而諧波(穩(wěn)態(tài))不屬于暫態(tài)事件,僅 “暫態(tài)諧波”(如負(fù)載突變時(shí)的短時(shí)諧波)屬于暫態(tài)范疇)的捕捉方法異同,需先立足
    的頭像 發(fā)表于 09-26 09:57 ?897次閱讀
    不<b class='flag-5'>同類型</b>的暫態(tài)事件(如電壓暫降、電壓暫升、諧波等)在捕捉方法上有何異同?

    同類型的自動(dòng)化工具在評(píng)估數(shù)據(jù)緩存效果時(shí)有哪些優(yōu)缺點(diǎn)?

    在評(píng)估數(shù)據(jù)緩存效果時(shí),不同類型的自動(dòng)化工具(實(shí)時(shí)監(jiān)控類、性能測(cè)試類、深度分析類、云原生專屬類)因設(shè)計(jì)目標(biāo)和技術(shù)特性不同,存在顯著的優(yōu)缺點(diǎn)差異。以下結(jié)合工具類型與具體場(chǎng)景,系統(tǒng)對(duì)比其核心優(yōu)劣勢(shì),并給出
    的頭像 發(fā)表于 09-25 17:48 ?887次閱讀
    不<b class='flag-5'>同類型</b>的自動(dòng)化工具在評(píng)估數(shù)據(jù)緩存效果時(shí)有哪些優(yōu)缺點(diǎn)?

    同類型浪涌保護(hù)器(SPD):接線制式與選型指南

    浪涌保護(hù)器(SPD,Surge Protective Device)是電氣系統(tǒng)防雷與過電壓防護(hù)的重要設(shè)備,能夠有效抑制由雷電感應(yīng)、電網(wǎng)操作、電磁脈沖等引起的瞬態(tài)過電壓,保護(hù)電氣設(shè)備安全運(yùn)行。不同類型
    的頭像 發(fā)表于 09-22 14:49 ?1716次閱讀
    不<b class='flag-5'>同類型</b>浪涌保護(hù)器(SPD):接線制式與選型指南

    同類型的電能質(zhì)量在線監(jiān)測(cè)裝置數(shù)據(jù)驗(yàn)證頻率有何差異

    ? 電能質(zhì)量在線監(jiān)測(cè)裝置的類型劃分,通?;?應(yīng)用場(chǎng)景(電網(wǎng)側(cè) / 用戶側(cè))、監(jiān)測(cè)功能(通用型 / 專項(xiàng)型)、電壓等級(jí)(高壓 / 中低壓) 三大維度。不同類型裝置的核心差異在于 “數(shù)據(jù)用途的關(guān)鍵程度
    的頭像 發(fā)表于 09-04 11:55 ?693次閱讀

    工業(yè)相機(jī)的類型及不同類型的應(yīng)用

    工業(yè)相機(jī)根據(jù)不同的分類標(biāo)準(zhǔn),可分為多種類型,每種類型都有其獨(dú)特的應(yīng)用場(chǎng)景。
    的頭像 發(fā)表于 08-29 17:07 ?973次閱讀
    工業(yè)相機(jī)的<b class='flag-5'>類型</b>及不<b class='flag-5'>同類型</b>的應(yīng)用

    簡(jiǎn)述不同類型接地電阻柜及其特點(diǎn)

    接地電阻柜在電力系統(tǒng)中用于限制接地故障電流、抑制過電壓并保障設(shè)備安全,不同類型的接地電阻柜根據(jù)應(yīng)用場(chǎng)景和設(shè)計(jì)需求具有以下特點(diǎn): 1. 中性點(diǎn)接地電阻柜 應(yīng)用場(chǎng)景: 主要用于變壓器、發(fā)電機(jī)或配電系統(tǒng)
    的頭像 發(fā)表于 05-23 16:28 ?962次閱讀
    乐平市| 莲花县| 张掖市| 夹江县| 巍山| 潮安县| 双牌县| 贵德县| 稷山县| 抚宁县| 定远县| 鄂尔多斯市| 西盟| 万宁市| 云南省| 汶川县| 九寨沟县| 文昌市| 通海县| 驻马店市| 台南县| 射阳县| 南开区| 黄龙县| 四会市| 临洮县| 孙吴县| 综艺| 龙川县| 佛教| 布尔津县| 黄冈市| 厦门市| 和田市| 芜湖县| 东乡县| 石泉县| 安化县| 鹿泉市| 皋兰县| 巩义市|