日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

闡述正態(tài)分布的概率,并解釋它的應用為何如此的廣泛

WpOh_rgznai100 ? 來源:lq ? 2019-07-13 08:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為什么正態(tài)分布如此特殊?為什么大量數(shù)據(jù)科學和機器學習的文章都圍繞正態(tài)分布進行討論?我決定寫一篇文章,用一種簡單易懂的方式來介紹正態(tài)分布。

在機器學習的世界中,以概率分布為核心的研究大都聚焦于正態(tài)分布。本文將闡述正態(tài)分布的概率,并解釋它的應用為何如此的廣泛,尤其是在數(shù)據(jù)科學和機器學習領(lǐng)域,它幾乎無處不在。

我將會從基礎(chǔ)概念出發(fā),解釋有關(guān)正態(tài)分布的一切,并揭示它為何如此重要。

文章結(jié)構(gòu)

本文的主要內(nèi)容如下:

概率分布是什么

正態(tài)分布意味著什么

正態(tài)分布的變量有哪些

如何使用 Python 來檢驗數(shù)據(jù)的分布

如何使用 Python 參數(shù)化生產(chǎn)一個正態(tài)分布

正態(tài)分布的問題

簡短的背景介紹

首先,正態(tài)分布又名高斯分布

它以數(shù)學天才 Carl Friedrich Gauss 命名

正態(tài)分布又名高斯分布

越簡單的模型越是常用,因為它們能夠被很好的解釋和理解。正態(tài)分布非常簡單,這就是它是如此的常用的原因。

因此,理解正態(tài)分布非常有必要。

什么是概率分布?

首先介紹一下相關(guān)概念。

考慮一個預測模型,該模型可以是我們的數(shù)據(jù)科學研究中的一個組件。

如果我們想精確預測一個變量的值,那么我們首先要做的就是理解該變量的潛在特性。

首先我們要知道該變量的可能取值,還要知道這些值是連續(xù)的還是離散的。簡單來講,如果我們要預測一個骰子的取值,那么第一步就是明白它的取值是1 到 6(離散)。

第二步就是確定每個可能取值(事件)發(fā)生的概率。如果某個取值永遠都不會出現(xiàn),那么該值的概率就是 0 。

事件的概率越大,該事件越容易出現(xiàn)。

在實際操作中,我們可以大量重復進行某個實驗,并記錄該實驗對應的輸出變量的結(jié)果。

我們可以將這些取值分為不同的集合類,在每一類中,我們記錄屬于該類結(jié)果的次數(shù)。例如,我們可以投10000次骰子,每次都有6種可能的取值,我們可以將類別數(shù)設(shè)為6,然后我們就可以開始對每一類出現(xiàn)的次數(shù)進行計數(shù)了。

我們可以畫出上述結(jié)果的曲線,該曲線就是概率分布曲線。目標變量每個取值的可能性就由其概率分布決定。

一旦我們知道了變量的概率分布,我們就可以開始估計事件出現(xiàn)的概率了,我們甚至可以使用一些概率公式。至此,我們就可更好的理解變量的特性了。概率分布取決于樣本的一些特征,例如平均值,標準偏差,偏度和峰度。

如果將所有概率值求和,那么求和結(jié)果將會是100%

世界上存在著很多不同的概率分布,而最廣泛使用的就是正態(tài)分布了。

初遇正態(tài)分布

我們可以畫出正態(tài)分布的概率分布曲線,可以看到該曲線是一個鐘型的曲線。如果變量的均值,模和中值相等,那么該變量就呈現(xiàn)正態(tài)分布。

如下圖所示,為正態(tài)分布的概率分布曲線:

理解和估計變量的概率分布非常重要。

下面列出的變量的分布都比較接近正態(tài)分布:

人群的身高

成年人的血壓

傳播中的粒子的位置

測量誤差

回歸中的殘差

人群的鞋碼

一天中雇員回家的總耗時

教育指標

此外,生活中有大量的變量都是具有 x % 置信度的正態(tài)變量,其中,x<100。

什么是正態(tài)分布?

正態(tài)分布只依賴于數(shù)據(jù)集的兩個特征:樣本的均值和方差。

均值——樣本所有取值的平均

方差——該指標衡量了樣本總體偏離均值的程度

正態(tài)分布的這種統(tǒng)計特性使得問題變得異常簡單,任何具有正態(tài)分布的變量,都可以進行高精度分預測。

值得注意的是,大自然中發(fā)現(xiàn)的變量,大多近似服從正態(tài)分布。

正態(tài)分布很容易解釋,這是因為:

正態(tài)分布的均值,模和中位數(shù)是相等的。

我們只需要用均值和標準差就能解釋整個分布。

正態(tài)分布是我們熟悉的正常行為

為何如此多的變量都大致服從正態(tài)分布?

這個現(xiàn)象可以由如下定理理解釋:當在大量隨機變量上重復很多次實驗時,它們的分布總和將非常接近正態(tài)分布。

由于人的身高是一個隨機變量,并且基于其他隨機變量,例如一個人消耗的營養(yǎng)量,他們所處的環(huán)境,他們的遺傳等等,這些變量的分布總和最終是非常接近正態(tài)的。

這就是中心極限定理。

本文的核心:

我們從上文的分析得出,正態(tài)分布是許多隨機分布的總和。 如果我們繪制正態(tài)分布密度函數(shù),那么它的曲線將具有以下特征:

如上圖所示,該鐘形曲線有均值為 100,標準差為1:

均值是曲線的中心。 這是曲線的最高點,因為大多數(shù)點都是均值。

曲線兩側(cè)的點數(shù)相等。 曲線的中心具有最多的點數(shù)。

曲線下的總面積是變量所有取值的總概率。

因此總曲線面積為 100%

更進一步,如上圖所示:

約 68.2% 的點在 -1 到 1 個標準偏差范圍內(nèi)。

約 95.5% 的點在 -2 到 2 個標準偏差范圍內(nèi)。

約 99.7% 的點在 -3 至 3 個標準偏差范圍內(nèi)。

這使我們可以輕松估計變量的變化性,并給出相應置信水平,它的可能取值是多少。例如,在上面的灰色鐘形曲線中,變量值在 99-101 之間的可能性為 68.2%。

正態(tài)概率分布函數(shù)

正態(tài)概率分布函數(shù)的形式如下:

概率密度函數(shù)基本上可以看作是連續(xù)隨機變量取值的概率。

正態(tài)分布是鐘形曲線,其中mean = mode = median。

如果使用概率密度函數(shù)繪制變量的概率分布曲線,則給定范圍的曲線下的面積,表示目標變量在該范圍內(nèi)取值的概率。

概率分布曲線基于概率分布函數(shù),而概率分布函數(shù)本身是根據(jù)諸如平均值或標準差等多個參數(shù)計算的。

我們可以使用概率分布函數(shù)來查找隨機變量取值范圍內(nèi)的值的相對概率。 例如,我們可以記錄股票的每日收益,將它們分組到適當?shù)募项愔?,然后計算股票在未來獲得20-40%收益的概率。

標準差越大,樣品中的變化性越大。

如何使用 Python 探索變量的概率分布

最簡單的方法是加載 data frame 中的所有特征,然后運行以下腳本(使用pandas 庫):

DataFrame.hist(bins=10)#Make a histogram of the DataFrame.

該函數(shù)向我們展示了所有變量的概率分布。

變量服從正態(tài)分布意味著什么?

如果我們將大量具有不同分布的隨機變量加起來,所得到的新變量將最終具有正態(tài)分布。這就是前文所述的中心極限定理。

服從正態(tài)分布的變量總是服從正態(tài)分布。 例如,假設(shè) A 和 B 是兩個具有正態(tài)分布的變量,那么:

?A x B 是正態(tài)分布

?A + B 是正態(tài)分布

因此,使用正態(tài)分布,預測變量并在一定范圍內(nèi)找到它的概率會變得非常簡單。

樣本不服從正態(tài)分布怎么辦?

我們可以將變量的分布轉(zhuǎn)換為正態(tài)分布。

我們有多種方法將非正態(tài)分布轉(zhuǎn)化為正態(tài)分布:

1.線性變換

一旦我們收集到變量的樣本數(shù)據(jù),我們就可以對樣本進行線性變化,并計算Z得分:

計算平均值

計算標準偏差

對于每個 x,使用以下方法計算 Z:

2.使用 Boxcox 變換

我們可以使用 SciPy 包將數(shù)據(jù)轉(zhuǎn)換為正態(tài)分布:

scipy.stats.boxcox(x,lmbda=None,alpha=None)

3.使用 Yeo-Johnson 變換

另外,我們可以使用 yeo-johnson 變換。 Python 的 sci-kit learn 庫提供了相應的功能:

sklearn.preprocessing.PowerTransformer(method=’yeojohnson’,standardize=True,copy=True)

正態(tài)分布的問題

由于正態(tài)分布簡單且易于理解,因此它也在預測研究中被過度使用。 假設(shè)變量服從正態(tài)分布會有一些顯而易見的缺陷。 例如,我們不能假設(shè)股票價格服從正態(tài)分布,因為價格不能為負。 因此,我們可以假設(shè)股票價格服從對數(shù)正態(tài)分布,以確保它永遠不會低于零。

我們知道股票收益可能是負數(shù),因此收益可以假設(shè)服從正態(tài)分布。

假設(shè)變量服從正態(tài)分布而不進行任何分析是愚蠢的。

變量可以服從Poisson,Student-t 或 Binomial 分布,盲目地假設(shè)變量服從正態(tài)分布可能導致不準確的結(jié)果。

總結(jié)

本文闡述了正態(tài)分布的概念和性質(zhì),以及它如此重要的原因。

希望能幫助到你。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關(guān)注

    關(guān)注

    67

    文章

    8569

    瀏覽量

    137353
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26279

原文標題:正態(tài)分布為何如此重要?

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Samtec阻抗科普系列二 | 阻抗的管理

    什么是阻抗,以及它在高頻信號領(lǐng)域為何如此重要。 我們發(fā)現(xiàn),阻抗不僅僅是電阻那么簡單,其實定義了交流電是如何與導體周圍的電場和磁場相互作用的。 在這一步,我們將看看工程師們是如何通過精心設(shè)計線纜
    的頭像 發(fā)表于 05-07 11:28 ?5986次閱讀
    Samtec阻抗科普系列二 | 阻抗的管理

    火災防控新趨勢:紅外熱成像火情監(jiān)控為何如此重要?

    熱輻射原理的技術(shù),通過紅外探測器捕捉0.75-1000μm波段的紅外能量,將不可見的熱分布轉(zhuǎn)化為可視化圖像,使消防人員能在復雜環(huán)境中精準定位火源、監(jiān)測火勢蔓延,成為現(xiàn)代火災
    的頭像 發(fā)表于 04-08 16:40 ?292次閱讀
    火災防控新趨勢:紅外熱成像火情監(jiān)控<b class='flag-5'>為何如此</b>重要?

    一文闡述IGBT持續(xù)獲得廣泛采用的原因

    盡管寬禁帶技術(shù)正在崛起,但傳統(tǒng)的功率電子器件仍在持續(xù)進化廣泛應用。憑借其出色的性價比、穩(wěn)定的供應以及經(jīng)過實際驗證的可靠性,在小型化和輕量化無法帶來較大附加值的應用場景中,一直是非常實用的選項。
    的頭像 發(fā)表于 03-19 10:38 ?894次閱讀

    SWD端口復用為GPIO功能

    使用庫函數(shù)把SWD下載端口PA13 PA14 分別復用為UART0_RXD UART0_TXD的方法 SWD一般用于MCU的調(diào)試,用戶使用Keil MDK或IAR等開發(fā)工具時,可使用該調(diào)試接口進行
    發(fā)表于 01-29 06:56

    捷智算GPU維修中心服務器電源維修成功率高達90%!

    修復率遠超同行?"答案:能修!且比換新更可靠!先搞懂:GPU服務器電源為何如此"嬌貴"?GPU服務器電源不是普通PC電源,它是整臺算力服務器的"心臟輸血系統(tǒng)":功率密度極高:單電源1600W-3
    的頭像 發(fā)表于 12-12 19:00 ?827次閱讀
    捷智算GPU維修中心服務器電源維修成功率高達90%!

    政策多次提及,零碳園區(qū)為何如此重要?氫能源如何進入?

    11月10日,《國家發(fā)展改革委、國家能源局關(guān)于促進新能源消納和調(diào)控的指導意見》發(fā)布。意見指出,推進零碳園區(qū)建設(shè)。 這是2025年國家層面第三次明文支持零碳園區(qū)建設(shè),不難看出國家的支持力度,那么,零碳園區(qū)為何如此重要呢?從目前發(fā)展情況來看,氫能源又該如何與零碳園區(qū)融合發(fā)展?
    的頭像 發(fā)表于 11-12 15:16 ?553次閱讀
    政策多次提及,零碳園區(qū)<b class='flag-5'>為何如此</b>重要?氫能源如何進入?

    電能質(zhì)量在線監(jiān)測裝置精度等級校準失敗的概率高嗎?

    電能質(zhì)量在線監(jiān)測裝置精度等級校準失敗的概率因設(shè)備等級、運行環(huán)境、維護水平等因素差異顯著,無法用單一數(shù)值概括。以下是基于行業(yè)實踐和技術(shù)標準的綜合分析: 一、基礎(chǔ)概率范圍與核心影響因素 根據(jù)電力行業(yè)校準
    的頭像 發(fā)表于 11-12 09:24 ?840次閱讀

    MR30分布式I/O助力物流分揀系統(tǒng)智能化升級

    本文以MR30分布式I/O在某大型電商物流中心分揀系統(tǒng)的應用為例,詳細闡述其在合流、分揀、分流、分運全流程中的模塊化應用方案。
    的頭像 發(fā)表于 10-31 10:58 ?1201次閱讀
    MR30<b class='flag-5'>分布</b>式I/O助力物流分揀系統(tǒng)智能化升級

    精密儀器為何如此嬌貴?根源在3.3V,關(guān)鍵在工業(yè)級UPS

    測試儀
    上海優(yōu)比施電子科技有限公司
    發(fā)布于 :2025年10月29日 09:31:40

    設(shè)備出現(xiàn)通信問題的概率大嗎?

    設(shè)備出現(xiàn)通信問題的概率并非固定值,而是受 “通信鏈路類型(有線 / 無線)、應用場景(工業(yè) / 民用)、設(shè)備老化程度、設(shè)計安裝規(guī)范度、干擾源強度” 等多因素影響,整體呈現(xiàn) “工業(yè)場景高于民用
    的頭像 發(fā)表于 09-25 14:08 ?791次閱讀
    設(shè)備出現(xiàn)通信問題的<b class='flag-5'>概率</b>大嗎?

    MR30分布式IO在噴繪機器人的應用

    噴繪機器人憑借高效、精確、穩(wěn)定、節(jié)能等優(yōu)點,在汽車、航空航天、電子等多個行業(yè)廣泛應用。本文以 MR30分布式IO在噴繪機器人中的應用為核心,介紹了噴繪機器人的生產(chǎn)工藝,分析了其在實際應用中的需求痛點
    的頭像 發(fā)表于 08-15 13:48 ?860次閱讀
    MR30<b class='flag-5'>分布</b>式IO在噴繪機器人的應用

    三相接觸式調(diào)壓器為何如此受歡迎

    三相接觸式調(diào)壓器通過調(diào)節(jié)輸出電壓來滿足不同電氣設(shè)備的電壓需求,廣泛應用與工業(yè)生產(chǎn)、科學試驗及家用電器的測試領(lǐng)域中、電器產(chǎn)品負載老化、設(shè)備測試、調(diào)壓、控溫、調(diào)速、調(diào)光和功率控制等場景。三相接觸式調(diào)壓器為什么好用,具體體現(xiàn)在以下幾個方面:
    的頭像 發(fā)表于 08-13 15:56 ?912次閱讀
    三相接觸式調(diào)壓器<b class='flag-5'>為何如此</b>受歡迎

    分布式IO選型指南:2025年分布式無線遠程IO品牌及采集控制方案詳解

    近年來,隨著工業(yè)物聯(lián)網(wǎng)(IIoT)、智能制造和工業(yè)4.0的深入發(fā)展,分布式無線遠程IO模塊在工業(yè)控制領(lǐng)域的應用愈發(fā)廣泛。這種模塊通過無線方式實現(xiàn)遠程數(shù)據(jù)采集與控制,極大地提高了工業(yè)設(shè)施的靈活性和效率
    的頭像 發(fā)表于 06-23 09:48 ?1538次閱讀

    FLIR Si2x系列聲學成像儀的五大優(yōu)勢

    在防爆行業(yè),安全與效率是企業(yè)運營的重中之重,F(xiàn)LIR Si2x系列聲學成像儀,憑借其卓越的性能和廣泛的應用場景,成為了眾多用戶的佳選,那么它為何如此受歡迎呢?
    的頭像 發(fā)表于 06-13 11:29 ?1207次閱讀
    化德县| 普宁市| 攀枝花市| 蕉岭县| 靖西县| 墨江| 灌南县| 福清市| 织金县| 三门峡市| 新民市| 四川省| 怀来县| 龙泉市| 葵青区| 万州区| 康乐县| 涿州市| 舞阳县| 嘉黎县| 呈贡县| 沙坪坝区| 凉城县| 定边县| 奉贤区| 呼图壁县| 包头市| 海丰县| 乌拉特中旗| 宜宾市| 调兵山市| 姜堰市| 天祝| 比如县| 英吉沙县| 绥阳县| 贺州市| 苏尼特左旗| 同仁县| 正定县| 仙居县|