日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在Python中實(shí)現(xiàn)一個(gè)簡單的貝葉斯模型?

數(shù)據(jù)分析與開發(fā) ? 來源:Datawhale ? 作者:張峰 ? 2021-06-23 17:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

即使對于一個(gè)非數(shù)據(jù)科學(xué)家來說,貝葉斯統(tǒng)計(jì)這個(gè)術(shù)語也已經(jīng)很流行了。你可能在大學(xué)期間把它作為必修課之一來學(xué)習(xí),而沒有意識到貝葉斯統(tǒng)計(jì)有多么重要。事實(shí)上,貝葉斯統(tǒng)計(jì)不僅僅是一種特定的方法,甚至是一類方法;它是一種完全不同的統(tǒng)計(jì)分析范式。

為什么貝葉斯統(tǒng)計(jì)如此重要

貝葉斯統(tǒng)計(jì)為你提供了在新數(shù)據(jù)的證據(jù)中更新你的評估工具,這是一個(gè)在許多現(xiàn)實(shí)世界場景中常見的概念,如跟蹤大流行病,預(yù)測經(jīng)濟(jì)趨勢,或預(yù)測氣候變化。貝葉斯統(tǒng)計(jì)是許多較著名的統(tǒng)計(jì)模型的支柱,如高斯過程。

重要的是,學(xué)習(xí)貝葉斯統(tǒng)計(jì)原理可以成為你作為一個(gè)數(shù)據(jù)科學(xué)家的寶貴財(cái)富,因?yàn)樗o你一個(gè)全新的視角來解決具有真實(shí)世界動(dòng)態(tài)數(shù)據(jù)來源的新問題。

這篇文章將介紹貝葉斯統(tǒng)計(jì)的基本理論,以及如何在Python中實(shí)現(xiàn)一個(gè)簡單的貝葉斯模型。

目錄表:

01 什么是貝葉斯統(tǒng)計(jì)?

02 貝葉斯編程簡介

03 貝葉斯的工作流程

04 建立一個(gè)簡單的貝葉斯模型

閑話少說,進(jìn)入主題!讓我們開始介紹貝葉斯統(tǒng)計(jì)編程。

1 什么是貝葉斯統(tǒng)計(jì)?

你可能會在互聯(lián)網(wǎng)上的某個(gè)地方或在你的課堂上看到這個(gè)方程式。

05529712-ca9c-11eb-9e57-12bb97331649.png

如果你沒有,也不要擔(dān)心,因?yàn)槲覍⑾蚰愫喴榻B貝葉斯的基本原則以及該公式的工作原理。

關(guān)鍵術(shù)語

上述貝葉斯公式的組成部分一般被稱為概率聲明。例如,在下面的后驗(yàn)概率聲明中,該術(shù)語的意思是 "給定觀測值y,theta(θ)的概率是多少 "。

Theta(θ)是這里的未知數(shù),被稱為我們所關(guān)心的參數(shù)。參數(shù)的不確定性遵循一個(gè)特定的概率分布,可以使用與數(shù)據(jù)相關(guān)的模型組合來估計(jì)有關(guān)參數(shù)。

上述貝葉斯統(tǒng)計(jì)表述也被稱為反概率,因?yàn)樗菑挠^察到參數(shù)開始的。換言之,貝葉斯統(tǒng)計(jì)試圖從數(shù)據(jù)(效果)中推斷出假設(shè)(原因),而不是用數(shù)據(jù)來接受/拒絕工作假設(shè)。

貝葉斯公式

那么,貝葉斯公式告訴我們什么呢?

后驗(yàn)概率是我們想知道的主要部分,因?yàn)門heta(θ)是我們感興趣的參數(shù)。

觀察的可能性僅僅意味著,在Theta(θ)的特定值下,數(shù)據(jù)y在現(xiàn)實(shí)世界中出現(xiàn)的可能性有多大。

先驗(yàn)概率是我們對Theta (θ)應(yīng)該是什么樣子的最佳猜測(例如,也許它遵循正態(tài)或高斯分布)。

歸一化常數(shù)只是一個(gè)系數(shù)常數(shù),使整個(gè)方程積分為1(因?yàn)楦怕什荒艿陀?和高于1)。

現(xiàn)在我們已經(jīng)涵蓋了貝葉斯統(tǒng)計(jì)的基本理論,讓我們開始為即將到來的貝葉斯編程教程進(jìn)行設(shè)置。

2 貝葉斯編程介紹

安裝

首先,安裝PyMC3作為我們執(zhí)行貝葉斯統(tǒng)計(jì)編程的首選庫。

推薦使用conda

conda install -c conda-forge pymc3

也可使用pip

pip install pymc3

獲取數(shù)據(jù)

我們將使用描述美國家庭中氡氣(Radon)濃度的氡氣數(shù)據(jù)集。氡氣已被證明是非吸煙者患肺癌的最高預(yù)測因素之一,其濃度通常與房屋的整體條件(例如,是否有地下室,等等)有關(guān)。

首先,在你的筆記本或終端運(yùn)行以下命令:

!wget "https://raw.githubusercontent.com/fonnesbeck/mcmc_pydata_london_2019/master/data/radon.csv"

確保你的數(shù)據(jù)位于你的筆記本的同一目錄內(nèi)。

數(shù)據(jù)探索

import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import numpy as npradon = pd.read_csv('./radon.csv', index_col=0)radon.head()

我們注意到,有29列描述了一個(gè)家庭中氡(Radon)的濃度。

數(shù)據(jù)集匯總

讓我們畫一張圖,顯示 "ANOKA "的氡的對數(shù)濃度分布,用一條垂直線來說明對數(shù)濃度為1.1。

anoka_radon = radon.query('county=="ANOKA"').log_radon sns.distplot(anoka_radon, bins=16)plt.axvline(1.1)

密度分布

ANOKA地區(qū)氡氣對數(shù)濃度超過1.1的家庭比例似乎相當(dāng)大,這是一個(gè)令人擔(dān)憂的趨勢......

3 貝葉斯工作流

現(xiàn)在我們有了數(shù)據(jù),讓我們進(jìn)行貝葉斯推斷。一般來說,這個(gè)過程可以分解為以下三個(gè)步驟。

第1步:指定一個(gè)概率模型

這是作為建模者要多做選擇的地方。你將需要為一切指定最可能的概率分布函數(shù)(例如,正態(tài)或高斯、考奇、二項(xiàng)式、t分布、F分布,等等)。

我所說的一切,是指包括未知參數(shù)、數(shù)據(jù)、協(xié)變量、缺失數(shù)據(jù)、預(yù)測在內(nèi)的一切。所以,用不同的分布函數(shù)做實(shí)驗(yàn),看看在現(xiàn)實(shí)世界的場景中如何起效。

第2步:計(jì)算后驗(yàn)分布

現(xiàn)在你將計(jì)算這個(gè)概率項(xiàng),給定貝葉斯方程右邊的所有項(xiàng)。

第3步:檢查你的模型

與其他ML模型一樣,評估你的模型是關(guān)鍵。回到第一步,檢查你的假設(shè)是否有意義。如果沒有,改變概率分布函數(shù),并反復(fù)重申。

4 建立一個(gè)簡單的貝葉斯模型

現(xiàn)在,我將向你介紹一個(gè)簡單的編程練習(xí)來建立你的第一個(gè)貝葉斯模型。

第1步:定義一個(gè)貝葉斯模型

首先,讓我們定義我們的氡氣——貝葉斯模型,有兩個(gè)參數(shù),平均值(μ-"miu")和其偏差(σ-"sigma")。這些參數(shù)(μ和σ)還需要通過選擇對應(yīng)的分布函數(shù)來建立模型(記?。何覀儽仨殲樗袇?shù)定義概率分布)。

對于這些,我們選擇的函數(shù)是正態(tài)/高斯分布(μ=0,σ=10)和均勻分布。你可以在模型的驗(yàn)證檢查中重新校準(zhǔn)這些值,如上面步驟3所述。

from pymc3 import Model, Normal, Uniformwith Model() as radon_model: μ = Normal(’μ’, mu=0, sd=10) σ = Uniform(’σ’, 0, 10)

下一步是用另一個(gè)概率分布來編譯radon_model本身。

**with** radon_model: dist = Normal('dist', mu=μ, sd=σ, observed=anoka_radon)

第2步:用數(shù)據(jù)進(jìn)行模型擬合

現(xiàn)在,我們需要用數(shù)據(jù)來擬合這個(gè)模型(即訓(xùn)練)。

from pymc3 import sample **with** radon_model: samples = sample(1000, tune=1000, cores=2, random_seed=12)

讓我們畫出我們的參數(shù)μ在訓(xùn)練后的分布情況,同時(shí)畫出95%的置信線。

from arviz import plot_posterior plot_posterior(samples, var_names=['μ'], ref_val=1.1)

好吧,看來1.1的對數(shù)濃度可能不是那么糟糕,因?yàn)樗窃诜植嫉奈捕耍ㄖ挥?.2%的樣品的對數(shù)濃度大于1.1)。

責(zé)任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 貝葉斯
    +關(guān)注

    關(guān)注

    0

    文章

    77

    瀏覽量

    12953
  • python
    +關(guān)注

    關(guān)注

    58

    文章

    4889

    瀏覽量

    90330

原文標(biāo)題:為什么貝葉斯統(tǒng)計(jì)如此重要?

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    FRED應(yīng)用:模擬沃拉頓棱鏡偏振器

    對話框獲取用戶的輸入并將它們分配給變量。這樣就創(chuàng)建了新的自定義元件實(shí)體,接著按順序定義每一個(gè)表面。 樣本模型 FRED文件.frd包含了兩個(gè)沃拉
    發(fā)表于 04-22 08:17

    [VirtualLab] 使用Python運(yùn)行VirtualLab Fusion光學(xué)仿真

    Fusion的簡單方法。在本示例,我們將演示如何使用Python腳本運(yùn)行光學(xué)仿真,以向用戶簡要概述這種跨平臺的仿真能力。 用例概覽 文件路徑 用戶可以在樣本文件的文件夾中找到所有文件。包含這些文件
    發(fā)表于 03-31 09:39

    何在 VisionFive 上使用 Python 包?

    確保執(zhí)行以下步驟: 將 Fedora OS 刷新到 Micro-SD 卡,如將 Fedora OS 刷新到 Micro-SD 卡部分的VisionFive 單板計(jì)算機(jī)快速入門指南. 登錄
    發(fā)表于 03-30 08:28

    摩爾微電子任命喬·德維(Joe Bedewi)為首席財(cái)務(wù)官

    今日宣布,正式任命喬·德維(Joe Bedewi)為首席財(cái)務(wù)官(CFO)。此次任命旨在強(qiáng)化公司核心領(lǐng)導(dǎo)團(tuán)隊(duì),為企業(yè)下階段的全球增長注入新動(dòng)能。 摩爾微電子首席財(cái)務(wù)官喬·德維(J
    的頭像 發(fā)表于 03-20 10:28 ?400次閱讀
    摩爾<b class='flag-5'>斯</b>微電子任命喬·<b class='flag-5'>貝</b>德維(Joe Bedewi)為首席財(cái)務(wù)官

    何在 Vision Five 2 上安裝 python 庫?

    這可能是個(gè)完全愚蠢的問題,但我如何在 Vision Five 2 上安裝 python 庫。 使用該命令后,它給了我這個(gè)錯(cuò)誤。 默認(rèn)為用戶安裝,因?yàn)槠胀ㄕ军c(diǎn)包不可寫 錯(cuò)誤:找不到滿足
    發(fā)表于 03-06 07:51

    算法工程師需要具備哪些技能?

    搜索:網(wǎng)格搜索、隨機(jī)搜索、優(yōu)化等。 人工智能行業(yè)發(fā)展迅速,人才供需不平衡,技術(shù)型人才緊缺。企業(yè)在招聘時(shí)應(yīng)注重人才的綜合能力,求職者需提升自身技術(shù)和軟技能。
    發(fā)表于 02-27 10:53

    如何精準(zhǔn)驅(qū)動(dòng)菜品識別模型--基于米爾瑞芯微RK3576邊緣計(jì)算盒

    的MYD-LR3576邊緣計(jì)算盒子為例,講解如何在Android平臺部署yolo11s、PPLCNETV2模型實(shí)現(xiàn)實(shí)時(shí)菜品識別。為開發(fā)者與研究者提供份兼具實(shí)踐參考與技術(shù)洞察的
    發(fā)表于 10-31 21:19

    何在vivadoHLS中使用.TLite模型

    測試 在Vivado HLS運(yùn)行綜合、高級綜合和RTL仿真,確保設(shè)計(jì)正確。 注意事項(xiàng) 以上步驟是個(gè)簡化的示例,具體的實(shí)現(xiàn)可能因您的模型
    發(fā)表于 10-22 06:29

    何在LTspice添加電壓控制開關(guān)

    電壓控制開關(guān)是 LTspice 的基本電路元件,能夠以簡潔的方式在電路實(shí)現(xiàn)開路或短路行為,并支持在仿真過程動(dòng)態(tài)切換。完善原理圖后,設(shè)計(jì)人員最終可能需要采用更精確的FET或開關(guān)模型
    的頭像 發(fā)表于 09-11 15:50 ?5552次閱讀
    如<b class='flag-5'>何在</b>LTspice<b class='flag-5'>中</b>添加電壓控制開關(guān)

    各位大佬給指點(diǎn)下,感激不盡,前級DI效果器上的插件元件

    我是新人 各位見笑了 各位大佬給看看這是什么原件這個(gè)個(gè)前級DI效果器上的個(gè)插試原件兩排插
    發(fā)表于 09-04 20:14

    AI+能源數(shù)字化破局者故事5:謝 x IBM 咨詢之 “全球化經(jīng)營與本地化適配”

    謝與 IBM 的合作建立在技術(shù)專長、交付能力及本地化支持的基礎(chǔ)上,IBM 的強(qiáng)大技術(shù)實(shí)力和本地經(jīng)驗(yàn),使其成為謝推動(dòng)數(shù)字化轉(zhuǎn)型的重要合作伙伴
    的頭像 發(fā)表于 07-17 19:02 ?1621次閱讀

    基礎(chǔ)篇3:掌握Python的條件語句與循環(huán)

    不同的條件執(zhí)行不同的代碼塊。Python的條件語句主要使用if、elif(else if的縮寫)和else關(guān)鍵字。 if語句 最簡單的條件語句是if語句,它的工作方式如下: 復(fù)制代碼 if 條件表達(dá)式
    發(fā)表于 07-03 16:13

    請問如何在C++中使用NPU上的模型緩存?

    無法確定如何在 C++ 的 NPU 上使用模型緩存
    發(fā)表于 06-24 07:25

    如何將個(gè)FA模型開發(fā)的聲明式范式應(yīng)用切換到Stage模型

    模型切換概述 本文介紹如何將個(gè)FA模型開發(fā)的聲明式范式應(yīng)用切換到Stage模型,您需要完成如下動(dòng)作: 工程切換:新建
    發(fā)表于 06-04 06:22

    簡單認(rèn)識阿倫尼烏壽命模型

    Arrhenius,阿倫尼烏,提出了個(gè)表征芯片使用壽命的計(jì)算模型,即阿倫尼烏壽命模型。透過
    的頭像 發(fā)表于 05-19 09:34 ?2715次閱讀
    <b class='flag-5'>簡單</b>認(rèn)識阿倫尼烏<b class='flag-5'>斯</b>壽命<b class='flag-5'>模型</b>
    布尔津县| 奇台县| 赤壁市| 深州市| 阳春市| 瓮安县| 古田县| 桐庐县| 南城县| 合作市| 内丘县| 绥芬河市| 景宁| 栾川县| 霍州市| 宜章县| 阳东县| 开化县| 门源| 海丰县| 石林| 南昌市| 宁都县| 军事| 嘉善县| 海伦市| 宜宾市| 恭城| 白河县| 中方县| 盐城市| 永济市| 汉寿县| 定兴县| 穆棱市| 克拉玛依市| 镇赉县| 洞口县| 新建县| 上林县| 永川市|