日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

建立決策樹(shù)的邏輯

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 作者:深度學(xué)習(xí)自然語(yǔ)言 ? 2020-10-10 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一個(gè)小故事

zenRRan二十出頭了,到了婚配的年齡啦。又因?yàn)榧沂敲T望族,所以一堆人搶著想來(lái)應(yīng)聘配偶的職位。但是zenRRan比較挑剔,必須達(dá)到他的要求才能有機(jī)會(huì)成為他的另一半,要求為:

1. 性別女,非女性不要

于是刷刷刷走了一半人,剩下的全部為女性。

2.身高必須要在150-165cm

于是又走了一堆人,剩下的為160-165cm之間的女生。

3.性格要溫柔賢惠

聽(tīng)到這些,又走了一些人,最后留下的極為最后的應(yīng)聘候選人。

上述過(guò)程可以用樹(shù)來(lái)表示:

像上面的這樣的二叉樹(shù)狀決策在我們生活中很常見(jiàn),而這樣的選擇方法就是決策樹(shù)。機(jī)器學(xué)習(xí)的方法就是通過(guò)平時(shí)生活中的點(diǎn)點(diǎn)滴滴經(jīng)驗(yàn)轉(zhuǎn)化而來(lái)的。

建立決策樹(shù)的邏輯

正如上述樹(shù)狀圖所示,我們最終會(huì)通過(guò)特征:

性別,身高,性格

得到了4種分類結(jié)果,都存在于葉子節(jié)點(diǎn)。

非女生,身高不符合的女生,身高符合性格不符合的女生,都符合的最佳候選人。

現(xiàn)在我們來(lái)回想下上面的建立決策的流程:

首先在一群給定數(shù)據(jù)(應(yīng)聘者)中,我們先通過(guò)一個(gè)特征(性別)來(lái)進(jìn)行二分類。當(dāng)然選取這個(gè)特征也是根據(jù)實(shí)際情況而定的,比如zenRRan選取第一個(gè)條件為性別的原因是,來(lái)的男的太多了,比例占的有點(diǎn)大,所以先給他分成類放到一邊,剩下的更加好分類而已。

然后,對(duì)葉子節(jié)點(diǎn)(那些還想繼續(xù)分類的節(jié)點(diǎn)們)繼續(xù)進(jìn)行上述的流程。

那么怎么選取特征作為當(dāng)前的分類依據(jù)呢?有兩種方法:

信息熵和基尼系數(shù)。

信息熵

熵這個(gè)概念想必大家都不陌生,熵用來(lái)表示數(shù)據(jù)的確定性程度。研究一個(gè)詞,就要從他的來(lái)源說(shuō)起,熵,來(lái)自熱動(dòng)力學(xué),表示原子或者一個(gè)事物的穩(wěn)定程度,溫度越高,原子越活躍,越不穩(wěn)定;反而溫度越低,就越穩(wěn)定,越保持不動(dòng)。所以慢慢的這個(gè)概念被用到各個(gè)方向,也就有了新的定義詞匯,但是它的本意沒(méi)變,就是穩(wěn)定程度大小的表示。

那么在決策樹(shù)里面,我們用的是一種熵,信息熵,來(lái)表示類別的穩(wěn)定程度。

公式為:

注:p為一個(gè)類的占比

什么意思呢?具體用數(shù)字表示下:

比如一個(gè)分類結(jié)果由三個(gè)類組成,占比為1/3 1/31/3,那么它們的信息熵為:

如果占比為1/10 2/10 7/10,那么它的信息熵為:

那再舉一個(gè)極端情況,也就是我們想要得到的類,只包含一種情況,其他的比例為0,那么比如占比情況為:1 0 0,那么它的信息熵為:

我們會(huì)發(fā)現(xiàn)一個(gè)分類結(jié)果里,里面的類別比例越是接近,信息熵也就越大,反之越是趨向于一個(gè)值,越是小,會(huì)達(dá)到0。

如果將所有的情況考慮在內(nèi)的話,就能繪成一個(gè)圖(為了好畫,以該分好的類別里有兩種事物為例):

我們會(huì)發(fā)現(xiàn),當(dāng)占比為0.5的時(shí)候,也就是另一個(gè)事物的占比也是0.5的時(shí)候信息熵最高,當(dāng)傾向于一個(gè)事物的時(shí)候,信息熵最小,無(wú)限接近并達(dá)到0。

為什么都占比一樣的時(shí)候信息熵最大呢?也就是說(shuō)最不穩(wěn)定呢?因?yàn)楫?dāng)每個(gè)事物都占比一樣的時(shí)候,一個(gè)小事物進(jìn)來(lái),不清楚它到底屬于哪一類;如果只有一類事物或者一類事物居多數(shù),那么也就比較明確該屬于哪類,也就穩(wěn)定,確定了。

那么怎么用呢?

我們通過(guò)計(jì)算機(jī)分類,因?yàn)橛泻芏喾N分類情況,不是每一次分類都是直接將同一類分到一個(gè)類別里,而是將該分好的兩個(gè)類的信息熵總和最小為依據(jù),不斷地通過(guò)暴力尋找最佳選擇。然后遞歸進(jìn)行對(duì)分好類的數(shù)據(jù)進(jìn)行再分類。

基尼系數(shù)

基尼系數(shù)和信息熵在這里具有同樣的性質(zhì)。先看看它的公式:

公式看不出什么特色之處,就繼續(xù)用數(shù)字展示下:

比如依然是三分類,類別占比為1/3 1/3 1/3,基尼系數(shù)為:

類別占比為1/10 2/10 7/10,基尼系數(shù)為:

如果是極端情況下占比為1 0 0,那么基尼系數(shù)為;

我們根據(jù)公式其實(shí)就能看出來(lái),平方的函數(shù)為凸函數(shù),而該公式在都相等的時(shí)候值最大。

代碼實(shí)現(xiàn)

再重說(shuō)下流程:

通過(guò)對(duì)每個(gè)特征進(jìn)行嘗試分類,記錄當(dāng)前分類最小的信息熵(或基尼系數(shù))的特征為當(dāng)前分類結(jié)果。

選取一些點(diǎn),初始化數(shù)據(jù):

X為二維平面的數(shù)據(jù)點(diǎn),Y為類別。

數(shù)據(jù)點(diǎn)分布情況:

信息熵函數(shù):

基尼系數(shù)函數(shù):

二者使用一個(gè)即可。

下面是一個(gè)分類核心的流程:

文字描述為:

對(duì)數(shù)據(jù)點(diǎn)的特征0維進(jìn)行嘗試分類,先按照0維數(shù)據(jù)排序,然后取每相鄰的中點(diǎn)值,然后以0維該值分界線,處于分界線兩側(cè)的數(shù)據(jù)分別求信息熵(或基尼系數(shù)),如果比之前的小,這就保存該值和當(dāng)前維度。然后選取第1維進(jìn)行相同操作,最終的最小信息熵(或基尼系數(shù))最小對(duì)應(yīng)的值為本次分類的結(jié)果。

但是這個(gè)僅僅是一層分類,如果還子節(jié)點(diǎn)還有要分類的數(shù)據(jù),繼續(xù)上述操作即可。

分類代碼:

分類效果流程圖:

決策樹(shù)第一層分類結(jié)果為:

當(dāng)前線為最佳值,1維的數(shù)據(jù)就是分過(guò)的,但是沒(méi)有當(dāng)前的值好,也就沒(méi)顯示。

現(xiàn)在已經(jīng)分出了兩類,左邊的紅色和右邊的綠色+藍(lán)色。那么還要對(duì)上述的右邊進(jìn)行分類,獲取該數(shù)據(jù),并且繼續(xù)進(jìn)行分類,分類流程圖為:

最終得出的分類結(jié)果為上述兩條線。其中粉色為第一層分類,紫色為第二層分類。

批判性思維看決策樹(shù)

看到上述的分類結(jié)果,其實(shí)你心里也想到了決策樹(shù)的缺點(diǎn)了,就是分類總是橫平豎直的,不能是曲線。

比如

該四個(gè)數(shù)據(jù)的分類最佳理想條件下應(yīng)該為上述紫色線條,但是決策樹(shù)的結(jié)果為;

如果存在數(shù)據(jù)在:

明明應(yīng)該屬于藍(lán)色點(diǎn)的,但是被劃分到紅色點(diǎn)里。

所以可以看出,決策樹(shù)對(duì)數(shù)據(jù)的要求是是苛刻的。

另一個(gè)問(wèn)題是,決策樹(shù)的學(xué)習(xí)問(wèn)題,從上述代碼實(shí)現(xiàn)過(guò)程能夠看出來(lái),可以說(shuō)是暴力求解了。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 二叉樹(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    74

    瀏覽量

    13008
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137256
  • 決策樹(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    96

    瀏覽量

    14105

原文標(biāo)題:【機(jī)器學(xué)習(xí)】決策樹(shù)的理論與實(shí)踐

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    樹(shù)科技,IPO申請(qǐng)獲受理

    電子發(fā)燒友網(wǎng)綜合報(bào)道 3月20日,上交所網(wǎng)站顯示,宇樹(shù)科技股份有限公司科創(chuàng)板IPO申請(qǐng)已受理,成為又一家科創(chuàng)板IPO“預(yù)先審閱”落地項(xiàng)目。此次IPO,宇樹(shù)科技擬募資42.02億元。 ? 招股書顯示
    的頭像 發(fā)表于 03-20 18:33 ?4290次閱讀
    宇<b class='flag-5'>樹(shù)</b>科技,IPO申請(qǐng)獲受理

    算法工程師需要具備哪些技能?

    :自動(dòng)化任務(wù)(如數(shù)據(jù)預(yù)處理、模型訓(xùn)練調(diào)度)。Git版本控制:團(tuán)隊(duì)協(xié)作開(kāi)發(fā)(如分支管理、代碼合并)。 機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí):線性回歸、邏輯回歸、決策樹(shù)、SVM等。無(wú)監(jiān)督學(xué)習(xí):聚類(K-Means)、降維
    發(fā)表于 02-27 10:53

    無(wú)線傾角傳感器在古樹(shù)監(jiān)測(cè)中的應(yīng)用:以科技守護(hù)活文物的結(jié)構(gòu)安全

    無(wú)線傾角傳感器在古樹(shù)監(jiān)測(cè)中的應(yīng)用:以科技守護(hù)活文物的結(jié)構(gòu)安全
    的頭像 發(fā)表于 01-09 11:38 ?796次閱讀
    無(wú)線傾角傳感器在古<b class='flag-5'>樹(shù)</b>監(jiān)測(cè)中的應(yīng)用:以科技守護(hù)活文物的結(jié)構(gòu)安全

    如何專業(yè)評(píng)估UPS電源的性能與架構(gòu):一份面向決策者的終極指南

    在關(guān)鍵業(yè)務(wù)運(yùn)營(yíng)中,選擇一臺(tái)合適的UPS電源(不間斷電源)是一項(xiàng)具有長(zhǎng)期影響的技術(shù)決策。面對(duì)紛繁的產(chǎn)品參數(shù)與營(yíng)銷話術(shù),技術(shù)決策者常感到困惑:究竟如何穿透表象,評(píng)估UPS電源的真實(shí)性能與架構(gòu)價(jià)值?本文
    的頭像 發(fā)表于 12-11 08:38 ?487次閱讀
    如何專業(yè)評(píng)估UPS電源的性能與架構(gòu):一份面向<b class='flag-5'>決策</b>者的終極指南

    萬(wàn)界星空AI產(chǎn)線MES:打破產(chǎn)線“黑箱”,邁向智能決策

    AI產(chǎn)線MES是制造業(yè)數(shù)字化轉(zhuǎn)型的必然產(chǎn)物。 它不再是簡(jiǎn)單的管理執(zhí)行工具,而是演變成了一個(gè)能夠感知、分析、決策、執(zhí)行的“產(chǎn)線大腦”。通過(guò)引入AI,制造企業(yè)能夠解鎖前所未有的效率、質(zhì)量和靈活性,在日益激烈的全球競(jìng)爭(zhēng)中建立起核心優(yōu)勢(shì)。
    的頭像 發(fā)表于 12-02 13:36 ?440次閱讀
    萬(wàn)界星空AI產(chǎn)線MES:打破產(chǎn)線“黑箱”,邁向智能<b class='flag-5'>決策</b>

    基于級(jí)聯(lián)分類器的人臉檢測(cè)基本原理

    ,然后把滑動(dòng)窗口中的像素灰度值和級(jí)聯(lián)分類器里預(yù)先訓(xùn)練好的468棵決策樹(shù)中的節(jié)點(diǎn)進(jìn)行比較,得到該窗口檢測(cè)結(jié)果為人臉的置信度。如果置信度大于一定的閾值,那么我們認(rèn)為人臉被檢測(cè)到了,反之則為未檢測(cè)到人臉
    發(fā)表于 10-30 06:14

    樹(shù)科技,被起訴

    電子發(fā)燒友網(wǎng)綜合報(bào)道 天眼查顯示,近日,杭州宇樹(shù)科技股份有限公司(以下簡(jiǎn)稱“宇樹(shù)科技”)新增1條開(kāi)庭公告,原告為杭州露韋美日化有限公司(以下簡(jiǎn)稱“露韋美日化”),案由為侵害發(fā)明專利權(quán)糾紛,該案將于8
    的頭像 發(fā)表于 08-26 07:50 ?5226次閱讀
    宇<b class='flag-5'>樹(shù)</b>科技,被起訴

    如何根據(jù)設(shè)備健康狀態(tài)數(shù)據(jù)進(jìn)行分析決策?

    要根據(jù)設(shè)備健康狀態(tài)數(shù)據(jù)做好分析決策,需先明確數(shù)據(jù)核心價(jià)值,再通過(guò) “數(shù)據(jù)預(yù)處理→多維度分析→風(fēng)險(xiǎn)評(píng)估→決策落地” 的閉環(huán)流程推進(jìn),既依托技術(shù)工具挖掘數(shù)據(jù)規(guī)律,又結(jié)合生產(chǎn)實(shí)際確保決策可行。
    的頭像 發(fā)表于 08-20 10:07 ?986次閱讀
    如何根據(jù)設(shè)備健康狀態(tài)數(shù)據(jù)進(jìn)行分析<b class='flag-5'>決策</b>?

    光伏電站輔助決策系統(tǒng)的實(shí)現(xiàn)

    光伏電站中應(yīng)用光伏電站輔助決策系統(tǒng),對(duì)光伏電站來(lái)說(shuō),不僅是提升運(yùn)維效率、降低人力成本,優(yōu)化發(fā)電效率、增加經(jīng)濟(jì)效益的需要,更多的是通過(guò)決策科學(xué)化,增強(qiáng)安全性、防范運(yùn)營(yíng)風(fēng)險(xiǎn)。作為一款光伏電站的智能管理
    的頭像 發(fā)表于 08-15 09:14 ?1132次閱讀
    光伏電站輔助<b class='flag-5'>決策</b>系統(tǒng)的實(shí)現(xiàn)

    工業(yè)電腦的進(jìn)化從基礎(chǔ)控制到智能決策的跨越

    工控機(jī)從單純的基礎(chǔ)控制設(shè)備進(jìn)化為具備智能決策能力的邊緣計(jì)算節(jié)點(diǎn),標(biāo)志著工業(yè)自動(dòng)化領(lǐng)域的一次深刻革命,這一跨越不僅是技術(shù)堆疊的升級(jí),更是工業(yè)系統(tǒng)運(yùn)行邏輯的根本性重構(gòu)。以下是這一進(jìn)化路徑的核心解析
    的頭像 發(fā)表于 08-08 10:45 ?593次閱讀

    玩具語(yǔ)音方案選型決策OTP vs Flash 的成本功耗與靈活性

    玩具語(yǔ)音芯片方案選型的選擇有很多的,但是基于各方面的限制和功能上的需求,那么在OTP和FLASH語(yǔ)音芯片之間如何做抉擇? ? 一、決策樹(shù)總覽 玩具語(yǔ)音方案選型可先考慮產(chǎn)品語(yǔ)音內(nèi)容后期是否需要修改
    的頭像 發(fā)表于 07-08 17:08 ?778次閱讀

    看點(diǎn):投資方:宇樹(shù)科技或于科創(chuàng)板IPO 美媒:亞馬遜機(jī)器人數(shù)量接近人類員工 英偉達(dá)股價(jià)創(chuàng)新高

    給大家?guī)?lái)一些行業(yè)資訊: 投資方:宇樹(shù)科技或于科創(chuàng)板IPO 早在2025年的5月29日,宇樹(shù)科技就正式發(fā)布通知稱,因公司發(fā)展需要,杭州宇樹(shù)科技有限公司即日起名稱變更為“杭州宇樹(shù)科技股份
    的頭像 發(fā)表于 07-04 15:08 ?941次閱讀

    電源工程師的核心技能樹(shù)體系

    電源工程師的核心技能樹(shù)體系需覆蓋從基礎(chǔ)理論到專業(yè)實(shí)踐、工具應(yīng)用及行業(yè)適配的全鏈條能力。以下是系統(tǒng)化的技能框架,按知識(shí)層級(jí)和應(yīng)用場(chǎng)景展開(kāi),幫助從業(yè)者明確能力提升路徑: 一、基礎(chǔ)理論層:核心知識(shí)根基
    的頭像 發(fā)表于 06-05 09:44 ?3348次閱讀

    地平線余凱稱輔助駕駛的底層邏輯正在改寫

    從大模型黑馬DeepSeek,到春晚出圈的宇樹(shù)機(jī)器人,人工智能撬動(dòng)的科技創(chuàng)新引領(lǐng)又一輪產(chǎn)業(yè)革命。這印證了“生產(chǎn)力決定生產(chǎn)關(guān)系”的底層邏輯,當(dāng)科技動(dòng)能觸發(fā)的“十倍生產(chǎn)力”涌現(xiàn),行業(yè)格局必將引發(fā)重塑。
    的頭像 發(fā)表于 06-03 13:59 ?864次閱讀
    孟津县| 石景山区| 大厂| 岫岩| 宜黄县| 安顺市| 正镶白旗| 巴林左旗| 大安市| 金塔县| 河间市| 佛坪县| 长汀县| 武安市| 榕江县| 松潘县| 灵武市| 大连市| 德兴市| 靖西县| 沾益县| 渭南市| 新疆| 广汉市| 西安市| 开阳县| 广元市| 会东县| 平原县| 久治县| 福贡县| 怀安县| 罗甸县| 平定县| 石泉县| 四会市| 彭水| 宁阳县| 孟连| 凉山| 沙田区|