日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

10個機(jī)器學(xué)習(xí)中常用的距離度量方法

穎脈Imgtec ? 2022-11-03 10:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Jonte Dancker

來源:DeepHub IMBA


距離度量是有監(jiān)督和無監(jiān)督學(xué)習(xí)算法的基礎(chǔ),包括k近鄰、支持向量機(jī)和k均值聚類等。

距離度量的選擇影響我們的機(jī)器學(xué)習(xí)結(jié)果,因此考慮哪種度量最適合這個問題是很重要的。因此,我們在決定使用哪種測量方法時應(yīng)該謹(jǐn)慎。但在做出決定之前,我們需要了解距離測量是如何工作的,以及我們可以從哪些測量中進(jìn)行選擇。

本文將簡要介紹常用的距離度量方法、它們的工作原理、如何用Python計(jì)算它們以及何時使用它們。這樣可以加深知識和理解,提高機(jī)器學(xué)習(xí)算法和結(jié)果。fdf794a0-5937-11ed-b116-dac502259ad0.png在更深入地研究不同的距離測量之前,我們先要有一個關(guān)于它們?nèi)绾喂ぷ饕约叭绾芜x擇合適的測量的大致概念。距離度量用于計(jì)算給定問題空間中兩個對象之間的差異,即數(shù)據(jù)集中的特征。然后可以使用該距離來確定特征之間的相似性, 距離越小特征越相似。

對于距離的度量,我們可以在幾何距離測量和統(tǒng)計(jì)距離測量之間進(jìn)行選擇,應(yīng)該選擇哪種距離度量取決于數(shù)據(jù)的類型。特征可能有不同的數(shù)據(jù)類型(例如,真實(shí)值、布爾值、分類值),數(shù)據(jù)可能是多維的或由地理空間數(shù)據(jù)組成。


幾何距離測量1、歐氏距離 Euclidean distance歐氏距離度量兩個實(shí)值向量之間的最短距離。由于其直觀,使用簡單和對許多用例有良好結(jié)果,所以它是最常用的距離度量和許多應(yīng)用程序的默認(rèn)距離度量。fe14fd38-5937-11ed-b116-dac502259ad0.png歐氏距離也可稱為l2范數(shù),其計(jì)算方法為:fe38b61a-5937-11ed-b116-dac502259ad0.pngPython代碼如下from scipy.spatial import distance distance.euclidean(vector_1, vector_2)歐氏距離有兩個主要缺點(diǎn)。首先,距離測量不適用于比2D或3D空間更高維度的數(shù)據(jù)。第二,如果我們不將特征規(guī)范化和/或標(biāo)準(zhǔn)化,距離可能會因?yàn)閱挝坏牟煌鴥A斜。2、曼哈頓距離 Manhattan distance曼哈頓距離也被稱為出租車或城市街區(qū)距離,因?yàn)閮蓚€實(shí)值向量之間的距離是根據(jù)一個人只能以直角移動計(jì)算的。這種距離度量通常用于離散和二元屬性,這樣可以獲得真實(shí)的路徑。fe497ab8-5937-11ed-b116-dac502259ad0.png曼哈頓距離以l1范數(shù)為基礎(chǔ),計(jì)算公式為:fe5b34a6-5937-11ed-b116-dac502259ad0.pngPython代碼如下from scipy.spatial import distance distance.cityblock(vector_1, vector_2)曼哈頓的距離有兩個主要的缺點(diǎn)。它不如高維空間中的歐氏距離直觀,它也沒有顯示可能的最短路徑。雖然這可能沒有問題,但我們應(yīng)該意識到這并不是最短的距離。3、切比雪夫距離 Chebyshev distance切比雪夫距離也稱為棋盤距離,因?yàn)樗莾蓚€實(shí)值向量之間任意維度上的最大距離。它通常用于倉庫物流中,其中最長的路徑?jīng)Q定了從一個點(diǎn)到另一個點(diǎn)所需的時間。fe65d6d6-5937-11ed-b116-dac502259ad0.png切比雪夫距離由l -無窮范數(shù)計(jì)算:fe75cc3a-5937-11ed-b116-dac502259ad0.pngPython代碼如下from scipy.spatial import distance distance.chebyshev(vector_1, vector_2)

切比雪夫距離只有非常特定的用例,因此很少使用。

4、閔可夫斯基距離 Minkowski distance閔可夫斯基距離是上述距離度量的廣義形式。它可以用于相同的用例,同時提供高靈活性。我們可以選擇 p 值來找到最合適的距離度量。fe7ee90a-5937-11ed-b116-dac502259ad0.png閔可夫斯基距離的計(jì)算方法為:fe9bec6c-5937-11ed-b116-dac502259ad0.pngPython代碼如下from scipy.spatial import distance distance.minkowski(vector_1, vector_2, p)

由于閔可夫斯基距離表示不同的距離度量,它就有與它們相同的主要缺點(diǎn),例如在高維空間的問題和對特征單位的依賴。此外,p值的靈活性也可能是一個缺點(diǎn),因?yàn)樗赡芙档陀?jì)算效率,因?yàn)檎业秸_的p值需要進(jìn)行多次計(jì)算。

5、余弦相似度和距離 Cosine similarity余弦相似度是方向的度量,他的大小由兩個向量之間的余弦決定,并且忽略了向量的大小。余弦相似度通常用于與數(shù)據(jù)大小無關(guān)緊要的高維,例如,推薦系統(tǒng)或文本分析。feac9fd0-5937-11ed-b116-dac502259ad0.png余弦相似度可以介于-1(相反方向)和1(相同方向)之間,計(jì)算方法為:febb1ccc-5937-11ed-b116-dac502259ad0.png余弦相似度常用于范圍在0到1之間的正空間中。余弦距離就是用1減去余弦相似度,位于0(相似值)和1(不同值)之間。Python代碼如下from scipy.spatial import distance distance.cosine(vector_1, vector_2)

余弦距離的主要缺點(diǎn)是它不考慮大小而只考慮向量的方向。因此,沒有充分考慮到值的差異。

6、半正矢距離 Haversine distance半正矢距離測量的是球面上兩點(diǎn)之間的最短距離。因此常用于導(dǎo)航,其中經(jīng)度和緯度和曲率對計(jì)算都有影響。fecaeb8e-5937-11ed-b116-dac502259ad0.png半正矢距離的公式如下:fee112c4-5937-11ed-b116-dac502259ad0.png其中r為球面半徑,φ和λ為經(jīng)度和緯度。Python代碼如下from sklearn.metrics.pairwise import haversine_distances haversine_distances([vector_1, vector_2])

半正矢距離的主要缺點(diǎn)是假設(shè)是一個球體,而這種情況很少出現(xiàn)。

7、漢明距離漢明距離衡量兩個二進(jìn)制向量或字符串之間的差異。feec7542-5937-11ed-b116-dac502259ad0.png對向量按元素進(jìn)行比較,并對差異的數(shù)量進(jìn)行平均。如果兩個向量相同,得到的距離是0之間,如果兩個向量完全不同,得到的距離是1。Python代碼如下from scipy.spatial import distance distance.hamming(vector_1, vector_2)

漢明距離有兩個主要缺點(diǎn)。距離測量只能比較相同長度的向量,它不能給出差異的大小。所以當(dāng)差異的大小很重要時,不建議使用漢明距離。


統(tǒng)計(jì)距離測量統(tǒng)計(jì)距離測量可用于假設(shè)檢驗(yàn)、擬合優(yōu)度檢驗(yàn)、分類任務(wù)或異常值檢測。8、杰卡德指數(shù)和距離 Jaccard IndexJaccard指數(shù)用于確定兩個樣本集之間的相似性。它反映了與整個數(shù)據(jù)集相比存在多少一對一匹配。Jaccard指數(shù)通常用于二進(jìn)制數(shù)據(jù)比如圖像識別的深度學(xué)習(xí)模型的預(yù)測與標(biāo)記數(shù)據(jù)進(jìn)行比較,或者根據(jù)單詞的重疊來比較文檔中的文本模式。fefb9f2c-5937-11ed-b116-dac502259ad0.pngJaccard距離的計(jì)算方法為:ff13c034-5937-11ed-b116-dac502259ad0.pngPython代碼如下from scipy.spatial import distance distance.jaccard(vector_1, vector_2)

Jaccard指數(shù)和距離的主要缺點(diǎn)是,它受到數(shù)據(jù)規(guī)模的強(qiáng)烈影響,即每個項(xiàng)目的權(quán)重與數(shù)據(jù)集的規(guī)模成反比。

9、Sorensen-Dice指數(shù)S?rensen-Dice指數(shù)類似于Jaccard指數(shù),它可以衡量的是樣本集的相似性和多樣性。該指數(shù)更直觀,因?yàn)樗?jì)算重疊的百分比。S?rensen-Dice索引常用于圖像分割和文本相似度分析。ff201f5a-5937-11ed-b116-dac502259ad0.png計(jì)算公式如下:ff31b65c-5937-11ed-b116-dac502259ad0.pngPython代碼如下from scipy.spatial import distance distance.dice(vector_1, vector_2)

它的主要缺點(diǎn)也是受數(shù)據(jù)集大小的影響很大。

10、動態(tài)時間規(guī)整 Dynamic Time Warping動態(tài)時間規(guī)整是測量兩個不同長度時間序列之間距離的一種重要方法??梢杂糜谒袝r間序列數(shù)據(jù)的用例,如語音識別或異常檢測。ff444e70-5937-11ed-b116-dac502259ad0.png為什么我們需要一個為時間序列進(jìn)行距離測量的度量呢?如果時間序列長度不同或失真,則上述面說到的其他距離測量無法確定良好的相似性。比如歐幾里得距離計(jì)算每個時間步長的兩個時間序列之間的距離。但是如果兩個時間序列的形狀相同但在時間上發(fā)生了偏移,那么盡管時間序列非常相似,但歐幾里得距離會表現(xiàn)出很大的差異。動態(tài)時間規(guī)整通過使用多對一或一對多映射來最小化兩個時間序列之間的總距離來避免這個問題。當(dāng)搜索最佳對齊時,這會產(chǎn)生更直觀的相似性度量。通過動態(tài)規(guī)劃找到一條彎曲的路徑最小化距離,該路徑必須滿足以下條件:邊界條件:彎曲路徑在兩個時間序列的起始點(diǎn)和結(jié)束點(diǎn)開始和結(jié)束單調(diào)性條件:保持點(diǎn)的時間順序,避免時間倒流連續(xù)條件:路徑轉(zhuǎn)換限制在相鄰的時間點(diǎn)上,避免時間跳躍整經(jīng)窗口條件(可選):允許的點(diǎn)落入給定寬度的整經(jīng)窗口坡度條件(可選):限制彎曲路徑坡度,避免極端運(yùn)動我們可以使用 Python 中的 fastdtw 包:from scipy.spatial.distance import euclidean from fastdtw import fastdtw ?distance, path = fastdtw(timeseries_1, timeseries_2, dist=euclidean)

動態(tài)時間規(guī)整的一個主要缺點(diǎn)是與其他距離測量方法相比,它的計(jì)算工作量相對較高。


總結(jié)在這篇文章中,簡要介紹了十種常用的距離測量方法。本文中已經(jīng)展示了它們是如何工作的,如何在Python中實(shí)現(xiàn)它們,以及經(jīng)常使用它們解決什么問題。如果你認(rèn)為我錯過了一個重要的距離測量,請留言告訴我。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    機(jī)器學(xué)習(xí)特征工程:分類變量的數(shù)值化處理方法

    編碼是機(jī)器學(xué)習(xí)流程里最容易被低估的環(huán)節(jié)之一,模型沒辦法直接處理文本形式的分類數(shù)據(jù),尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發(fā)表于 02-10 15:58 ?474次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>特征工程:分類變量的數(shù)值化處理<b class='flag-5'>方法</b>

    PCB中常用的快捷鍵

    + C取消高亮 ● Ctrl + G彈出捕捉格點(diǎn)對話框 ● Ctrl + M 測量距離 ● Ctrl + H PCB下選取某個網(wǎng)絡(luò)的布線,便于刪除同一網(wǎng)絡(luò)的布線 ● R + M 測量任意兩點(diǎn)間的距離
    發(fā)表于 01-30 06:01

    法蘭距離:相機(jī)鏡頭系統(tǒng)的關(guān)鍵參數(shù)

    在視覺領(lǐng)域,法蘭距是一重要的概念。它通常指的是相機(jī)鏡頭安裝法蘭的參考平面到成像傳感器的距離,這一參數(shù)在機(jī)器視覺領(lǐng)域充當(dāng)重要角色,法蘭距離的精準(zhǔn)性作為一
    的頭像 發(fā)表于 01-28 17:29 ?1450次閱讀
    法蘭<b class='flag-5'>距離</b>:相機(jī)鏡頭系統(tǒng)的關(guān)鍵參數(shù)

    vivado中常用時序約束指令介紹

    在vivado中,我們常用的時序約束指令主要包括如下幾個方面。
    的頭像 發(fā)表于 01-20 16:15 ?667次閱讀

    學(xué)習(xí)電子電路中常見的問題

    電子電路作為現(xiàn)代科技的基礎(chǔ),其學(xué)習(xí)過程中常會遇到各種理論和實(shí)踐問題。無論是初學(xué)者還是有一定經(jīng)驗(yàn)的工程師,都可能面臨電路設(shè)計(jì)、元器件選型、信號處理等方面的困惑。本文將系統(tǒng)梳理電子電路學(xué)習(xí)中常
    的頭像 發(fā)表于 01-20 07:38 ?483次閱讀

    自動駕駛中常提的模仿學(xué)習(xí)是什么?

    當(dāng)談及自動駕駛模型學(xué)習(xí)時,經(jīng)常會提到模仿學(xué)習(xí)的概念。所謂模仿學(xué)習(xí),就是模型先看別人怎么做,然后學(xué)著去做。自動駕駛中的模仿學(xué)習(xí),就是把人類司機(jī)在各種路況下的行為做成范例,記錄下看到了什么
    的頭像 發(fā)表于 01-16 16:41 ?2181次閱讀

    學(xué)習(xí)單片機(jī)快速方法

    的。首先你得知道你要學(xué)習(xí)什么樣的單片機(jī),我建議從80C51核心學(xué)起,80C51是MCS-51系列中的一典型品種;其它廠商以8051為基核開發(fā)出的CMOS工藝單片機(jī)產(chǎn)品統(tǒng)稱為80C51系列。當(dāng)前常用
    發(fā)表于 01-14 07:42

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?367次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 <b class='flag-5'>個</b>常見錯誤與局限性

    工業(yè)鏡頭測量中的“工作距離”是什么?

    工業(yè)鏡頭作為機(jī)器視覺系統(tǒng)中的核心組件,在自動化生產(chǎn)、質(zhì)量檢測和精密測量等領(lǐng)域發(fā)揮著關(guān)鍵作用。其中,“工作距離”(WorkingDistance,簡稱WD)是一至關(guān)重要的參數(shù),它直接影響系統(tǒng)
    的頭像 發(fā)表于 12-06 16:46 ?1165次閱讀
    工業(yè)鏡頭測量中的“工作<b class='flag-5'>距離</b>”是什么?

    自動駕駛中常提的“強(qiáng)化學(xué)習(xí)”是啥?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,有些方案中會提到“強(qiáng)化學(xué)習(xí)(Reinforcement Learning,簡稱RL)”,強(qiáng)化學(xué)習(xí)是一類讓機(jī)器通過試錯來學(xué)會做決策的技術(shù)。簡單理解
    的頭像 發(fā)表于 10-23 09:00 ?929次閱讀
    自動駕駛<b class='flag-5'>中常</b>提的“強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>”是<b class='flag-5'>個</b>啥?

    明治案例 | 10米長距離實(shí)時測量,傳輸“零干擾”

    到PLC的線纜距離過長(超過10米)導(dǎo)致信號受到干擾,測量數(shù)據(jù)偏差較大,直接引發(fā)板材定位偏差、設(shè)備停機(jī)等生產(chǎn)事故。技術(shù)挑戰(zhàn)1.長距離檢測與抗干擾:金屬板材表面反光
    的頭像 發(fā)表于 08-19 07:33 ?982次閱讀
    明治案例 | <b class='flag-5'>10</b>米長<b class='flag-5'>距離</b>實(shí)時測量,傳輸“零干擾”

    10公里超遠(yuǎn)距離傳輸,安信可LoRa模組的遠(yuǎn)、低、?。?/a>

    在沒有Wi-Fi、沒有4G、甚至沒有市電的地方,你的設(shè)備,還能互聯(lián)嗎? 回答是:能??縇oRa,能傳10公里遠(yuǎn)。 是的,你沒聽錯。 安信可推出的LoRa模組,空曠環(huán)境實(shí)測 傳輸距離可達(dá)10公里
    的頭像 發(fā)表于 08-06 15:12 ?2023次閱讀
    <b class='flag-5'>10</b>公里超遠(yuǎn)<b class='flag-5'>距離</b>傳輸,安信可LoRa模組的遠(yuǎn)、低、?。? />    </a>
</div>                              <div   id=

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?3115次閱讀

    如何檢測自動化設(shè)備中的直線導(dǎo)軌品質(zhì)是否優(yōu)良?

    直線導(dǎo)軌是機(jī)械系統(tǒng)中常用的一元件,廣泛應(yīng)用于工業(yè)、機(jī)床、數(shù)控機(jī)床、機(jī)器人等領(lǐng)域。
    的頭像 發(fā)表于 07-12 17:50 ?520次閱讀
    如何檢測自動化設(shè)備中的直線導(dǎo)軌品質(zhì)是否優(yōu)良?

    使用MATLAB進(jìn)行無監(jiān)督學(xué)習(xí)

    無監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無監(jiān)督學(xué)習(xí)旨在識別數(shù)據(jù)中隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗(yàn)知識。
    的頭像 發(fā)表于 05-16 14:48 ?1637次閱讀
    使用MATLAB進(jìn)行無監(jiān)督<b class='flag-5'>學(xué)習(xí)</b>
    奎屯市| 嘉荫县| 平凉市| 裕民县| 吴堡县| 南充市| 阿拉善盟| 女性| 南溪县| 清流县| 灌南县| 溆浦县| 南安市| 阆中市| 娄烦县| 荣昌县| 将乐县| 清镇市| 灵宝市| 镇雄县| 临城县| 唐山市| 瑞金市| 安仁县| 安龙县| 健康| 襄垣县| 根河市| 出国| 朝阳县| 庆阳市| 共和县| 武川县| 娱乐| 房山区| 陆河县| 通州区| 云霄县| 成安县| 鄂尔多斯市| 渭源县|