日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

K-MEANS聚類算法概述及工作原理

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-06-06 11:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

K-means 是一種聚類算法,且對于數(shù)據(jù)科學(xué)家而言,是簡單且熱門的無監(jiān)督式機(jī)器學(xué)習(xí)(ML)算法之一。

什么是 K-MEANS?

無監(jiān)督式學(xué)習(xí)算法嘗試在無標(biāo)記數(shù)據(jù)集中“學(xué)習(xí)”模式,發(fā)現(xiàn)相似性或規(guī)律。常見的無監(jiān)督式任務(wù)包括聚類和關(guān)聯(lián)。K-means 等聚類算法試圖通過分組對象來發(fā)現(xiàn)數(shù)據(jù)集中的相似性,與不同集群間的對象相似性相比,同一集群中對象之間的相似性更高。使用最小距離、數(shù)據(jù)點(diǎn)密度、圖形或各種統(tǒng)計(jì)分布等標(biāo)準(zhǔn)將其分組為集群。

K-means 通過最小化幾何點(diǎn)之間的平均距離將相似數(shù)據(jù)點(diǎn)分組成集群。為此,它以迭代方式將數(shù)據(jù)集分為非重疊子組(或集群)的固定數(shù)量 (K),其中每個數(shù)據(jù)點(diǎn)均屬于集群中心均值最近的集群。

為何選擇 K-MEANS?

K-means 是一種聚類算法,部署后可用于發(fā)現(xiàn)數(shù)據(jù)中尚未明確標(biāo)記的組。目前,它已廣泛應(yīng)用于各種商業(yè)應(yīng)用,包括:

客戶分割:可以對客戶進(jìn)行分組,以便更好地定制產(chǎn)品。

文本、文檔或搜索結(jié)果聚類:分組以查找文本中的主題。

圖像分組或圖像壓縮:圖像或顏色相似的組。

異常檢測:從集群中找出不相似的地方或異常值

半監(jiān)督式學(xué)習(xí):將集群與一組較小的已標(biāo)記數(shù)據(jù)和監(jiān)督式機(jī)器學(xué)習(xí)相結(jié)合,以獲得更有價(jià)值的結(jié)果。

K-MEANS 的工作原理

K-means 算法能夠識別數(shù)據(jù)集中一定數(shù)量的中心,而中心屬于特定集群所有數(shù)據(jù)點(diǎn)的算術(shù)平均值。然后,算法將每個數(shù)據(jù)點(diǎn)分配給最近的集群,因?yàn)槠鋰L試保持盡可能小的集群(K-means 中的“means”是指計(jì)算數(shù)據(jù)平均值或查找中心的任務(wù))。同時(shí),K-means 嘗試保持其他集群盡可能不同。

在實(shí)踐中,其工作原理如下:

K-means 算法首先將所有坐標(biāo)初始化為“K”集群中心。(K 值是一個輸入變量,位置也可以作為輸入變量。)

每經(jīng)過一次算法,每個點(diǎn)都會分配給其最近的集群中心。

然后,集群中心會被更新為在該經(jīng)過中分配給其的所有點(diǎn)的“中心”。這是通過重新計(jì)算集群中心作為各自集群中點(diǎn)的平均值來實(shí)現(xiàn)的。

算法會重復(fù)執(zhí)行,直到上次迭代的集群中心發(fā)生最小變化。

如果集群呈現(xiàn)一致的球形形狀,說明 K-means 在捕獲結(jié)構(gòu)和進(jìn)行數(shù)據(jù)推理方面非常有效。但是,如果集群呈現(xiàn)更復(fù)雜的幾何形狀,那就說明算法在數(shù)據(jù)聚類方面做得不好。K-means 的另一個缺點(diǎn)是,該算法不允許彼此距離較遠(yuǎn)的數(shù)據(jù)點(diǎn)共享同一集群,而不管它們是否屬于該集群。K-means 本身不會從數(shù)據(jù)中了解到集群數(shù)量,而是必須預(yù)先定義信息。最后,當(dāng)集群之間出現(xiàn)重疊時(shí),K-means 無法確定如何分配重疊位置的數(shù)據(jù)點(diǎn)。

適用于數(shù)據(jù)科學(xué)家的 K-MEANS

由于其內(nèi)在的簡單性以及在無監(jiān)督機(jī)器學(xué)習(xí)操作中的普及,K-means 在數(shù)據(jù)科學(xué)家中大受青睞。盡管該算法存在局限性,但其在數(shù)據(jù)挖掘操作中的適用性允許數(shù)據(jù)科學(xué)家利用該算法從業(yè)務(wù)數(shù)據(jù)中衍生出各種推理,實(shí)現(xiàn)更準(zhǔn)確的數(shù)據(jù)驅(qū)動決策。它被廣泛認(rèn)為是數(shù)據(jù)科學(xué)家最具商業(yè)重要性的算法之一。

使用 GPU 加速聚類

聚類在各種應(yīng)用程序中發(fā)揮著關(guān)鍵作用,但由于數(shù)據(jù)量不斷增加,其正面臨著計(jì)算挑戰(zhàn)。解決計(jì)算難題的極具前景的解決方案之一,即使用 GPU 進(jìn)行并行計(jì)算。

在架構(gòu)方面,CPU 僅由幾個具有大緩存內(nèi)存的核心組成,一次只可以處理幾個軟件線程。相比之下,GPU 由數(shù)百個核心組成,可以同時(shí)處理數(shù)千個線程。GPU 具有大規(guī)模并行性,并且顯存訪問帶寬優(yōu)勢顯著,因此十分適用于加速數(shù)據(jù)密集型分析。

GPU 加速的端到端數(shù)據(jù)科學(xué)

基于 CUDA 構(gòu)建的 RAPIDS 開源軟件庫套件使您能夠完全在 GPU 上執(zhí)行端到端數(shù)據(jù)科學(xué)和分析流程,同時(shí)仍然使用 Pandas 和 Scikit-Learn API 等熟悉的界面。

RAPIDS cuML 的機(jī)器學(xué)習(xí)算法和數(shù)學(xué)基元遵循熟悉的類似于 scikit-learn 的 API。單塊 GPU 和大型數(shù)據(jù)中心部署均支持 K-means、XGBoost 等主流算法。針對大型數(shù)據(jù)集,相較于同等功效的 CPU,這些基于 GPU 的實(shí)施方案能夠以 10 到 50 倍的速度更快地完成任務(wù)。

借助 RAPIDS GPU DataFrame,數(shù)據(jù)可以通過一個類似 Pandas 的接口加載到 GPU 上,然后用于各種連接的機(jī)器學(xué)習(xí)和圖形分析算法,而無需離開 GPU。這種級別的互操作性是通過 Apache Arrow 這樣的庫實(shí)現(xiàn)的。這可加速端到端流程(從數(shù)據(jù)準(zhǔn)備到機(jī)器學(xué)習(xí),再到深度學(xué)習(xí))。

RAPIDS 支持在許多熱門數(shù)據(jù)科學(xué)庫之間共享設(shè)備內(nèi)存。這樣可將數(shù)據(jù)保留在 GPU 上,并省去了來回復(fù)制主機(jī)內(nèi)存的高昂成本。

原文標(biāo)題:NVIDIA 大講堂 | 什么是 K-MEANS?

文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11332

    瀏覽量

    225992
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110142
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4810

    瀏覽量

    98610
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137257

原文標(biāo)題:NVIDIA 大講堂 | 什么是 K-MEANS?

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    433M無線模塊的工作原理和距離

    一、工作原理  433MHz無線模塊的工作原理是通過發(fā)射器和接收器之間的模擬信號進(jìn)行無線通信。具體來說,它由發(fā)射器和接收器兩部分組成,這兩部分通過433MHz的模擬信號進(jìn)行通信。發(fā)射器工作原理
    發(fā)表于 04-10 14:44

    算法工程師需要具備哪些技能?

    :自動化任務(wù)(如數(shù)據(jù)預(yù)處理、模型訓(xùn)練調(diào)度)。Git版本控制:團(tuán)隊(duì)協(xié)作開發(fā)(如分支管理、代碼合并)。 機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí):線性回歸、邏輯回歸、決策樹、SVM等。無監(jiān)督學(xué)習(xí):K-Means)、降維
    發(fā)表于 02-27 10:53

    使用K-means算法進(jìn)行異常偵測

    本帖最后由 jf_77210199 于 2026-1-19 09:48 編輯 使用K-means算法進(jìn)行異常偵測 本案例運(yùn)行于 AT32F403A MCU 平臺,利用 LSM6DS3TR-C
    發(fā)表于 01-16 14:09

    無線充電器的工作原理核心

    無線充電器的工作原理核心
    的頭像 發(fā)表于 12-06 10:19 ?1992次閱讀
    無線充電器的<b class='flag-5'>工作原理</b>核心

    一文看懂ups電源有什么工作原理

    UPS(不間斷電源)的核心工作原理是通過整流-儲能-逆變的能量轉(zhuǎn)換鏈路,結(jié)合電池儲能與智能切換技術(shù),實(shí)現(xiàn)市電中斷時(shí)的“無縫供電”。其技術(shù)架構(gòu)可分為在線式、后備式、在線互動式三大,每類在能量流動路徑
    的頭像 發(fā)表于 11-10 08:49 ?3990次閱讀
    一文看懂ups電源有什么<b class='flag-5'>工作原理</b>

    國密系列算法簡介及SM4算法原理介紹

    算法可用于無線局域網(wǎng)產(chǎn)品;SM7算法可用于身份識別、票務(wù)、支付與通卡業(yè)務(wù)。ZUC算法可用于移動通信網(wǎng)絡(luò)。 密碼雜湊算法:SM3
    發(fā)表于 10-24 08:25

    K8s存儲設(shè)計(jì)與Ceph集成實(shí)戰(zhàn)

    在云原生時(shí)代,存儲是制約應(yīng)用性能的關(guān)鍵瓶頸。本文將帶你深入理解K8s存儲的設(shè)計(jì)原理,并手把手實(shí)現(xiàn)與Ceph的完美集成,讓你的集群存儲性能提升300%!
    的頭像 發(fā)表于 08-22 11:50 ?1133次閱讀

    光伏建筑一體化BIPV:透射率與光伏發(fā)電效率的應(yīng)用研究

    關(guān)鍵變量,通過仿真評估采光充足度(sDA)、眩光空間自主率(sGA)和光伏發(fā)電效率(EP_e)并尋找帕累托最優(yōu)解。最后采用K-means算法對結(jié)果進(jìn)行分析。Fl
    的頭像 發(fā)表于 07-22 09:52 ?2512次閱讀
    光伏建筑一體化BIPV:透射率與光伏發(fā)電效率的應(yīng)用研究

    晶體管光耦的工作原理

    器件的特性。工作原理概述1.發(fā)光器件:晶體管光耦通常包含一個發(fā)光二極管(LED)作為光源。當(dāng)電流通過LED時(shí),它會發(fā)出特定波長的光。2.光敏器件:光耦的另一側(cè)是一個
    的頭像 發(fā)表于 06-20 15:15 ?1224次閱讀
    晶體管光耦的<b class='flag-5'>工作原理</b>

    k210在線訓(xùn)練的算法是yolo5嗎?

    k210在線訓(xùn)練的算法是yolo5嗎
    發(fā)表于 06-16 08:25

    管道浮力平衡壓袋(配重壓袋)工作原理

    管道浮力平衡壓袋(配重壓袋)工作原理
    發(fā)表于 06-12 15:09 ?0次下載

    詳析模擬與數(shù)字微波移相器的工作原理及特性

    的SYN649系列移相器在通信、雷達(dá)、儀器儀表等眾多領(lǐng)域發(fā)揮著關(guān)鍵作用。本文將聚焦模擬與數(shù)字微波移相器,探討其工作原理與特性。 一、工作原理 模擬移相器模擬移相原理:早期模擬移相器利用傳輸介質(zhì)對傳導(dǎo)波動引入相移的特性。例如
    的頭像 發(fā)表于 06-03 17:24 ?1145次閱讀

    FLASH的工作原理與應(yīng)用

    14FLASHFLASH的工作原理與應(yīng)用OWEIS1什么是FLASH?Flash閃存是一種非易失性半導(dǎo)體存儲器,它結(jié)合了ROM(只讀存儲器)和RAM(隨機(jī)訪問存儲器)的優(yōu)點(diǎn),具有電子可擦除和可編程
    的頭像 發(fā)表于 05-27 13:10 ?2452次閱讀
    FLASH的<b class='flag-5'>工作原理</b>與應(yīng)用

    GPIO配置的工作原理是什么?

    我使用 EZ-USB 配置實(shí)用程序,我想知道是否有人知道 GPIO 配置的工作原理。 例如,GPIO0 可以用作傳感器復(fù)位,我知道這個 GPIO0 用于重置傳感器,但我不明白的是選項(xiàng)用戶 GPIO 例如GPIO 1可以是User GPIO0,這是什么意思呢?
    發(fā)表于 05-19 06:56

    電動調(diào)壓器的工作原理

    電壓調(diào)壓器是一種用于控制電路中電壓的裝置,其工作原理因類型而異,以下是幾種常見電壓調(diào)壓器的工作原理
    的頭像 發(fā)表于 05-12 13:46 ?1655次閱讀
    電動調(diào)壓器的<b class='flag-5'>工作原理</b>
    浏阳市| 宜兰县| 视频| 阜城县| 四平市| 深泽县| 浦城县| 秦安县| 天镇县| 阜城县| 彝良县| 岑溪市| 旌德县| 新民市| 富平县| 诏安县| 福清市| 阿尔山市| 繁昌县| 三门县| 页游| 建宁县| 通河县| 普陀区| 定结县| 紫阳县| 岚皋县| 昆明市| 安宁市| 武鸣县| 仁怀市| 蓬安县| 陆河县| 景泰县| 乌什县| 邯郸市| 镇平县| 广河县| 漠河县| 桐梓县| 海晏县|