日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

系統(tǒng)機(jī)器學(xué)習(xí)算法總結(jié)知識(shí)分享

zhKF_jqr_AI ? 來源:未知 ? 作者:steve ? 2017-12-15 14:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Statsbot數(shù)據(jù)科學(xué)家Daniil Korbut簡(jiǎn)明扼要地介紹了用于推薦系統(tǒng)的主流機(jī)器學(xué)習(xí)算法:協(xié)同過濾、矩陣分解、聚類、深度學(xué)習(xí)。

現(xiàn)在有許多公司使用大數(shù)據(jù)來制定高度相關(guān)的建議以提高收入。數(shù)據(jù)科學(xué)家需要根據(jù)業(yè)務(wù)的限制和需求,在各種推薦算法中選擇最好的算法。

為了簡(jiǎn)化這一任務(wù),Statsbot團(tuán)隊(duì)準(zhǔn)備了一份現(xiàn)有主要推薦系統(tǒng)算法的概覽。

協(xié)同過濾

協(xié)同過濾(collaborative filtering, CF)及其改版是最常用的推薦算法之一。 即使是數(shù)據(jù)科學(xué)初學(xué)者也可以使用它來構(gòu)建他們的個(gè)人電影推薦系統(tǒng),比如用它寫一個(gè)簡(jiǎn)歷項(xiàng)目。

當(dāng)我們想向用戶推薦東西時(shí),最符合邏輯的做法是找到有相似興趣的人,分析他們的行為,然后給我們的用戶推薦相同的東西。 或者我們可以查看與用戶之前所購(gòu)類似的物品,并進(jìn)行相應(yīng)的推薦。

這正是CF的兩種基本方法:基于用戶的協(xié)作過濾和基于物品的協(xié)作過濾。

在這兩種情形下,推薦引擎分兩步:

  1. 找出數(shù)據(jù)庫(kù)中有多少用戶/物品與給定的用戶/物品類似。

  2. 評(píng)估其他用戶/物品,這一評(píng)估基于比待評(píng)估用戶/物品更相似的用戶/物品的總權(quán)重,以預(yù)測(cè)給用戶推薦相應(yīng)產(chǎn)品的評(píng)分。

算法中的“最相似”是什么意思?

假設(shè)我們有一個(gè)表示每個(gè)用戶的偏好的向量(矩陣 R的行)和一個(gè)表示用戶給每件產(chǎn)品評(píng)分的向量(矩陣 R的列)。

首先,讓我們?nèi)コ恍┰?,只保留兩個(gè)向量中值均已知的元素。

例如,如果我們想比較比爾和簡(jiǎn),我們可以看到,比爾還沒有看過《泰坦尼克號(hào)》,而簡(jiǎn)到現(xiàn)在為止還沒看過《蝙蝠俠》,所以我們只能通過《星球大戰(zhàn)》來衡量他們的相似性。怎么會(huì)有人不看《星球大戰(zhàn)》,是吧?:)

最流行的衡量相似性的技術(shù)是用戶/物品向量之間的余弦相似性或加權(quán)平均數(shù)。

矩陣分解

下一個(gè)有趣的算法是矩陣分解。這是一個(gè)非常優(yōu)雅的推薦算法,因?yàn)槭褂镁仃嚪纸鈺r(shí)通常不用考慮要在結(jié)果矩陣的列和行中保留的物品。

u是第i個(gè)用戶的興趣向量,v是表示第j部電影的參數(shù)的向量。因此,我們可以使用u和v的點(diǎn)積來逼近x(第i個(gè)用戶對(duì)第j部電影的評(píng)分)。我們使用已知評(píng)分來構(gòu)建這些向量,并使用它們來預(yù)測(cè)未知評(píng)分。

例如,我們有表示用戶特德的向量(1.4; .9)和表示電影A的向量(1.4; .8),矩陣分解之后我們可以直接通過計(jì)算(1.4; .9)和(1.4; .8)的點(diǎn)積來還原電影A——特德的評(píng)分,結(jié)果為2.68。

聚類

前面兩個(gè)推薦算法非常簡(jiǎn)單,比較適合小型系統(tǒng)。到目前為止,我們將推薦問題看作一個(gè)監(jiān)督學(xué)習(xí)任務(wù)?,F(xiàn)在到了應(yīng)用無監(jiān)督方法來解決這個(gè)問題的時(shí)候了。

想象一下,我們正在建立一個(gè)大型推薦系統(tǒng),協(xié)同過濾和矩陣分解會(huì)花很長(zhǎng)時(shí)間。這時(shí)第一個(gè)想到的應(yīng)該是聚類(clustering)。

根據(jù)屬于同一聚類的所有客戶的偏好,每個(gè)聚類會(huì)被分配一個(gè)典型偏好。每個(gè)聚類中的客戶將收到在聚類層次計(jì)算出的推薦。

業(yè)務(wù)初期缺乏用戶評(píng)分,因此聚類會(huì)是最佳選擇。

不過,單獨(dú)使用的話,聚類有點(diǎn)弱。因?yàn)橥ㄟ^聚類,我們識(shí)別出用戶群組,然后給同一群組中的每個(gè)用戶都推薦相同的物品。當(dāng)我們有足夠多的數(shù)據(jù)的時(shí)候,更好的選擇是將聚類作為第一步,用來調(diào)整相關(guān)用戶/物品選取,以供協(xié)同過濾算法使用。聚類也能提升復(fù)雜推薦系統(tǒng)的性能。

深度學(xué)習(xí)

十年來,神經(jīng)網(wǎng)絡(luò)有一個(gè)巨大的飛躍。今天,神經(jīng)網(wǎng)絡(luò)被應(yīng)用到許多領(lǐng)域,正逐漸取代傳統(tǒng)的機(jī)器學(xué)習(xí)方法。我想談一下YouTube使用的深度學(xué)習(xí)方法。

毫無疑問,為這樣的服務(wù)打造推薦系統(tǒng)是一項(xiàng)非常具有挑戰(zhàn)性的任務(wù),因?yàn)檫@一服務(wù)的規(guī)模很大,語料庫(kù)是動(dòng)態(tài)的,還有各種難以觀察的外部因素。

根據(jù)《YouTube推薦系統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)》,YouTube推薦系統(tǒng)算法包括兩個(gè)神經(jīng)網(wǎng)絡(luò):一個(gè)用于生成候選視頻,另一個(gè)用于排名。如果你沒有足夠的時(shí)間閱讀上面的論文,我這里有一個(gè)快速總結(jié)。

接受用戶的歷史事件作為輸入,候選生成網(wǎng)絡(luò)顯著減少了視頻的數(shù)量,從一個(gè)巨大的語料庫(kù)抽取出一組相關(guān)性最高的視頻。生成的候選視頻是最和用戶相關(guān)的,我們即將預(yù)測(cè)用戶給候選視頻的評(píng)分。這個(gè)網(wǎng)絡(luò)的目標(biāo)只是通過協(xié)同過濾來提供一些范圍較廣的個(gè)性化候選視頻。

接下來我們需要更仔細(xì)地分析這些候選視頻,以挑選出其中最好的視頻。我們通過評(píng)分網(wǎng)絡(luò)完成這一任務(wù),評(píng)分網(wǎng)絡(luò)可以通過一個(gè)期望目標(biāo)函數(shù)給每個(gè)視頻賦值一個(gè)分?jǐn)?shù),該期望目標(biāo)函數(shù)使用描述視頻的數(shù)據(jù)和有關(guān)用戶行為的信息。評(píng)分最高的那些視頻將被推薦給用戶。

使用這一兩步方法,我們可以基于一個(gè)非常巨大的視頻語料庫(kù)推薦視頻,同時(shí)保證推薦的少量視頻是個(gè)性化的。這一設(shè)計(jì)也允許我們混合從其他來源生成的候選視頻。

這一推薦任務(wù)構(gòu)成了一個(gè)極端多類分類(extreme multiclass classification)問題,基于用戶(U)和情境(C)精確地分類在給定時(shí)刻t觀看(wt)的特定視頻,這一視頻取自一個(gè)語料庫(kù)(V),總共有數(shù)百萬的視頻類別(i)。

構(gòu)建你自己的推薦系統(tǒng)

  • 基于大型數(shù)據(jù)庫(kù)的在線推薦,最好的辦法是將這個(gè)問題拆分成兩個(gè)子問題:1)選擇排名最高的N個(gè)候選 2)對(duì)它們進(jìn)行評(píng)分。

  • 如何評(píng)估模型質(zhì)量?除了標(biāo)準(zhǔn)的質(zhì)量指標(biāo)之外,還有一些特別針對(duì)推薦問題的指標(biāo):Recall at K和Precision at K,Average Recall at K和Average Precision at K。另外可以參考《A Survey of Accuracy Evaluation Metrics of Recommendation Task》(JMLR 10 (2009))

  • 如果使用分類算法解決推薦問題,則應(yīng)考慮生成負(fù)樣本。如果用戶購(gòu)買了推薦的物品,不應(yīng)將其作為正樣本,也不應(yīng)將未購(gòu)買的推薦物品作為負(fù)樣本。

  • 基于在線分?jǐn)?shù)和離線分?jǐn)?shù)考量算法質(zhì)量。 僅使用歷史數(shù)據(jù)的訓(xùn)練模型可能導(dǎo)向簡(jiǎn)陋的推薦系統(tǒng),因?yàn)樵撍惴ú恢佬碌某绷骱推谩?/p>


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 聚類
    +關(guān)注

    關(guān)注

    0

    文章

    146

    瀏覽量

    14796
  • 協(xié)同過濾
    +關(guān)注

    關(guān)注

    0

    文章

    45

    瀏覽量

    10170
  • 矩陣分解
    +關(guān)注

    關(guān)注

    1

    文章

    13

    瀏覽量

    3789

原文標(biāo)題:推薦系統(tǒng)機(jī)器學(xué)習(xí)算法概覽

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)質(zhì)量雙保障:從“驗(yàn)證”到“標(biāo)記”

    機(jī)器學(xué)習(xí)的世界里,有句老話尤為貼切:“garbagein,garbageout”(輸入垃圾,輸出垃圾)。無論模型架構(gòu)多先進(jìn)、算法多精妙,數(shù)據(jù)的質(zhì)量始終是決定模型性能的核心。本文聚焦數(shù)據(jù)處理中兩個(gè)
    的頭像 發(fā)表于 04-24 15:48 ?110次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>中的數(shù)據(jù)質(zhì)量雙保障:從“驗(yàn)證”到“標(biāo)記”

    AI 算法核心知識(shí)清單(深度實(shí)戰(zhàn)版2)

    三、機(jī)器學(xué)習(xí)核心算法(入門到實(shí)戰(zhàn))?1.監(jiān)督學(xué)習(xí)算法(已知標(biāo)簽的模型訓(xùn)練)?線性模型?線性回歸(回歸任務(wù)):?核心原理:假設(shè)y=w?+w?x
    的頭像 發(fā)表于 04-24 11:58 ?213次閱讀
    AI <b class='flag-5'>算法</b>核心<b class='flag-5'>知識(shí)</b>清單(深度實(shí)戰(zhàn)版2)

    MOSFET管開關(guān)電路基本知識(shí)總結(jié)

    總結(jié)以上知識(shí),在選MOSFET開關(guān)時(shí),首先選MOS管的VDS電壓,和其VGS開啟電壓,再就是ID電流值是否滿足系統(tǒng)需要,然后再考慮封裝了,功耗了,價(jià)格了之類次要一些的因素了,以上是用P溝道MOS管做的例子,N溝道的其實(shí)也是基本上
    的頭像 發(fā)表于 04-20 11:26 ?372次閱讀
    MOSFET管開關(guān)電路基本<b class='flag-5'>知識(shí)</b><b class='flag-5'>總結(jié)</b>

    鋰電企業(yè)必看!如何通過知識(shí)驅(qū)動(dòng)的具身智能工業(yè)機(jī)器人實(shí)現(xiàn)物流“零事故、零延誤”停靠

    本文聚焦鋰電車間復(fù)雜環(huán)境下的物流機(jī)器人作業(yè)難題,系統(tǒng)分析了自動(dòng)避障與精準(zhǔn)??康募夹g(shù)瓶頸。結(jié)合富唯智能知識(shí)驅(qū)動(dòng)技術(shù)框架,深入探討具身智能工業(yè)機(jī)器人如何通過3D視覺感知與AI決策
    的頭像 發(fā)表于 03-25 17:15 ?497次閱讀

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學(xué)科的技能,涵蓋數(shù)學(xué)基礎(chǔ)、編程能力、算法理論、工程實(shí)踐以及業(yè)務(wù)理解等多個(gè)方面。 以下是具體技能及學(xué)習(xí)建議: 線性代數(shù)核心內(nèi)容:矩陣運(yùn)算、特征值分解、向量空間等。應(yīng)用場(chǎng)
    發(fā)表于 02-27 10:53

    穿孔機(jī)頂頭檢測(cè)儀 機(jī)器視覺深度學(xué)習(xí)

    LX01Z-DG626穿孔機(jī)頂頭檢測(cè)儀采用深度學(xué)習(xí)技術(shù),能夠?qū)崿F(xiàn)頂頭狀態(tài)的在線實(shí)時(shí)檢測(cè),頂頭丟失報(bào)警,頂頭異常狀態(tài)報(bào)警等功能,響應(yīng)迅速,異常狀態(tài)視頻回溯,檢測(cè)頂頭溫度,配備吹掃清潔系統(tǒng),維護(hù)周期長(zhǎng)
    發(fā)表于 12-22 14:33

    量子機(jī)器學(xué)習(xí)入門:三種數(shù)據(jù)編碼方法對(duì)比與應(yīng)用

    在傳統(tǒng)機(jī)器學(xué)習(xí)中數(shù)據(jù)編碼確實(shí)相對(duì)直觀:獨(dú)熱編碼處理類別變量,標(biāo)準(zhǔn)化調(diào)整數(shù)值范圍,然后直接輸入模型訓(xùn)練。整個(gè)過程更像是數(shù)據(jù)清洗,而非核心算法組件。量子機(jī)器
    的頭像 發(fā)表于 09-15 10:27 ?987次閱讀
    量子<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>入門:三種數(shù)據(jù)編碼方法對(duì)比與應(yīng)用

    AI 驅(qū)動(dòng)三維逆向:點(diǎn)云降噪算法工具與機(jī)器學(xué)習(xí)建模能力的前沿應(yīng)用

    在三維逆向工程領(lǐng)域,傳統(tǒng)方法在處理復(fù)雜數(shù)據(jù)和構(gòu)建高精度模型時(shí)面臨諸多挑戰(zhàn)。隨著人工智能(AI)技術(shù)的發(fā)展,點(diǎn)云降噪算法工具與機(jī)器學(xué)習(xí)建模能力的應(yīng)用,為三維逆向工程帶來了創(chuàng)新性解決方案,顯著提升
    的頭像 發(fā)表于 08-20 10:00 ?879次閱讀
    AI 驅(qū)動(dòng)三維逆向:點(diǎn)云降噪<b class='flag-5'>算法</b>工具與<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>建模能力的前沿應(yīng)用

    PID控制算法學(xué)習(xí)筆記資料

    用于新手學(xué)習(xí)PID控制算法
    發(fā)表于 08-12 16:22 ?7次下載

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競(jìng)爭(zhēng)對(duì)手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    ,越來越多地被應(yīng)用于機(jī)器學(xué)習(xí)任務(wù)中。本文將探討 FPGA 在機(jī)器學(xué)習(xí)中的應(yīng)用,特別是在加速神經(jīng)網(wǎng)絡(luò)推理、優(yōu)化算法和提升處理效率方面的優(yōu)勢(shì)。
    的頭像 發(fā)表于 07-16 15:34 ?3113次閱讀

    【嘉楠堪智K230開發(fā)板試用體驗(yàn)】K230機(jī)器視覺相關(guān)功能體驗(yàn)

    K230開發(fā)板攝像頭及AI功能測(cè)評(píng) 攝像頭作為機(jī)器視覺應(yīng)用的基礎(chǔ),能夠給機(jī)器學(xué)習(xí)模型提供輸入,提供輸入的質(zhì)量直接影響機(jī)器學(xué)習(xí)模型的效果。 K
    發(fā)表于 07-08 17:25

    機(jī)器學(xué)習(xí)異常檢測(cè)實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建無標(biāo)簽異常檢測(cè)系統(tǒng)

    本文轉(zhuǎn)自:DeepHubIMBA無監(jiān)督異常檢測(cè)作為機(jī)器學(xué)習(xí)領(lǐng)域的重要分支,專門用于在缺乏標(biāo)記數(shù)據(jù)的環(huán)境中識(shí)別異常事件。本文深入探討異常檢測(cè)技術(shù)的理論基礎(chǔ)與實(shí)踐應(yīng)用,通過IsolationForest
    的頭像 發(fā)表于 06-24 11:40 ?1619次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>異常檢測(cè)實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建無標(biāo)簽異常檢測(cè)<b class='flag-5'>系統(tǒng)</b>

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    通過網(wǎng)絡(luò)連接云端服務(wù)器進(jìn)行快速檢索和分析,然后利用語音合成技術(shù)將答案以自然流暢的語音反饋給用戶。同時(shí),借助開發(fā)板的網(wǎng)絡(luò)連接功能,語音機(jī)器人還可以與后臺(tái)管理系統(tǒng)進(jìn)行數(shù)據(jù)交互,實(shí)時(shí)更新知識(shí)庫(kù)和優(yōu)化服務(wù)策略
    發(fā)表于 05-28 11:36

    使用MATLAB進(jìn)行無監(jiān)督學(xué)習(xí)

    無監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無監(jiān)督學(xué)習(xí)旨在識(shí)別數(shù)據(jù)中隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗(yàn)知識(shí)。
    的頭像 發(fā)表于 05-16 14:48 ?1631次閱讀
    使用MATLAB進(jìn)行無監(jiān)督<b class='flag-5'>學(xué)習(xí)</b>
    三河市| 大英县| 卢龙县| 图们市| 扎赉特旗| 宣化县| 大埔区| 青浦区| 罗田县| 五台县| 杭州市| 库尔勒市| 德令哈市| 固安县| 威远县| 淅川县| 怀集县| 西和县| 平谷区| 常宁市| 嘉义市| 海原县| 馆陶县| 乌恰县| 汾西县| 水富县| 忻城县| 武胜县| 新泰市| 宣武区| 巩义市| 寿阳县| 施秉县| 建德市| 阿城市| 修水县| 海门市| 当涂县| 保亭| 陕西省| 土默特右旗|