日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

電子發(fā)燒友App

硬聲App

掃碼添加小助手

加入工程師交流群

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
創(chuàng)作
電子發(fā)燒友網>電子資料下載>傳感與控制>梯度提升決策樹助力Facebook提升用戶體驗

梯度提升決策樹助力Facebook提升用戶體驗

2017-10-09 | rar | 0.7 MB | 次下載 | 1積分

資料介紹

 Facebook 使用機器學習和排序模型給所有用戶帶來最佳體驗,例如發(fā)送什么通知,在你的消息推送中放入什么文章,以及對于你想關注的人提些什么建議。高質量的機器學習模型對于找出最相關的內容來說很重要。我們觀察了大量實時信號以制定最佳排序;例如,在過濾通知的使用情況中,我們觀察某人是否已點擊相似的通知,或者對應通知的文章獲得了多少贊。由于每執(zhí)行一次就會生成一個新通知推送,所以我們想要盡快返回發(fā)送通知的決策。
  更復雜的模型有助于提高預測的精度,提供更相關的內容。但更復雜的模型需要更長的 CPU 周期(CPU cycles),返回結果的時間也更長??紤]到這些限制,我們做不到對所有可能的候選模型進行評估。然而,通過提升模型效率,我們可以做到在相同的時間幀運用相同的計算資源評價更多的候選模型(inventory)。
  在本文中,我們比較了梯度提升決策樹(gradient-boosted decision tree ,簡稱GBDT)這一類預測模型的不同實現(xiàn),并描述了能產生更高效評估的 C++ 多方面改進。
  決策樹模型
  決策樹被普遍用作預測模型,該算法將關于對象的特征觀察值映射到對象類的目標值。由于其非線性和快速求值的特點,它成為了機器學習、數(shù)據(jù)分析和統(tǒng)計學之中最常見的預測模型方法之一。在這些樹狀結構中,葉結點表征分類標簽,而有向邊表征產生這些分類標簽的特征連接。
  決策樹非常強大,但是訓練數(shù)據(jù)中的小變動可以演化為決策樹中的大變化。這可通過使用一項被稱為梯度提升(gradient boosting)的技術來補救。即,為錯誤分類的訓練實例提升權重,從而形成一個新的決策樹。接著對這一步驟進行連續(xù)重復以獲得新的決策樹。最后的分值(scores)是決策樹上每個葉節(jié)點分值的加權總和。
  模型通常很少更新,且訓練復雜模型需要花費數(shù)小時。然而,在 Facebook 的大規(guī)模數(shù)據(jù)上,我們想要更頻繁地更新模型,即按照毫秒間隔依次運行它們。Facebook 的很多后端服務是用 C++ 寫的,因此我們利用這一語言的一些屬性做了些改善,以產生只需要更短 CPU 周期進行求值的高效模型。
  下圖是一個簡單的決策樹,它包含以下特征:
  今天某人 A 點擊通知的數(shù)量(特征 F[0])
  對應通知的文章點贊數(shù)量(特征 F[1])
  某人 A 點擊通知的總數(shù)量(特征 F[2])
  在不同的結點,我們查看了上述特征的值,并遍歷整棵決策樹以獲取通知點擊的概率。
  
  平面樹(Flat tree)的實現(xiàn)
  決策樹模型的樸素實現(xiàn)是通過一個帶有指針的簡單二叉樹而完成的。然而,結點并不需要連續(xù)地存儲于內存之中,因為這樣二叉樹并非很有效。另一方面,決策樹通常是完整的二叉樹(即二叉樹的每個結點一定存在零值或兩棵子樹),它通過使用向量而壓縮存儲。指針并不需要空間,而每一結點的父結點和子結點可通過數(shù)組索引算法查看。我們將用這一實現(xiàn)對比這一章節(jié)的實驗。
  編譯樹(Compiled tree)的實現(xiàn)
  每一個二叉樹都能由一個復雜的三元表達式表征,而這個表達式能進行編譯并鏈接到可直接在服務中使用的動態(tài)庫(DLL)。需要注意的是,我們可以實時添加或更新決策樹模型,而不需要重啟服務。
  我們也可以利用 C++ 中的 LIKELY/UNLIKELY 注釋(annotations)。它們是編譯器發(fā)出指令的方向,并且能將分支預測更加偏向于跳轉指令(jump instruction)「可能」出現(xiàn)的一側。如果預測是對的,那么就意味著跳轉指令將占有 0 個 CPU 周期。我們可以根據(jù)在批量中排序的或離線分析中的真實樣本計算分支預測,這是因為訓練和評估集的分布不應該改變太多。
機器學習 排序模型
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1PC0805全集成單相無刷直流電機可編程閉環(huán)驅動器英文資料
  2. 0.59 MB   |  1次下載  |  免費
  3. 2變頻器維修資料大全
  4. 1.28 MB   |  1次下載  |  4 積分
  5. 3HD-1二合一恒電位儀的工作原理
  6. 0.01 MB   |  次下載  |  1 積分
  7. 4rk3562ddr4設計資料圖
  8. 0.74 MB   |  次下載  |  2 積分
  9. 5SQ33239 CPC8 ZVS 反激同步整流技術手冊
  10. 1.62 MB   |  次下載  |  免費
  11. 6變頻器維修入門
  12. 1.08 MB   |  次下載  |  4 積分
  13. 7SY5231 次級側同步整流技術手冊
  14. 0.89 MB   |  次下載  |  免費
  15. 8LT3580 升壓/反相DC/DC 帶2A開關的轉換器技術手冊
  16. 0.46 MB   |  次下載  |  免費

本月

  1. 1EMC PCB設計總結
  2. 0.33 MB   |  10次下載  |  免費
  3. 2耗盡型MOS FET產品目錄選型表
  4. 0.14 MB   |  4次下載  |  免費
  5. 3PD取電芯片 ECP5702規(guī)格書
  6. 0.88 MB   |  4次下載  |  免費
  7. 4九陽JYCP-21ZD-A主控板電路圖資料
  8. 2.33 MB   |  2次下載  |  10 積分
  9. 5氮化鎵GaN FET/GaN HEMT 功率驅動電路選型表
  10. 0.10 MB   |  2次下載  |  免費
  11. 6TI系列-米爾TI AM62L核心板開發(fā)板-高能效低功耗嵌入式平臺
  12. 1.51 MB  |  1次下載  |  免費
  13. 7PD取電芯片,可取5/9/12/15/20V電壓ECP5702數(shù)據(jù)手冊
  14. 0.88 MB   |  1次下載  |  免費
  15. 8飛騰S5000C-64雙路服務器系列應用宣傳冊--一乘科技
  16. 945.81 KB  |  1次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935137次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233095次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費下載
  8. 340992  |  191464次下載  |  10 積分
  9. 5十天學會AVR單片機與C語言視頻教程 下載
  10. 158M  |  183360次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81606次下載  |  10 積分
  13. 7Keil工具MDK-Arm免費下載
  14. 0.02 MB  |  73832次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分
图们市| 凤山市| 元江| 凉城县| 三江| 彩票| 华宁县| 台南市| 南靖县| 钟山县| 虞城县| 克什克腾旗| 虎林市| 崇信县| 桦南县| 南和县| 中阳县| 石河子市| 策勒县| 普安县| 绥化市| 凌源市| 济源市| 章丘市| 黄平县| 宜兴市| 泽库县| 文化| 瓦房店市| 开江县| 获嘉县| 朝阳县| 深圳市| 中江县| 建德市| 泰宁县| 新乡县| 巨鹿县| 大渡口区| 焦作市| 化德县|