日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

模型不起作用時的解決辦法

汽車玩家 ? 來源:人工智能遇見磐創(chuàng) ? 作者:人工智能遇見磐創(chuàng) ? 2020-05-04 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

你的團(tuán)隊幾個月來一直在收集數(shù)據(jù)、構(gòu)建預(yù)測模型、創(chuàng)建用戶界面,并與一些早期的用戶一起部署新的機(jī)器學(xué)習(xí)產(chǎn)品。但你現(xiàn)在聽到的并不是大家一起慶祝項目勝利的聲音,而是聽到產(chǎn)品經(jīng)理對那些早期用戶的抱怨,這些早期用戶對模型精度不滿意并開始認(rèn)為“模型不起作用”。所以你現(xiàn)在應(yīng)該做什么?

我們常常在很多模式識別實驗室里給相關(guān)組織應(yīng)用機(jī)器學(xué)習(xí)算法到新產(chǎn)品見到這種情況。這不是一個容易迅速解決的問題。真實世界的機(jī)器學(xué)習(xí)模型的性能受到許多因素的影響,其中一些因素可能在控制之下,而另一些因素則可能不在控制之下。最重要的是,當(dāng)試圖對真實世界的現(xiàn)象建模時,每個建模問題都有一個固有的噪聲或隨機(jī)性被混合在信號中,這使得很難理解我們使用一個預(yù)測模型真正能夠達(dá)到的準(zhǔn)確度。再加上用戶對你的模型準(zhǔn)確性的期望,你的數(shù)據(jù)科學(xué)團(tuán)隊就突然陷入了一個棘手的境地,并試圖找出從哪里開始解決問題。

1. 了解要解決的問題

首先要確保團(tuán)隊對他們試圖用模型解決的用戶問題有很好的理解。令人驚訝的是,數(shù)據(jù)科學(xué)團(tuán)隊對成功的定義的理解與用戶的標(biāo)準(zhǔn)經(jīng)常不同。最近,我們與一家公司合作,試圖預(yù)測惡劣天氣對公用事業(yè)公司運營的影響。技術(shù)團(tuán)隊絞盡腦汁想要提高他們模型的MAPE分?jǐn)?shù)。當(dāng)我們深入研究時,我們發(fā)現(xiàn)MAPE根本不是正確的度量標(biāo)準(zhǔn),他們所追求的目標(biāo)是他們自己設(shè)定的(而不是傾聽用戶的意見)。用戶實際上最關(guān)心的是,我們能夠始終如一地將風(fēng)暴的影響嚴(yán)重程度劃分為1-5級的能力,這個劃分是為他們的操作程序定義的。

要確保數(shù)據(jù)科學(xué)團(tuán)隊對這個問題有一個全面的理解,并且這個理解最好直接來自用戶,這對于一個新計劃的成功是至關(guān)重要的。如果你的團(tuán)隊陷入了上面描述的模型“不能工作”的情況,那么第一步就是回去,確保你已經(jīng)正確地定義了問題,并理解你的用戶如何定義成功。

2. 數(shù)據(jù)是否正確、完整?

下一步是回頭查看你的團(tuán)隊收集的輸入數(shù)據(jù)。通常,在處理復(fù)雜的實際模型時,模型性能不好的主要原因是由于輸入數(shù)據(jù)集和特征的問題,而不是模型本身。特別是當(dāng)你運行多種類型的模型(我們建議你盡可能這樣做)并得到類似的結(jié)果時,這通常是輸入數(shù)據(jù)集的問題。

這一步的一個關(guān)鍵部分是確保你已經(jīng)收集了盡可能多的相關(guān)數(shù)據(jù)。通常,現(xiàn)實世界的模式中有一些因素并不總是直觀或者明顯的,因此你可以收集的數(shù)據(jù)和特征越多越好。你可以使用許多技術(shù)來降低特征的選擇,以便在最相關(guān)的特征上構(gòu)建模型,我們將在下一個步驟中討論這些特征。但是對于這一步,重點是重新檢查你的假設(shè),哪些輸入的特征影響了你試圖建模的輸出,如果需要,還可以返回以獲取額外的數(shù)據(jù)。例如,當(dāng)試圖為現(xiàn)實世界的現(xiàn)象建模時,通常需要考慮一些不明顯的因素,因為這些不明顯的因素會造成影響,特別是異常情況——例如季節(jié)性、天氣、日歷事件,甚至地緣政治事件。

其次,應(yīng)該進(jìn)行一些簡單的QA檢查,以確保輸入數(shù)據(jù)得到正確映射和處理。最近,我們與一個想改善模型性能的客戶進(jìn)行了合作,但最終發(fā)現(xiàn)問題根本不是與模型有關(guān)——客戶錯誤地處理了一些地理位置的特征數(shù)據(jù),這使得他們運行的模型無法識別正確的模式。

CRISP-DM流程是許多數(shù)據(jù)科學(xué)團(tuán)隊用于管理項目的最常見框架之一。我們喜歡它的重點在于它確保在深入建模之前就能理解業(yè)務(wù)和數(shù)據(jù)。CRISP-DM過程中的兩個關(guān)鍵步驟是“數(shù)據(jù)理解”和“數(shù)據(jù)準(zhǔn)備”。正確地遵循這些步驟需要深入研究輸入數(shù)據(jù)以真正地理解它,通常需要可視化數(shù)據(jù)中的分布、趨勢和關(guān)系?!皵?shù)據(jù)準(zhǔn)備”通常包括預(yù)處理、數(shù)據(jù)擴(kuò)充與標(biāo)準(zhǔn)化,以便為建模做準(zhǔn)備。如果處理得當(dāng),這兩個步驟可以幫助數(shù)據(jù)科學(xué)家確保輸入數(shù)據(jù)中的錯誤不會導(dǎo)致他以后遇到的任何模型性能問題。

3. 調(diào)整模型提升性能

既然你已經(jīng)盡可能正確和完整地驗證了輸入數(shù)據(jù),現(xiàn)在是時候關(guān)注有趣的東西了——建模本身。這一步中影響最大的部分之一是特征選擇——從上到下選擇最影響輸出的關(guān)鍵特征,并對這些特征進(jìn)行訓(xùn)練,消除冗余或高度相關(guān)的特征,以提高模型的速度和準(zhǔn)確度。關(guān)于特征選擇技術(shù)有一些很好的博客文章,包括單變量選擇、遞歸特征消除和隨機(jī)森林特征重要性。這里有一個可供參考:https://machinelearningmastery.com/feature-selection-machine-learning-python/。無論你使用的是哪種技術(shù),或者它們的組合,都要確保在這一步上花費時間,為你的模型獲得特征的最佳組合。

此步驟的另一個重要部分是重新考慮模型的選擇,或者考慮添加額外的模型類型或組合多個模型。同樣的,也有許多比較不同模型優(yōu)缺點的好文章,但是我們建議盡可能運行至少兩種模型類型(理想情況下,一種是神經(jīng)網(wǎng)絡(luò))來比較結(jié)果。

最后,一旦你的特征和選擇的模型確定了后,重新調(diào)參,并且確保你正確地定義訓(xùn)練集,驗證集和測試集,這代表你在調(diào)參時并沒有選擇欺詐,所以它在新數(shù)據(jù)上可以泛化的很好,而不是在訓(xùn)練集上表現(xiàn)良好甚至過擬合導(dǎo)致在新數(shù)據(jù)上模型沒有良好的工作。

4. 最后,也是最重要的,管理客戶的期望

這是許多數(shù)據(jù)科學(xué)家忽視的另一個關(guān)鍵步驟,因為他們認(rèn)為這“不是他們的工作”。當(dāng)推出一個面向世界的新機(jī)器學(xué)習(xí)產(chǎn)品時,模型在真實世界的性能存在相當(dāng)大的不確定性。此外,如上所述,盡管你盡了最大的努力使準(zhǔn)確度最大化,但是在你正在解決的問題在真實世界中會出現(xiàn)的大量噪聲,這可能會限制模型的性能。所以這個步驟是數(shù)據(jù)科學(xué)團(tuán)隊的責(zé)任,需要數(shù)據(jù)科學(xué)團(tuán)隊去與產(chǎn)品經(jīng)理,銷售人員,客戶正確定義客戶期待在模型中看到的性能,并且在時間的推移擁有額外的數(shù)據(jù)的情況下,指導(dǎo)他們?nèi)绾稳ビ?xùn)練改善模型。

所以下次你的團(tuán)隊在模型放入真實世界里遇到性能問題時,不要玩指責(zé)游戲或直接一頭扎進(jìn)調(diào)參工作進(jìn)行優(yōu)化與擬合,后退一步,跟著這個簡單的,結(jié)構(gòu)化的過程一步一步來解決這個問題,在你的新模型上最大化性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3831

    瀏覽量

    52287
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26264
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    HDMI 接口在 I.MX8QM 評估板中不起作用是怎么回事?

    HDMI 接口在 I.MX8QM 評估板中不起作用,所有其他接口都正常工作 以前的 HDMI 接口工作正常,我們使用相同的以前的 SD 卡和通過 SD 卡啟動的 Board。 現(xiàn)在問題顯示為
    發(fā)表于 04-28 07:23

    i.mx91 uboot 和 linux 軟重置不起作用怎么解決?

    問題 - 我的軟件重置不起作用。 在 uboot 中 - 鍵入 \'重置\' 使系統(tǒng)停滯。 在 Linux 中 - tpying \'重新啟動\' 使系統(tǒng)停滯。 我在設(shè)備樹中啟用了 wdog3
    發(fā)表于 04-14 07:09

    芯片燒錄總是出錯?常見 6 個問題及解決辦法

    做電子生產(chǎn)和 SMT 貼片的朋友,經(jīng)常會遇到芯片燒錄不穩(wěn)定、報錯、漏燒、錯燒等問題。今天結(jié)合我們做燒錄機(jī)多年的經(jīng)驗,總結(jié)一下最常見的原因和解決思路,歡迎同行交流。 常見 6 個問題及解決辦法: 1.
    的頭像 發(fā)表于 04-10 15:30 ?279次閱讀
    芯片燒錄總是出錯?常見 6 個問題及<b class='flag-5'>解決辦法</b>

    有沒有辦法從 SD 卡上正在運行的系統(tǒng)傳輸 nvme 的最新 img 文件?

    有沒有辦法從 SD 卡上正在運行的系統(tǒng)傳輸 nvme 的最新 img 文件? 我嘗試過使用 gnome-disks,但似乎不起作用(過去它讓我失敗過),dd 也是如此。 balenaEtcher
    發(fā)表于 03-05 07:12

    CW32L010F8P6開發(fā)板的復(fù)位鍵不起作用怎么解決?

    拿到手的CW32L010F8P6開發(fā)板,在測試過程中發(fā)現(xiàn),復(fù)位按鍵好像是沒起作用。不知道是沒連接到對應(yīng)的引腳上,還是線路斷開了。原來的板載程序運行中,按復(fù)位按鍵不起作用;程序下載后,按復(fù)位按鍵也不起作用。
    發(fā)表于 11-26 07:19

    Bluetooth? LE FindMe 示例在CY8C6347LQI-BLD52中不起作用是怎么回事?

    Bluetooth? LE FindMe 示例在CY8C6347LQI-BLD52中不起作用
    發(fā)表于 11-11 07:23

    時序約束問題的解決辦法

    slack 計算如下圖所示: 所以 slakc 為負(fù)數(shù)時,說明路徑的組合邏輯延時過長。解決辦法有兩個:第一個是降低時鐘頻率,第二個是將延時過長的組合邏輯拆成兩個或者多個時鐘周期執(zhí)行。 無論 Setup
    發(fā)表于 10-24 09:55

    rt-thread使用xshell連接上下鍵不起作用是怎么回事?

    rt-thread使用xshell連接上下鍵不起作用,不能進(jìn)行歷史追溯,求問怎么回事
    發(fā)表于 10-13 06:27

    TSLIB 觸摸屏校準(zhǔn)不起作用是怎么回事?

    我遇到觸摸屏校準(zhǔn)問題 在觸摸屏校準(zhǔn)期間我看不到任何窗口,只能在 RS232 中更新 所以我使用我自己創(chuàng)建的模板用于觸摸屏校準(zhǔn) 實際上它以前有效,但現(xiàn)在不起作用 不知道為什么會這樣
    發(fā)表于 09-04 06:06

    CYW920721M2EVK-02與cybt413061模塊,HID控件在某些安卓13設(shè)備中不起作用怎么解決?

    我們正在使用帶有cybt413061模塊的 CYW920721M2EVK-02 ,HID控件在三星Android 13和GooglePixel Android 13設(shè)備中不起作用。 然而,出于測試
    發(fā)表于 07-01 06:00

    單向閥氣密性檢測儀常見故障及解決辦法

    單向閥氣密性檢測儀在工業(yè)生產(chǎn)中起著至關(guān)重要的作用,然而在使用過程中難免會出現(xiàn)一些故障。了解常見故障及其解決辦法,能有效提高設(shè)備的使用效率和檢測準(zhǔn)確性。一、檢測結(jié)果不準(zhǔn)確故障表現(xiàn)檢測數(shù)據(jù)波動
    的頭像 發(fā)表于 06-30 14:01 ?792次閱讀
    單向閥氣密性檢測儀常見故障及<b class='flag-5'>解決辦法</b>

    wiced_hal_sflash_write在CYW20721B2上不起作用是怎么回事?

    時,寫入不起作用。 邏輯分析儀上沒有保存命令。 我記得在 CYW20706 中必須通過 *((unsigned char*)(0x00201a14)) = 1 解鎖寫入能力;
    發(fā)表于 06-30 06:22

    rt-thread-studio添加任何的軟件包都失敗,更改github或者gitee源都不起作用,有什么解決方案嗎?

    如圖,添加任何的軟件包都失敗,更改github或者gitee源都不起作用,有什么解決方案嗎?
    發(fā)表于 06-13 08:17

    PFC在250W LED驅(qū)動器中不起作用是怎么回事?

    PFC 在 250W LED 驅(qū)動器中不起作用。 請在下面找到詳細(xì)信息。 PFCVS 時的 Volt. -1.50 BO-1.80 VCC-18V
    發(fā)表于 05-29 06:12

    CY7C65215A第二端口SPI-CDC模式不起作用是怎么回事?

    模式不起作用。 當(dāng)我的 Windows 軟件調(diào)用 CySpiReadWrite_VCP() 時,該函數(shù)返回 0xb (CY_VCP_ERROR_IO_TIMEOUT)。
    發(fā)表于 05-07 06:38
    阳新县| 星座| 滨州市| 北川| 汉沽区| 札达县| 宜春市| 孝感市| 湘西| 黎平县| 洪泽县| 安乡县| 武山县| 海南省| 信丰县| 浏阳市| 九寨沟县| 江永县| 黄平县| 康马县| 屏东市| 平乡县| 育儿| 拉萨市| 榕江县| 宜章县| 安远县| 辽阳县| 布尔津县| 定边县| 石门县| 新余市| 出国| 叙永县| 潮安县| 龙南县| 罗江县| 佛坪县| 唐海县| 平潭县| 宁乡县|