日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學(xué)習(xí)中賦予了什么數(shù)學(xué)意義

姚小熊27 ? 來源:雷鋒網(wǎng) ? 作者:雷鋒網(wǎng) ? 2020-10-14 09:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器學(xué)習(xí)中的用于聲稱性能的指標標準很少被討論。由于在這個問題上似乎沒有一個明確的、廣泛的共識,因此我認為提供我一直在倡導(dǎo)并盡可能遵循的標準可能會很有趣。它源于這個簡單的前提,這是我的科學(xué)老師從中學(xué)開始就灌輸給我的:

科學(xué)報告的一般規(guī)則是,您寫下的每個數(shù)字都應(yīng)為“真”的,因為“真”的定義是什么。

讓我們來研究一下這對測試性能等統(tǒng)計量意味著什么。當你在科學(xué)出版物中寫下以下陳述時:

測試準確率為52.34%。你所表達的是,據(jù)你所知,你的模型在從測試分布中提取的未見數(shù)據(jù)上成功的概率在0.52335和0.52345之間。

這是一個非常強有力的聲明。

考慮你的測試集是從正確的測試分布中抽取的N個樣本IID組成的。成功率可以表示為一個二項式變量,其平均概率p由樣本平均值估計:p?s/N

其標準差為:σ=√p(1-p)。

其中當p=0.5時,其上限為0.5。

在正態(tài)近似下,估計量的標準差為:δ=σ/√N。

這個精度估計上的誤差δ是這樣的,在最壞的情況下,有約50%的精度:

換句話說,為了保證上述報告中例子52.34%的準確率,你的測試集的大小至少應(yīng)該在30M樣本的數(shù)量級上!這種粗略的分析很容易轉(zhuǎn)化為除了準確率以外的任何可計算的數(shù)量,盡管不能轉(zhuǎn)化為像似然率或困惑度這樣的連續(xù)數(shù)字。

下面是一些常見的機器學(xué)習(xí)數(shù)據(jù)集的說明。

在ImageNet上可以合理地報告多少位數(shù)的精度?準確率在80%左右,測試集是15萬張圖片:

√(0.8*0.2/150000)=0.103%

這意味著你幾乎可以報告XX.X%的數(shù)字,而實際上每個人都是這樣做的。

MNIST呢,準確率在99%:

√(0.99*0.01/10000)=0.099%

噗,也報個XX.X%就OK了!

然而,最值得注意的是,在大多數(shù)情況下,性能數(shù)據(jù)并不是單獨呈現(xiàn)的,而是用來比較同一測試集上的多種方法。在這種情況下,實驗之間的抽樣方差會被抵消,即使在樣本量較小的情況下,它們之間的準確度差異也可能在統(tǒng)計學(xué)上很顯著。估計圖方差的一個簡單方法是執(zhí)行bootstrap重采樣。更嚴格、通常更嚴格的檢驗包括進行配對差異檢驗或更普遍的方差分析。

報告超出其內(nèi)在精度的數(shù)字可能很具有極大的吸引力,因為在與基線進行比較的情況下,或者當人們認為測試集是一成不變的情況下,同時也不是從測試分布中抽取的樣本時,性能數(shù)字往往更加重要。當在生產(chǎn)中部署模型時,這種做法會讓人感到驚訝,并且固定的測試集假設(shè)突然消失了,還有一些無關(guān)緊要的改進。更普遍的是,這種做法會直接導(dǎo)致對測試集進行過擬合。

那么,在我們的領(lǐng)域中數(shù)字為“真”意味著什么?好吧,這確實很復(fù)雜。對于工程師而言,很容易辯稱不應(yīng)該報告的尺寸超出公差?;蛘邔τ谖锢韺W(xué)家來說,物理量不應(yīng)超過測量誤差。對于機器學(xué)習(xí)從業(yè)者,我們不僅要應(yīng)對測試集的采樣不確定性,而且還要應(yīng)對獨立訓(xùn)練運行,訓(xùn)練數(shù)據(jù)的不同初始化和改組下的模型不確定性。

按照這個標準,在機器學(xué)習(xí)中很難確定哪些數(shù)字是“真”的。解決辦法當然是盡可能地報告其置信區(qū)間。置信區(qū)間是一種更精細的報告不確定性的方式,可以考慮到所有隨機性的來源,以及除簡單方差之外的顯著性檢驗。它們的存在也向你的讀者發(fā)出信號,表明你已經(jīng)考慮過你所報告的內(nèi)容的意義,而不僅僅是你的代碼所得到的數(shù)字。用置信區(qū)間表示的數(shù)字可能會被報告得超出其名義上的精度,不過要注意的是,你現(xiàn)在必須考慮用多少位數(shù)來報告不確定性,正如這篇博文所解釋的那樣。一路走來都是烏龜。

數(shù)字少了,雜亂無章的東西就少了,科學(xué)性就強了。

避免報告超出統(tǒng)計學(xué)意義的數(shù)字結(jié)果,除非你為它們提供一個明確的置信區(qū)間。這理所當然地被認為是科學(xué)上的不良行為,尤其是在沒有進行配對顯著性測試的情況下,用來論證一個數(shù)字比另一個數(shù)字好的時候。僅憑這一點就經(jīng)常有論文被拒絕。一個良好的習(xí)慣是對報告中帶有大量數(shù)字的準確率數(shù)字始終持懷疑態(tài)度。還記得3000萬、30萬和30萬的經(jīng)驗法則對最壞情況下作為“嗅覺測試”的統(tǒng)計顯著性所需樣本數(shù)量的限制嗎?它會讓你避免追逐統(tǒng)計上的“幽靈”。
責任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    機器學(xué)習(xí)的數(shù)據(jù)質(zhì)量雙保障:從“驗證”到“標記”

    機器學(xué)習(xí)的世界里,有句老話尤為貼切:“garbagein,garbageout”(輸入垃圾,輸出垃圾)。無論模型架構(gòu)多先進、算法多精妙,數(shù)據(jù)的質(zhì)量始終是決定模型性能的核心。本文聚焦數(shù)據(jù)處理兩個
    的頭像 發(fā)表于 04-24 15:48 ?128次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>中</b>的數(shù)據(jù)質(zhì)量雙保障:從“驗證”到“標記”

    人工智能與機器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機器學(xué)習(xí)問世以來,多個在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與
    的頭像 發(fā)表于 02-04 14:44 ?715次閱讀

    賦予機器人靈動雙眸:匠芯創(chuàng)D13x系列芯片在AI陪伴機器人中的創(chuàng)新應(yīng)用

    在人工智能浪潮席卷全球的今天,AI陪伴機器人正從科幻概念加速走入現(xiàn)實生活。無論是家庭的智能玩伴、養(yǎng)老機構(gòu)的情感陪護助手,還是教育場景的智能導(dǎo)師,機器人不再僅僅是執(zhí)行指令的工具,而是被賦予
    的頭像 發(fā)表于 02-02 19:30 ?1065次閱讀
    <b class='flag-5'>賦予</b><b class='flag-5'>機器</b>人靈動雙眸:匠芯創(chuàng)D13x系列芯片在AI陪伴<b class='flag-5'>機器</b>人中的創(chuàng)新應(yīng)用

    避繁就簡!商湯日日新大模型靈性巧解數(shù)學(xué)難題,獲贊“機器的審美”

    、字節(jié)跳動,讓數(shù)學(xué)與AI同臺碰撞,開展一場真刀真槍的“圖靈測試”。 現(xiàn)場,面對數(shù)學(xué)家拋出的難題,商湯科技“日日新”大模型在解答復(fù)分析計算積分、微分幾何證明等問題中,展示驚人的進化力
    的頭像 發(fā)表于 01-12 11:41 ?450次閱讀
    避繁就簡!商湯日日新大模型靈性巧解<b class='flag-5'>數(shù)學(xué)</b>難題,獲贊“<b class='flag-5'>機器</b>的審美”

    機器學(xué)習(xí)和深度學(xué)習(xí)需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?370次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>中</b>需避免的 7 個常見錯誤與局限性

    《AI機器人控制進階教程(入門版)》閱讀指引

    的預(yù)編程,只能在結(jié)構(gòu)化環(huán)境工作。AI的引入(如計算機視覺、自然語言處理),賦予機器人感知、理解和決策的能力,使其能適應(yīng)開放、動態(tài)的真實世界。2.解決復(fù)雜任務(wù)的核心本
    的頭像 發(fā)表于 01-07 10:56 ?2463次閱讀
    《AI<b class='flag-5'>機器</b>人控制進階教程(入門版)》閱讀指引

    基于ETAS嵌入式AI工具鏈將機器學(xué)習(xí)模型部署到量產(chǎn)ECU

    AI在汽車行業(yè)的應(yīng)用日益深化,如何將機器學(xué)習(xí)領(lǐng)域的先進模型(如虛擬傳感器)集成到ECU軟件,已成為業(yè)界面臨的核心挑戰(zhàn)。
    的頭像 發(fā)表于 12-24 10:55 ?6427次閱讀
    基于ETAS嵌入式AI工具鏈將<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>模型部署到量產(chǎn)ECU

    學(xué)習(xí)RTOS的意義?

    對于嵌入式軟件工程師,學(xué)習(xí)RTOS非常有必要。 1. 項目需要 隨著產(chǎn)品要實現(xiàn)的功能越來越多,單純的裸機系統(tǒng)已經(jīng)不能完美地解決問題,反而會使編程變得更加復(fù)雜,如果想降低編程的難度,就必須引入
    發(fā)表于 11-27 08:16

    CRC校驗的本質(zhì)和物理意義

    工業(yè)控制系統(tǒng),Modbus RTU協(xié)議的CRC校驗如同通信網(wǎng)絡(luò)的\"免疫系統(tǒng)\",某石化廠DCS系統(tǒng)曾因CRC計算錯誤導(dǎo)致0.3%的數(shù)據(jù)包丟失,引發(fā)連鎖控制故障。 一、CRC
    發(fā)表于 11-13 07:58

    奧比光助力開源人形機器人Reachy 2能力升級

    在法國Pollen Robotics的實驗室里,今年4月發(fā)布的人形機器人Reachy 2正在完成一項頗具挑戰(zhàn)的任務(wù):根據(jù)食譜精準分揀水果和蔬菜。Reachy 2能區(qū)分新鮮蘋果和枯萎生菜,靠的不是編程,而是奧比光Gemini 336雙目3D相機所
    的頭像 發(fā)表于 11-05 15:53 ?714次閱讀

    量子機器學(xué)習(xí)入門:三種數(shù)據(jù)編碼方法對比與應(yīng)用

    在傳統(tǒng)機器學(xué)習(xí)數(shù)據(jù)編碼確實相對直觀:獨熱編碼處理類別變量,標準化調(diào)整數(shù)值范圍,然后直接輸入模型訓(xùn)練。整個過程更像是數(shù)據(jù)清洗,而非核心算法組件。量子機器
    的頭像 發(fā)表于 09-15 10:27 ?996次閱讀
    量子<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>入門:三種數(shù)據(jù)編碼方法對比與應(yīng)用

    如何在機器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術(shù)。事實上,這種印象忽視該技術(shù)為機器視覺(乃至生產(chǎn)自動化)帶來的潛力,因為深度學(xué)習(xí)并非只屬于計算機科學(xué)家或程序員。 從頭開始:什么
    的頭像 發(fā)表于 09-10 17:38 ?1083次閱讀
    如何在<b class='flag-5'>機器</b>視覺中部署深度<b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    綠葉學(xué)子北京昱櫟研學(xué)行:以交流為翼,讓學(xué)習(xí)領(lǐng)航未來

    近日,新鄉(xiāng)市綠葉學(xué)子們在北京昱櫟技術(shù)有限公司(以下簡稱“昱櫟技術(shù)”)開啟一場意義深遠的研學(xué)之旅。這場旅程不僅是一次企業(yè)探訪,更是一場思想的盛宴,讓學(xué)子們在交流收獲滿滿,對學(xué)習(xí)、成長
    的頭像 發(fā)表于 08-06 16:17 ?978次閱讀
    綠葉學(xué)子北京昱櫟研學(xué)行:以交流為翼,讓<b class='flag-5'>學(xué)習(xí)</b>領(lǐng)航未來

    FPGA在機器學(xué)習(xí)的具體應(yīng)用

    ,越來越多地被應(yīng)用于機器學(xué)習(xí)任務(wù)。本文將探討 FPGA 在機器學(xué)習(xí)的應(yīng)用,特別是在加速神經(jīng)網(wǎng)
    的頭像 發(fā)表于 07-16 15:34 ?3130次閱讀

    使用MATLAB進行無監(jiān)督學(xué)習(xí)

    無監(jiān)督學(xué)習(xí)是一種根據(jù)未標注數(shù)據(jù)進行推斷的機器學(xué)習(xí)方法。無監(jiān)督學(xué)習(xí)旨在識別數(shù)據(jù)隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗知識。
    的頭像 發(fā)表于 05-16 14:48 ?1642次閱讀
    使用MATLAB進行無監(jiān)督<b class='flag-5'>學(xué)習(xí)</b>
    平定县| 广西| 玉山县| 茌平县| 天气| 积石山| 建湖县| 永泰县| 西青区| 金平| 宁强县| 武隆县| 胶州市| 法库县| 临安市| 原平市| 盐源县| 昌平区| 屯昌县| 虎林市| 夹江县| 淄博市| 彭阳县| 梅河口市| 阿拉尔市| 焦作市| 贵南县| 花莲县| 浦江县| 长泰县| 三门峡市| 荃湾区| 静宁县| 吴桥县| 邮箱| 中超| 阳江市| 双牌县| 福建省| 花垣县| 昌平区|