日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

到底是什么讓機(jī)器學(xué)習(xí)達(dá)不到我們的期待呢?

nlfO_thejiangme ? 2018-03-27 13:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器學(xué)習(xí)雖然能夠在很多地方顯示出強(qiáng)大的力量,同時(shí)也被集成到了很多的商業(yè)流程中去,但它依舊有一些不完美的地方,今天我們就通過(guò)一些典型的例子來(lái)深刻感受一下機(jī)器學(xué)習(xí)的局限性。

人臉識(shí)別

目前最先進(jìn)的人臉識(shí)別系統(tǒng)可以達(dá)到99%的準(zhǔn)確率。作為使用最為廣泛的機(jī)器學(xué)習(xí)算法,人臉識(shí)別得到了飛速的發(fā)展,但在這背后需要我們對(duì)幾件事情保持清醒。首先,99%的正確率是來(lái)自與驗(yàn)證數(shù)據(jù)集的測(cè)試結(jié)果,而驗(yàn)證數(shù)據(jù)集則來(lái)自于與訓(xùn)練數(shù)據(jù)集相同的數(shù)據(jù)集,并從中隨機(jī)抽取。這就意味著數(shù)據(jù)的均值和方差與訓(xùn)練數(shù)據(jù)十分相似。但當(dāng)我們將系統(tǒng)置于真實(shí)情況下時(shí),實(shí)際照片的特性與訓(xùn)練數(shù)據(jù)不可能相同,那么實(shí)際的精度很有可能低于99%。

模型有時(shí)候會(huì)將其他的東西識(shí)別成人臉(假陽(yáng)性)或者忘卻漏掉了人臉(假陰性)。不同的模型在不同的階段有著不同的表現(xiàn),在使用時(shí)你需要確定你需要什么樣層次的模型,給出多高的精度是可以接受的。在選擇權(quán)衡算法時(shí),一個(gè)模型在檢測(cè)幾千張臉時(shí)錯(cuò)檢幾十張,而另一個(gè)模型可以將準(zhǔn)確率提高一半但需要10x的處理時(shí)間和運(yùn)算,那么前者將會(huì)是不錯(cuò)的選擇。剩下的可以交給人類來(lái)做,我們對(duì)于少量假陽(yáng)性和假陰性的樣本有著非??斓臏?zhǔn)確識(shí)別能力。

下面是幾個(gè)關(guān)于模型訓(xùn)練的數(shù)據(jù)清理經(jīng)驗(yàn)。最好的當(dāng)然是保證每一張臉都可以很容易地看到,沒(méi)有模糊遮擋,也沒(méi)有很奇怪的角度。同時(shí)圖像要保持適度的分辨率,分辨率太高的圖像容易引入造成算法失效的噪音。

光學(xué)字符識(shí)別(OCR)

目前最先進(jìn)的光學(xué)字符識(shí)別系統(tǒng)對(duì)于文件的識(shí)別與排版已經(jīng)有十分優(yōu)異?;谶吘墮z測(cè)、計(jì)算機(jī)視覺與字符識(shí)別的技術(shù)使得OCR不斷改進(jìn),對(duì)于掃描文檔幾乎沒(méi)有障礙了。

但目前OCR還不能夠勝任的是非掃描文件的識(shí)別,這也是驗(yàn)證碼還能作為網(wǎng)站人類識(shí)別的功能存在。人類對(duì)于字母識(shí)別有著無(wú)與倫比的能力,無(wú)論是模糊、扭曲、顏色不同都不在話下,而計(jì)算機(jī)望塵莫及。

OCR很有用但對(duì)于一些場(chǎng)景下使用不當(dāng)就會(huì)文不對(duì)題,下面這張球賽的截頻就是一個(gè)典型的例子。

上圖如果用OCR識(shí)別很有可能生成這樣的一大串:

[0] PREMIER LEAGUE [1] TOT 2 [2] M [3] U [4] 0 [5] 36:2 [6] 4 [7] SPORTS [8] NEW 0 BUR 0 [9] HALFTIME [10] LIVE [11] NBCSN

如果沒(méi)有上下文語(yǔ)境我們很難明白識(shí)別出的意思,哪里是隊(duì)名哪里是logo?這會(huì)造成很大的混亂。

我們不應(yīng)該像使用通用OCR一樣來(lái)直接簡(jiǎn)單粗暴的套用,而是需要針對(duì)情況進(jìn)行分析。對(duì)于上面的例子如果我們想要追蹤球員,那么目標(biāo)追蹤的方法會(huì)很好,但如果想要追蹤比賽分?jǐn)?shù)和時(shí)間,那么將OCR限定在固定區(qū)域中會(huì)是不錯(cuò)的選擇。

視 頻

視頻是一種很神奇的存在,雖然很多機(jī)器學(xué)習(xí)模型能在視頻上實(shí)現(xiàn)和照片一樣的效果,但總會(huì)有意想不到的情況。數(shù)字世界的解碼和封裝總是與視頻的壓縮率和長(zhǎng)寬比耦合在一起。

同時(shí)考慮到處理時(shí)間和算力的限制,對(duì)視頻進(jìn)行處理時(shí)我們往往選擇低分辨的格式。當(dāng)你選擇低分辨率或者較高的壓縮時(shí),視頻并不會(huì)是一組連續(xù)的靜態(tài)圖片,所以計(jì)算機(jī)視覺的識(shí)別方法將會(huì)與靜態(tài)圖片中的識(shí)別方法有很大的差別。

為了說(shuō)明這一情況我們可以隨便點(diǎn)開一個(gè)視頻并暫停,如下圖所示。人們的臉變得模糊、角度和整體形象都顯得和靜態(tài)下十分不同。

下面應(yīng)該是計(jì)算機(jī)看到的人臉區(qū)域:

你能從中認(rèn)出圖中的主角是誰(shuí)嗎?如果對(duì)你來(lái)說(shuō)很困難那么對(duì)于計(jì)算機(jī)來(lái)說(shuō)也不容易!

對(duì)于人類來(lái)說(shuō),在視頻中識(shí)別人臉很容易,但要把獨(dú)立的幀抽取出來(lái)你會(huì)發(fā)現(xiàn)圖像質(zhì)量出乎意料的差。

但我們也不能否定機(jī)器學(xué)習(xí),因?yàn)闄C(jī)器學(xué)習(xí)在大多數(shù)情況下對(duì)于視頻的自動(dòng)化分類和標(biāo)注時(shí)十分重要的手段。我們需要明白的是我們期望得到的結(jié)果以及如何去修正模型實(shí)際的表現(xiàn)。如果一個(gè)龐大的全球名人識(shí)別模型對(duì)一段視屏進(jìn)行檢測(cè)可能會(huì)出現(xiàn)很多假陽(yáng)性的結(jié)果,但是如果使用一個(gè)僅僅包含幾個(gè)著名人士的模型來(lái)檢測(cè)則會(huì)得到好得多的結(jié)果。如果你的模型表現(xiàn)不好,你還可以從數(shù)據(jù)的角度來(lái)改進(jìn),譬如說(shuō)某個(gè)節(jié)目中人臉出現(xiàn)的位置就可以作為先驗(yàn)知識(shí)來(lái)幫助機(jī)器提高正確率。我們需要嘗試不同的模型和工作流總能取得成功。

如何成功的應(yīng)用機(jī)器學(xué)習(xí)?

機(jī)器學(xué)習(xí)十分強(qiáng)大,有人將它應(yīng)用于檢測(cè)學(xué)術(shù)造假的論文,也有人將它應(yīng)用于人臉身份認(rèn)證、不良內(nèi)容的裸露檢測(cè)等。同樣也用于為用戶推薦商品和服務(wù)的推薦引擎上,在這樣的場(chǎng)景下假陽(yáng)性和假陰性的推薦結(jié)果不會(huì)造成太大影響,事實(shí)上一些異常推薦還為用戶探索新事物提供了條件。

還有改善搜索引擎的個(gè)性化能力,檢測(cè)農(nóng)作物動(dòng)物的疾病以及預(yù)測(cè)產(chǎn)量等等方面。機(jī)器學(xué)習(xí)將會(huì)有無(wú)數(shù)的應(yīng)用,我們對(duì)它充滿期待,但同時(shí)也會(huì)把握住期待的方向讓機(jī)器學(xué)習(xí)正常運(yùn)轉(zhuǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:靈魂拷問(wèn):是什么讓機(jī)器學(xué)習(xí)達(dá)不到我們的期待呢?(開頭有個(gè)大事兒)

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    手把手教你打造一個(gè)專屬小智AI機(jī)器人,零基礎(chǔ)也能玩轉(zhuǎn)AI創(chuàng)客(附詳細(xì)教程資料及學(xué)習(xí)路線)

    到底是什么,我們普通人零基礎(chǔ)也能怎么動(dòng)手打造,還有超多好玩的實(shí)戰(zhàn)項(xiàng)目可以跟著玩。01火遍全網(wǎng)的小智AI,到底是什么?2024年9月小智AI正式開源,短短幾個(gè)月就登
    的頭像 發(fā)表于 03-30 14:32 ?532次閱讀
    手把手教你打造一個(gè)專屬小智AI<b class='flag-5'>機(jī)器</b>人,零基礎(chǔ)也能玩轉(zhuǎn)AI創(chuàng)客(附詳細(xì)教程資料及<b class='flag-5'>學(xué)習(xí)</b>路線)

    強(qiáng)化學(xué)習(xí)會(huì)自動(dòng)駕駛模型學(xué)習(xí)更快嗎?

    是一種機(jī)器通過(guò)“試錯(cuò)”學(xué)會(huì)決策的辦法。與監(jiān)督學(xué)習(xí)不同,監(jiān)督學(xué)習(xí)是有人提供示范答案,模型去模仿;而強(qiáng)化
    的頭像 發(fā)表于 01-31 09:34 ?866次閱讀
    強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>會(huì)<b class='flag-5'>讓</b>自動(dòng)駕駛模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    無(wú)論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要
    的頭像 發(fā)表于 01-07 15:37 ?371次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    MOS管到底是什么?和三極管、繼電器有什么本質(zhì)區(qū)別?

    出現(xiàn)的“實(shí)力派選手”,常常被與三極管、繼電器放在一起比較。不少人在選型時(shí)會(huì)困惑:MOS管到底是什么?它和我們熟悉的三極管、繼電器,核心差異又在哪里?今天就用通俗的語(yǔ)言拆解清楚
    的頭像 發(fā)表于 01-07 13:46 ?1091次閱讀
    MOS管<b class='flag-5'>到底是</b>什么?和三極管、繼電器有什么本質(zhì)區(qū)別?

    PCB加工中的“流膠”到底是怎么影響阻抗的?

    是好事,高速先生支持每一個(gè)有夢(mèng)想的人。但是光有夢(mèng)想肯定控不好阻抗,高速先生一定會(huì)把你們搖醒,你們好好思考下到底有什么因素會(huì)影響加工的阻抗誤差哈! 影響阻抗的因素有很多,高速先生之前文章也寫過(guò)不少
    發(fā)表于 12-23 10:14

    Stack棧到底用來(lái)干嘛的?

    Stack_Size就是棧大小,0x00000400就是代表有1K(0x400/1024)的大小。 那這個(gè)棧到底用來(lái)干嘛的? 比如說(shuō)我們函數(shù)的形參、以及函數(shù)里定義的局部變量就是存儲(chǔ)在棧里,所以
    發(fā)表于 12-01 08:04

    IGBT到底是什么?-從名稱入手來(lái)帶您了解

    對(duì)于工作需要用到IGBT、但從未專業(yè)學(xué)習(xí)過(guò)IGBT的人來(lái)說(shuō), IGBT到底是什么、它為什么叫IGBT、它的核心關(guān)鍵詞是什么、要怎么理解它 等一系列問(wèn)題并無(wú)法一次性在某個(gè)地方獲取到,都需要查閱大量的資料,學(xué)習(xí)大量的基礎(chǔ)才能有個(gè)初步
    的頭像 發(fā)表于 11-25 17:38 ?2931次閱讀
    IGBT<b class='flag-5'>到底是</b>什么?-從名稱入手來(lái)帶您了解

    驅(qū)動(dòng)芯片到底有多重要?這些黑科技電子設(shè)備飛起來(lái)!

    你知道嗎? 驅(qū)動(dòng)芯片 就像電子設(shè)備的心臟,沒(méi)有它,你的手機(jī)、電腦、智能家電統(tǒng)統(tǒng)都會(huì)變成廢鐵!但這么重要的東西,99%的人卻對(duì)它一無(wú)所知。 驅(qū)動(dòng)芯片到底是什么鬼? 簡(jiǎn)單來(lái)說(shuō),驅(qū)動(dòng)芯片就是控制其他
    的頭像 發(fā)表于 11-25 08:37 ?598次閱讀
    驅(qū)動(dòng)芯片<b class='flag-5'>到底</b>有多重要?這些黑科技<b class='flag-5'>讓</b>電子設(shè)備飛起來(lái)!

    請(qǐng)問(wèn)Keil中的map文件到底是什么意思?

    Keil中的map文件到底是什么意思?里面是如何進(jìn)行相關(guān)執(zhí)行操作的
    發(fā)表于 11-25 06:59

    單片機(jī)和嵌入式,到底是什么關(guān)系?

    很多人初次接觸嵌入式開發(fā)時(shí),都會(huì)聽到一句話:“嵌入式其實(shí)就是單片機(jī)?!笨僧?dāng)你真正開始學(xué)習(xí)時(shí),會(huì)發(fā)現(xiàn)嵌入式和單片機(jī)雖然經(jīng)?!袄墶痹谝黄鹛?,但它們好像又不是一回事。這篇文章,我們就來(lái)厘清這兩個(gè)概念
    的頭像 發(fā)表于 11-14 10:28 ?2147次閱讀
    單片機(jī)和嵌入式,<b class='flag-5'>到底是</b>什么關(guān)系?

    RFID電子標(biāo)簽:生活和工作開掛的神奇科技

    出門過(guò)ETC不用停車、超市結(jié)賬不用挨個(gè)掃碼、酒店開門不用插鑰匙 —— 你有沒(méi)有發(fā)現(xiàn),這些生活變便捷的場(chǎng)景里,都藏著同一個(gè) “幕后功臣”:RFID電子標(biāo)簽。這個(gè)看似不起眼的小技術(shù),早已悄悄滲透到我們
    的頭像 發(fā)表于 11-13 10:06 ?934次閱讀

    單片機(jī)的差分信號(hào)到底是什么?

    差分信號(hào)到底是什么?通俗來(lái)講,就是驅(qū)動(dòng)端發(fā)送兩個(gè)等值、反相的信號(hào),接收端通過(guò)比較這兩個(gè)電壓的差值來(lái)判斷邏輯狀態(tài)“0”還是“1”。 差分信號(hào)的產(chǎn)生是由輸入源發(fā)出信號(hào)后經(jīng)過(guò)緩沖器和倒相器后,所產(chǎn)生
    發(fā)表于 11-12 06:44

    IEC 到底是什么?為什么它能影響全球?

    IEC 到底是什么?為什么它能影響全球?
    的頭像 發(fā)表于 09-04 17:07 ?3961次閱讀

    晶振的 “負(fù)載電容” 到底是什么

    負(fù)載電容,到底是什么? 負(fù)載電容,簡(jiǎn)單來(lái)說(shuō),是指晶振的兩條引線連接IC塊內(nèi)部及外部所有有效電容之和,我們可以將其看作晶振片在電路中串接的電容。從更專業(yè)的角度講,它是為了使晶振能夠在其標(biāo)稱頻率下穩(wěn)定
    的頭像 發(fā)表于 07-25 16:26 ?1242次閱讀

    請(qǐng)問(wèn)編譯純r(jià)tos到底是選擇Linux+rtos的sdk編譯only rtos還是直接使用rtos sdk?

    編譯純r(jià)tos到底是選擇Linux+rtos的sdk編譯only rtos還是直接使用rtos sdk?
    發(fā)表于 07-11 07:22
    伊宁市| 宁陵县| 游戏| 正阳县| 延川县| 宝丰县| 延安市| 靖州| 苗栗县| 永宁县| 精河县| 神木县| 潮安县| 舒兰市| 宾川县| 马鞍山市| 灌云县| 徐水县| 南阳市| 商洛市| 岳阳市| 台东市| 盘锦市| 沅江市| 宝鸡市| 龙游县| 新郑市| 精河县| 张北县| 岱山县| 阿鲁科尔沁旗| 南城县| 电白县| 洛川县| 酒泉市| 潞西市| 辽宁省| 东安县| 灵璧县| 加查县| 兖州市|