日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

沒(méi)有大量訓(xùn)練數(shù)據(jù)時(shí)怎么生成更多的數(shù)據(jù)

汽車(chē)玩家 ? 來(lái)源:人工智能遇見(jiàn)磐創(chuàng) ? 作者:人工智能遇見(jiàn)磐創(chuàng) ? 2020-05-04 08:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在圖像和物體識(shí)別方面,計(jì)算機(jī)表現(xiàn)優(yōu)于人類(lèi)。

像Google和Microsoft這樣的大公司在圖像識(shí)別方面已經(jīng)超越了人類(lèi)基準(zhǔn)[1,2]。平均而言,人類(lèi)大約有5%的時(shí)間在圖像識(shí)別任務(wù)上犯了錯(cuò)誤。截至2015年,微軟的圖像識(shí)別軟件的錯(cuò)誤率達(dá)到4.94%,與此同時(shí),谷歌宣布其軟件的錯(cuò)誤率降低到4.8%[3]

這是怎么做到的?

這可以通過(guò)在包含數(shù)百個(gè)對(duì)象類(lèi)別、數(shù)百萬(wàn)個(gè)訓(xùn)練樣本的ImageNet數(shù)據(jù)集上訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)[1]。

百萬(wàn)訓(xùn)練數(shù)據(jù)!

例如,要教計(jì)算機(jī)從多個(gè)角度識(shí)別出一只貓貓,可能需要成千上萬(wàn)張涵蓋不同角度的照片。

成功訓(xùn)練計(jì)算機(jī)視覺(jué)任務(wù)的深層卷積神經(jīng)網(wǎng)絡(luò)需要大量數(shù)據(jù)。這是因?yàn)檫@些神經(jīng)網(wǎng)絡(luò)具有多個(gè)隱藏的處理層,并且隨著層數(shù)的增加,需要學(xué)習(xí)的樣本數(shù)也隨之增加。如果沒(méi)有足夠的訓(xùn)練數(shù)據(jù),則該模型往往會(huì)很好地學(xué)習(xí)訓(xùn)練數(shù)據(jù),這稱(chēng)為過(guò)度擬合。如果模型過(guò)擬合,則其泛化能力很差,因此對(duì)未見(jiàn)的數(shù)據(jù)的表現(xiàn)很差。

但是,如果沒(méi)有大量的訓(xùn)練數(shù)據(jù)怎么辦?

對(duì)于我們手頭的所有圖像識(shí)別任務(wù),并不是都會(huì)擁有數(shù)百萬(wàn)個(gè)訓(xùn)練樣本。對(duì)于某些任務(wù),收集成千上萬(wàn)個(gè)樣本圖像甚至是一個(gè)挑戰(zhàn)。對(duì)于醫(yī)學(xué)圖像而言通常是這種情況,例如用于乳房癌檢測(cè)和定位的乳房X線(xiàn)照相術(shù),用于肺癌檢測(cè)的胸部X射線(xiàn)或用于定位腦腫瘤的MRI掃描。

這可以歸結(jié)為一個(gè)問(wèn)題:當(dāng)我們只有有限的數(shù)據(jù)時(shí),我們?nèi)绾斡?xùn)練能夠很好地完成這些任務(wù)的模型?

使用數(shù)據(jù)增強(qiáng)(data augmentation)生成更多訓(xùn)練數(shù)據(jù)

當(dāng)我們只有少量圖像數(shù)據(jù)用于訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)時(shí),我們可以使用數(shù)據(jù)增強(qiáng)技術(shù)從已經(jīng)擁有的圖像數(shù)據(jù)中生成更多訓(xùn)練數(shù)據(jù)。

數(shù)據(jù)增強(qiáng)是一種為原始圖像生成多個(gè)圖像的技術(shù)。有幾種不同的數(shù)據(jù)增強(qiáng)技術(shù),Mikolajczyk和Grochowski在他們的論文中[4]將這些技術(shù)分為兩個(gè)子類(lèi)別:使用基本圖像處理的數(shù)據(jù)增強(qiáng)和使用深度學(xué)習(xí)方法的數(shù)據(jù)增強(qiáng)。

幾何變換

諸如翻轉(zhuǎn)(Flip),裁剪(Crop),旋轉(zhuǎn)(Rotation)和移位(Translation)之類(lèi)的幾何變換是一些常用的數(shù)據(jù)增強(qiáng)技術(shù)。我們將在本文中簡(jiǎn)要討論它們。

翻轉(zhuǎn)

翻轉(zhuǎn)是取任意給定圖像的鏡像。它是最簡(jiǎn)單的增強(qiáng)技術(shù)之一。圖像可以水平或垂直翻轉(zhuǎn)。但是,水平翻轉(zhuǎn)在這兩者之間更為常見(jiàn)。

裁剪

裁剪是一種數(shù)據(jù)增強(qiáng)技術(shù),用于通過(guò)裁剪邊界像素來(lái)減小原始圖像的大小。裁剪時(shí)不會(huì)保留空間尺寸。在這種類(lèi)型的數(shù)據(jù)增強(qiáng)中,不能保證轉(zhuǎn)換后的圖像與原始圖像屬于相同的輸出標(biāo)簽

在上面的圖像中,通過(guò)從左右方向裁剪像素,從原始圖像生成了四個(gè)圖像。裁剪圖像的尺寸從256x256減小到227x277。

旋轉(zhuǎn)

圖像可以在軸上向左或向右旋轉(zhuǎn)1到359度。1到20度之間的旋轉(zhuǎn)稱(chēng)為輕微旋轉(zhuǎn),并且是用于增強(qiáng)原始圖像的有用技術(shù)。隨著旋轉(zhuǎn)度的增加,轉(zhuǎn)換后的數(shù)據(jù)可能無(wú)法保留其原始標(biāo)簽。

移位

翻譯是一種將圖像向左,向右,向上或向下平移的技術(shù)。這是一種非常有用的轉(zhuǎn)換技術(shù),可以避免數(shù)據(jù)中的位置偏差。移位圖像時(shí),剩余空間將被填充為0,255或被隨機(jī)噪聲填充,從而保留了圖像的原始大小。

基于GAN的數(shù)據(jù)增強(qiáng)

生成對(duì)抗網(wǎng)絡(luò)(GAN)也稱(chēng)為GAN,是一種生成建模技術(shù),其中可以從數(shù)據(jù)集中創(chuàng)建人工實(shí)例,從而保留原始集的相似特征[9]。

GAN由兩個(gè)相互競(jìng)爭(zhēng)的人工神經(jīng)網(wǎng)絡(luò)(ANN)組成,即生成器 generator 與判別器 discriminator。生成器創(chuàng)建新的數(shù)據(jù)實(shí)例,而判別器則評(píng)估它們的真實(shí)性[10]。

這是由GAN生成的人臉圖像,這是在人臉上訓(xùn)練出來(lái)的。請(qǐng)注意,這些是合成的面孔,而不是真實(shí)的人。

這些是一些數(shù)據(jù)增強(qiáng)技術(shù),通常用于從有限的數(shù)據(jù)集中生成更多數(shù)據(jù),從而可以訓(xùn)練出更有效的卷積神經(jīng)網(wǎng)絡(luò)。

Olaf和他的團(tuán)隊(duì)在訓(xùn)練數(shù)據(jù)有限的情況下,利用在圖像上的平移、旋轉(zhuǎn)和隨機(jī)彈性變換等數(shù)據(jù)增強(qiáng)技術(shù)訓(xùn)練U-net體系結(jié)構(gòu)模型,并在2015年ISBI細(xì)胞追蹤挑戰(zhàn)中以較大優(yōu)勢(shì)獲得這些類(lèi)別的冠軍。

因此,下次在訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)時(shí),請(qǐng)使用這些技術(shù)來(lái)創(chuàng)建更多數(shù)據(jù)。

你平時(shí)使用了哪些數(shù)據(jù)增強(qiáng)技術(shù)?在下面評(píng)論分享的想法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7841

    瀏覽量

    93495
  • 圖像識(shí)別
    +關(guān)注

    關(guān)注

    9

    文章

    535

    瀏覽量

    40198
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    數(shù)據(jù)傳輸拖慢訓(xùn)練?三維一體調(diào)度讓AI任務(wù)提速40%

    作為AI開(kāi)發(fā)者,你是否無(wú)數(shù)次陷入這樣的困境:訓(xùn)練千億參數(shù)大模型,數(shù)據(jù)傳輸占了總耗時(shí)的60%,GPU空轉(zhuǎn)等待如同“帶薪摸魚(yú)”;跨地域調(diào)用算力,公網(wǎng)帶寬瓶頸讓TB級(jí)數(shù)據(jù)集傳輸動(dòng)輒耗時(shí)數(shù)天;算力、數(shù)
    的頭像 發(fā)表于 01-26 14:20 ?269次閱讀

    芯盾時(shí)代揭秘訓(xùn)練數(shù)據(jù)投毒攻擊

    的暗流正在威脅這艘方舟能否駛向未來(lái)——這就是被OWASP列為L(zhǎng)LM十大安全威脅之四的“訓(xùn)練數(shù)據(jù)投毒”(Data and Model Poisoning)。
    的頭像 發(fā)表于 01-23 10:25 ?754次閱讀

    自動(dòng)駕駛大模型的訓(xùn)練數(shù)據(jù)有什么具體要求?

    及環(huán)境的變化。 圖片源自:網(wǎng)絡(luò) 大模型能不能在真實(shí)交通環(huán)境中看懂路、判斷狀況、做出正確決定,關(guān)鍵在于它訓(xùn)練時(shí)看到的東西有沒(méi)有覆蓋足夠多、夠真實(shí)、夠準(zhǔn)確。若訓(xùn)練數(shù)據(jù)有缺陷、種類(lèi)單一、環(huán)境
    的頭像 發(fā)表于 12-26 09:32 ?389次閱讀
    自動(dòng)駕駛大模型的<b class='flag-5'>訓(xùn)練</b><b class='flag-5'>數(shù)據(jù)</b>有什么具體要求?

    labview如何實(shí)現(xiàn)數(shù)據(jù)的采集與實(shí)時(shí)預(yù)測(cè)

    現(xiàn)有以下問(wèn)題:labview可以實(shí)現(xiàn)數(shù)據(jù)的采集以及調(diào)用python代碼,但如何將這兩項(xiàng)功能集成在一個(gè)VI文件里,從而實(shí)現(xiàn)數(shù)據(jù)的采集與實(shí)時(shí)預(yù)測(cè)?,F(xiàn)有條件如下:已完成數(shù)據(jù)的采集系統(tǒng),python中的預(yù)測(cè)代碼也已經(jīng)
    發(fā)表于 12-03 21:13

    NVIDIA發(fā)布Isaac GR00T-Dreams合成數(shù)據(jù)生成與神經(jīng)仿真框架

    機(jī)器人需要借助大規(guī)模、高物理精度且多樣化的數(shù)據(jù)集進(jìn)行訓(xùn)練,才能在復(fù)雜環(huán)境中進(jìn)行推理并完成多種任務(wù),而目前這些數(shù)據(jù)難以公開(kāi)獲取。
    的頭像 發(fā)表于 11-03 15:12 ?1103次閱讀

    在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗(yàn)

    模型。 我們使用MNIST數(shù)據(jù)集,訓(xùn)練一個(gè)卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,用于手寫(xiě)數(shù)字識(shí)別。一旦模型被訓(xùn)練并保存,就可以用于對(duì)新圖像進(jìn)行推理和預(yù)測(cè)。要使用生成的模型進(jìn)行推理,可以按照以下步
    發(fā)表于 10-22 07:03

    NVIDIA助力湯元科技突破智能駕駛數(shù)據(jù)獲取與生成瓶頸

    蘇州湯元科技有限公司(以下簡(jiǎn)稱(chēng)“湯元科技”)是一家專(zhuān)注于三維重建與世界模型的科技公司,為自動(dòng)駕駛與具身智能提供高質(zhì)量、多樣化的訓(xùn)練數(shù)據(jù)。通過(guò)將自研的世界模型技術(shù)與 NVIDIA Cosmos 結(jié)合,實(shí)現(xiàn)真實(shí)物理世界的三維重建、場(chǎng)景泛化,并提升
    的頭像 發(fā)表于 09-06 15:16 ?1638次閱讀

    【Sipeed MaixCAM Pro開(kāi)發(fā)板試用體驗(yàn)】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    圖像的快速鑒別,滿(mǎn)足實(shí)時(shí)或準(zhǔn)實(shí)時(shí)的應(yīng)用需求。 3. 數(shù)據(jù)采集 AI圖片數(shù)據(jù)集,本項(xiàng)目使用gemini生成圖片,使用的是gem來(lái)實(shí)現(xiàn)的。 提示詞如下 你是一個(gè)能夠生成美術(shù)繪本風(fēng)格插畫(huà)的智
    發(fā)表于 08-21 13:59

    基于大規(guī)模人類(lèi)操作數(shù)據(jù)預(yù)訓(xùn)練的VLA模型H-RDT

    近年來(lái),機(jī)器人操作領(lǐng)域的VLA模型普遍基于跨本體機(jī)器人數(shù)據(jù)集預(yù)訓(xùn)練,這類(lèi)方法存在兩大局限:不同機(jī)器人本體和動(dòng)作空間的差異導(dǎo)致統(tǒng)一訓(xùn)練困難;現(xiàn)有大規(guī)模機(jī)器人演示數(shù)據(jù)稀缺且質(zhì)量參差不齊。得
    的頭像 發(fā)表于 08-21 09:56 ?1247次閱讀
    基于大規(guī)模人類(lèi)操作<b class='flag-5'>數(shù)據(jù)</b>預(yù)<b class='flag-5'>訓(xùn)練</b>的VLA模型H-RDT

    利用NVIDIA Cosmos模型訓(xùn)練通用機(jī)器人

    機(jī)器人領(lǐng)域的一大核心挑戰(zhàn)在于如何讓機(jī)器人掌握新任務(wù),而無(wú)需針對(duì)每個(gè)新任務(wù)和環(huán)境耗費(fèi)大量精力收集和標(biāo)注數(shù)據(jù)集。NVIDIA 的最新研究方案通過(guò)生成式 AI、世界基礎(chǔ)模型(如 NVIDIA Cosmos
    的頭像 發(fā)表于 08-05 16:22 ?2271次閱讀
    利用NVIDIA Cosmos模型<b class='flag-5'>訓(xùn)練</b>通用機(jī)器人

    訓(xùn)練平臺(tái)數(shù)據(jù)集過(guò)大無(wú)法下載數(shù)據(jù)集至本地怎么解決?

    起因是現(xiàn)在平臺(tái)限制了圖片數(shù)量,想要本地訓(xùn)練下載數(shù)據(jù)集時(shí)發(fā)現(xiàn)只會(huì)跳出網(wǎng)絡(luò)異常的錯(cuò)誤,請(qǐng)問(wèn)這有什么解決辦法?
    發(fā)表于 07-22 06:03

    使用AICube導(dǎo)入數(shù)據(jù)集點(diǎn)創(chuàng)建后提示數(shù)據(jù)集不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯(cuò)誤日志** 但是使用示例的數(shù)據(jù)集可以完成訓(xùn)練并部署
    發(fā)表于 06-24 06:07

    數(shù)據(jù)集下載失敗的原因?

    數(shù)據(jù)集下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報(bào)錯(cuò)網(wǎng)絡(luò)錯(cuò)誤 大的數(shù)據(jù)集多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    OCR識(shí)別訓(xùn)練完成后給的是空壓縮包,為什么?

    OCR識(shí)別 一共弄了26張圖片,都標(biāo)注好了,點(diǎn)擊開(kāi)始訓(xùn)練,顯示訓(xùn)練成功了,也將壓縮包發(fā)到郵箱了,下載下來(lái)后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點(diǎn),參考我們的ocr識(shí)別訓(xùn)練
    發(fā)表于 05-28 06:46

    ez-usb3.0如何更改slfifosync中的數(shù)據(jù),可以生成8bit數(shù)據(jù)位的usb固件?

    使用gpif ii生成.h文件后,ez usb suite中載入slfifosync文件夾,并將.h文件放進(jìn)去。由于原slfifosync中好像只能選擇16或者32bit數(shù)據(jù)位的,生成的.img燒錄
    發(fā)表于 05-14 07:53
    隆昌县| 江油市| 富顺县| 望江县| 即墨市| 灌云县| 板桥市| 巴彦县| 德保县| 岳普湖县| 铁岭市| 台江县| 客服| 新疆| 彭山县| 大埔区| 沙湾县| 镇平县| 波密县| 鹿泉市| 读书| 凭祥市| 榆树市| 安西县| 五家渠市| 林口县| 抚顺县| 双峰县| 石楼县| 仪陇县| 应城市| 宝应县| 定结县| 吴忠市| 临汾市| 衢州市| 松滋市| 兴隆县| 沅江市| 麻城市| 屏边|