日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用TensorFlow框架演示了卷積神經網絡在MNIST數(shù)據(jù)集上的應用

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-08-27 09:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Google產品分析Zlatan Kremonic介紹了卷積神經網絡的機制,并使用TensorFlow框架演示了卷積神經網絡在MNIST數(shù)據(jù)集上的應用。

卷積神經網絡(CNN)是一種前饋人工神經網絡,其神經元連接模擬了動物的視皮層。在圖像分類之類的計算機視覺任務中,CNN特別有用;不過,CNN也可以應用于其他機器學習任務,只要該任務中至少一維上的屬性的順序對分類而言是必不可少的。例如,CNN也用于自然語言處理和音頻分析。

CNN的主要組成部分是卷積層(convolutional layer)、池化層(pooling layer)、ReLU層(ReLU layer)、全連接層(fully connected layer)。

圖片來源:learnopencv.com

卷積層

卷積層從原輸入的三維版本開始,一般是包括色彩、寬度、高度三維的圖像。接著,圖像被分解為過濾器(核)的子集,每個過濾器的感受野均小于圖像總體。這些過濾器接著沿著輸入量的寬高應用卷積,計算過濾器項和輸入的點積,并生成過濾器的二維激活映射。這使得網絡學習因為偵測到輸入的空間位置上特定種類的特征而激活的過濾器。過濾器沿著整個圖像進行“掃描”,這讓CNN具有平移不變性,也就是說,CNN可以處理位于圖像不同部分的物體。

接著疊加激活函數(shù),這構成卷積層輸出的深度。輸出量中的每一項因此可以視作查看輸入的一小部分的神經元的輸出,同一激活映射中的神經元共享參數(shù)。

卷積層的一個關鍵概念是局部連通性,每個神經元僅僅連接到輸入量中的一小部分。過濾器的尺寸,也稱為感受野,是決定連通程度的關鍵因素。

其他關鍵參數(shù)是深度、步長、補齊。深度表示創(chuàng)建的特征映射數(shù)目。步長控制每個卷積核在圖像上移動的步幅。一般將步長設為1,從而導向高度重疊的感受野和較大的輸出量。補齊讓我們可以控制輸出量的空間大小。如果我們用零補齊(zero-padding),它能提供和輸入量等高等寬的輸出。

圖片來源:gabormelli.com

池化層

池化是一種非線性下采樣的形式,讓我們可以在保留最重要的特征的同時削減卷積輸出。最常見的池化方法是最大池化,將輸入圖像(這里是卷積層的激活映射)分區(qū)(無重疊的矩形),然后每區(qū)取最大值。

池化的關鍵優(yōu)勢之一是降低參數(shù)數(shù)量和網絡的計算量,從而緩解過擬合。此外,由于池化去除了特定特征的精確位置的信息,但保留了該特征相對其他特征的位置信息,結果也提供了平移不變性。

最常見的池化大小是2 x 2(步長2),也就是從輸入映射中去除75%的激活。

圖片來源:Leonardo Araujo dos Santos

ReLU層

修正線性單元(Rectifier Linear Unit)層應用如下激活函數(shù)

至池化層的輸出。它在不影響卷積層的感受野的前提下增加了整個網絡的非線性。當然,我們也可以應用其他標準的非線性激活函數(shù),例如tanh和sigmoid。

圖片來源:hashrocket.com

全連接層

獲取ReLU層的輸出,將其扁平化為單一向量,以便調節(jié)權重。

圖片來源:machinethink.net

使用TensorFlow在MNIST數(shù)據(jù)集上訓練CNN

下面我們將展示如何在MNIST數(shù)據(jù)集上使用TensorFlow訓練CNN,并達到接近99%的精確度。

首先導入需要的庫:

import numpy as np

import tensorflow as tf

import matplotlib.pyplot as plt

import pandas as pd

import os

from datetime import datetime

from sklearn.utils import shuffle

編寫提供錯誤率和預測響應矩陣的基本輔助函數(shù):

def y2indicator(y):

N = len(y)

y = y.astype(np.int32)

ind = np.zeros((N, 10))

for i in range(N):

ind[i, y[i]] = 1

return ind

def error_rate(p, t):

return np.mean(p != t)

接下來,我們加載數(shù)據(jù),歸一化并重整數(shù)據(jù),并生成訓練集和測試集。

data = pd.read_csv(os.path.join('Data', 'train.csv'))

def get_normalized_data(data):

data = data.as_matrix().astype(np.float32)

np.random.shuffle(data)

X = data[:, 1:]

mu = X.mean(axis=0)

std = X.std(axis=0)

np.place(std, std == 0, 1)

X = (X - mu) / std

Y = data[:, 0]

return X, Y

X, Y = get_normalized_data(data)

X = X.reshape(len(X), 28, 28, 1)

X = X.astype(np.float32)

Xtrain = X[:-1000,]

Ytrain = Y[:-1000]

Xtest = X[-1000:,]

Ytest = Y[-1000:]

Ytrain_ind = y2indicator(Ytrain)

Ytest_ind = y2indicator(Ytest)

在我們的卷積函數(shù)中,我們取步長為一,并通過設定padding為SAME確保卷積輸出的維度和輸入的維度相等。下采樣系數(shù)為二,在輸出上應用ReLU激活函數(shù):

def convpool(X, W, b):

conv_out = tf.nn.conv2d(X, W, strides=[1, 1, 1, 1], padding='SAME')

conv_out = tf.nn.bias_add(conv_out, b)

pool_out = tf.nn.max_pool(conv_out, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

return tf.nn.relu(pool_out)

初始化權重的方式是隨機正態(tài)分布取樣/sqrt(扇入+扇出)。這里的關鍵是隨機權重的方差受限于數(shù)據(jù)集大小。

def init_filter(shape, poolsz):

w = np.random.randn(*shape) / np.sqrt(np.prod(shape[:-1]) + shape[-1]*np.prod(shape[:-2] / np.prod(poolsz)))

return w.astype(np.float32)

我們定義梯度下降參數(shù),包括迭代數(shù),batch尺寸,隱藏層數(shù)量,分類數(shù)量,池尺寸。

max_iter = 6

print_period = 10

N = Xtrain.shape[0]

batch_sz = 500

n_batches = N / batch_sz

M = 500

K = 10

poolsz = (2, 2)

初始化過濾器,注意TensorFlow的維度順序。

W1_shape = (5, 5, 1, 20) # (filter_width, filter_height, num_color_channels, num_feature_maps)

W1_init = init_filter(W1_shape, poolsz)

b1_init = np.zeros(W1_shape[-1], dtype=np.float32) # one bias per output feature map

W2_shape = (5, 5, 20, 50) # (filter_width, filter_height, old_num_feature_maps, num_feature_maps)

W2_init = init_filter(W2_shape, poolsz)

b2_init = np.zeros(W2_shape[-1], dtype=np.float32)

W3_init = np.random.randn(W2_shape[-1]*7*7, M) / np.sqrt(W2_shape[-1]*7*7 + M)

b3_init = np.zeros(M, dtype=np.float32)

W4_init = np.random.randn(M, K) / np.sqrt(M + K)

b4_init = np.zeros(K, dtype=np.float32)

接著,我們定義輸入變量和目標變量,以及將在訓練過程中更新的變量:

X = tf.placeholder(tf.float32, shape=(batch_sz, 28, 28, 1), name='X')

T = tf.placeholder(tf.float32, shape=(batch_sz, K), name='T')

W1 = tf.Variable(W1_init.astype(np.float32))

b1 = tf.Variable(b1_init.astype(np.float32))

W2 = tf.Variable(W2_init.astype(np.float32))

b2 = tf.Variable(b2_init.astype(np.float32))

W3 = tf.Variable(W3_init.astype(np.float32))

b3 = tf.Variable(b3_init.astype(np.float32))

W4 = tf.Variable(W4_init.astype(np.float32))

b4 = tf.Variable(b4_init.astype(np.float32))

定義前向傳播過程,然后使用RMSProp加速梯度下降過程。

Z1 = convpool(X, W1, b1)

Z2 = convpool(Z1, W2, b2)

Z2_shape = Z2.get_shape().as_list()

Z2r = tf.reshape(Z2, [Z2_shape[0], np.prod(Z2_shape[1:])])

Z3 = tf.nn.relu( tf.matmul(Z2r, W3) + b3 )

Yish = tf.matmul(Z3, W4) + b4

cost = tf.reduce_sum(tf.nn.softmax_cross_entropy_with_logits(logits = Yish, labels = T))

train_op = tf.train.RMSPropOptimizer(0.0001, decay=0.99, momentum=0.9).minimize(cost)

# 用于計算錯誤率

predict_op = tf.argmax(Yish, 1)

我們使用標準的訓練過程,不過,當在測試集上做出預測時,由于RAM限制我們需要固定輸入尺寸;因此,我們加入的計算總代價和預測的函數(shù)稍微有點復雜。

t0 = datetime.now()

LL = []

init = tf.initialize_all_variables()

with tf.Session() as session:

session.run(init)

for i in range(int(max_iter)):

for j in range(int(n_batches)):

Xbatch = Xtrain[j*batch_sz:(j*batch_sz + batch_sz),]

Ybatch = Ytrain_ind[j*batch_sz:(j*batch_sz + batch_sz),]

if len(Xbatch) == batch_sz:

session.run(train_op, feed_dict={X: Xbatch, T: Ybatch})

if j % print_period == 0:

test_cost = 0

prediction = np.zeros(len(Xtest))

for k in range(int(len(Xtest) / batch_sz)):

Xtestbatch = Xtest[k*batch_sz:(k*batch_sz + batch_sz),]

Ytestbatch = Ytest_ind[k*batch_sz:(k*batch_sz + batch_sz),]

test_cost += session.run(cost, feed_dict={X: Xtestbatch, T: Ytestbatch})

prediction[k*batch_sz:(k*batch_sz + batch_sz)] = session.run(

predict_op, feed_dict={X: Xtestbatch})

err = error_rate(prediction, Ytest)

if j == 0:

print("Cost / err at iteration i=%d, j=%d: %.3f / %.3f" % (i, j, test_cost, err))

LL.append(test_cost)

print("Elapsed time:", (datetime.now() - t0))

plt.plot(LL)

plt.show()

輸出:

Cost / err at iteration i=0, j=0: 2243.417 / 0.805

Cost / err at iteration i=1, j=0: 116.821 / 0.035

Cost / err at iteration i=2, j=0: 78.144 / 0.029

Cost / err at iteration i=3, j=0: 57.462 / 0.018

Cost / err at iteration i=4, j=0: 52.477 / 0.015

Cost / err at iteration i=5, j=0: 48.527 / 0.018

Elapsed time: 0:09:16.157494

結語

如我們所見,模型在測試集上的表現(xiàn)在98%到99%之間。在這個練習中,我們沒有進行任何超參數(shù)調整,但這是很自然的下一步。我們也可以增加正則化、動量、dropout。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4844

    瀏覽量

    108248
  • 圖像分類
    +關注

    關注

    0

    文章

    97

    瀏覽量

    12539
  • 數(shù)據(jù)集

    關注

    4

    文章

    1240

    瀏覽量

    26274

原文標題:卷積神經網絡簡明教程

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【瑞薩AI挑戰(zhàn)賽】手寫數(shù)字識別模型RA8P1 Titan Board的部署

    MNIST數(shù)據(jù)集訓練,選擇輕量級卷積神經網絡作為基礎網絡結構,兼顧模型精度與端側部署的輕量化要求,避免因模型過大導致RA8P1開發(fā)板的內存
    發(fā)表于 03-15 20:42

    神經網絡的初步認識

    日常生活中的智能應用都離不開深度學習,而深度學習則依賴于神經網絡的實現(xiàn)。什么是神經網絡?神經網絡的核心思想是模仿生物神經系統(tǒng)的結構,特別是大腦中神經
    的頭像 發(fā)表于 12-17 15:05 ?498次閱讀
    <b class='flag-5'>神經網絡</b>的初步認識

    自動駕駛中常提的卷積神經網絡是個啥?

    自動駕駛領域,經常會聽到卷積神經網絡技術。卷積神經網絡,簡稱為CNN,是一種專門用來處理網格狀數(shù)據(jù)
    的頭像 發(fā)表于 11-19 18:15 ?2289次閱讀
    自動駕駛中常提的<b class='flag-5'>卷積</b><b class='flag-5'>神經網絡</b>是個啥?

    CNN卷積神經網絡設計原理及MCU200T仿真測試

    數(shù)的提出很大程度的解決BP算法優(yōu)化深層神經網絡時的梯度耗散問題。當x&gt;0 時,梯度恒為1,無梯度耗散問題,收斂快;當x&lt;0 時,該層的輸出為0。 CNN
    發(fā)表于 10-29 07:49

    NMSISI庫的使用

    :   神經網絡卷積函數(shù)   神經網絡激活函數(shù)   全連接層函數(shù)   神經網絡池化函數(shù)   Softmax 函數(shù)   神經網絡支持功能
    發(fā)表于 10-29 07:07

    NMSIS神經網絡庫使用介紹

    :   神經網絡卷積函數(shù)   神經網絡激活函數(shù)   全連接層函數(shù)   神經網絡池化函數(shù)   Softmax 函數(shù)   神經網絡支持功能
    發(fā)表于 10-29 06:08

    構建CNN網絡模型并優(yōu)化的一般化建議

    整個模型非常巨大。所以要想實現(xiàn)輕量級的CNN神經網絡模型,首先應該避免嘗試單層神經網絡。 2)減少卷積核的大?。篊NN神經網絡是通過權值共享的方式,利用
    發(fā)表于 10-28 08:02

    卷積運算分析

    數(shù)據(jù),故設計ConvUnit模塊實現(xiàn)單個感受域規(guī)模的卷積運算. 卷積運算:不同于數(shù)學當中提及到的卷積概念,CNN
    發(fā)表于 10-28 07:31

    Ubuntu20.04系統(tǒng)中訓練神經網絡模型的一些經驗

    模型。 我們使用MNIST數(shù)據(jù),訓練一個卷積神經網絡(CNN)模型,用于手寫數(shù)字識別。一旦模型被訓練并保存,就可以用于對新圖像進行推理和預
    發(fā)表于 10-22 07:03

    CICC2033神經網絡部署相關操作

    完成神經網絡量化后,需要將神經網絡部署到硬件加速器。首先需要將所有權重數(shù)據(jù)以及輸入數(shù)據(jù)導入到
    發(fā)表于 10-20 08:00

    液態(tài)神經網絡(LNN):時間連續(xù)性與動態(tài)適應性的神經網絡

    神經元,但卻能產生復雜的行為。受此啟發(fā),與傳統(tǒng)的神經網絡相比,LNN旨在通過模擬大腦中神經元之間的動態(tài)連接來處理信息,這種網絡能夠順序處理數(shù)據(jù)
    的頭像 發(fā)表于 09-28 10:03 ?1627次閱讀
    液態(tài)<b class='flag-5'>神經網絡</b>(LNN):時間連續(xù)性與動態(tài)適應性的<b class='flag-5'>神經網絡</b>

    神經網絡的并行計算與加速技術

    問題。因此,并行計算與加速技術神經網絡研究和應用中變得至關重要,它們能夠顯著提升神經網絡的性能和效率,滿足實際應用中對快速響應和大規(guī)模數(shù)據(jù)處理的需求。
    的頭像 發(fā)表于 09-17 13:31 ?1350次閱讀
    <b class='flag-5'>神經網絡</b>的并行計算與加速技術

    卷積神經網絡如何監(jiān)測皮帶堵料情況 #人工智能

    卷積神經網絡
    jf_60804796
    發(fā)布于 :2025年07月01日 17:08:42

    神經網絡專家系統(tǒng)電機故障診斷中的應用

    的診斷誤差。仿真結果驗證該算法的有效性。 純分享帖,需要者可點擊附件免費獲取完整資料~~~*附件:神經網絡專家系統(tǒng)電機故障診斷中的應用.pdf【免責聲明】本文系網絡轉載,版權歸原作
    發(fā)表于 06-16 22:09

    神經網絡RAS異步電機轉速估計中的仿真研究

    ,在一定程度上擴展轉速估計范圍。 純分享帖,需要者可點擊附件免費獲取完整資料~~~*附件:神經網絡RAS異步電機轉速估計中的仿真研究.pdf【免責聲明】本文系網絡轉載,版權歸原作者
    發(fā)表于 06-16 21:54
    阳高县| 丹棱县| 鹰潭市| 嵊州市| 贵州省| 德江县| 甘德县| 赤壁市| 望都县| 精河县| 易门县| 邓州市| 临沂市| 潢川县| 库伦旗| 襄汾县| 六盘水市| 开封市| 龙陵县| 德惠市| 玛纳斯县| 六枝特区| 长治县| 漳浦县| 清新县| 南汇区| 隆安县| 绥德县| 兴安盟| 吕梁市| 龙胜| 阿城市| 鄂伦春自治旗| 嫩江县| 香河县| 阜城县| 祥云县| 淮阳县| 陇西县| 华容县| 旬邑县|