CNN卷积神经网络原理Word文档格式.docx

上传人:b****2 文档编号:5596460 上传时间:2023-05-05 格式:DOCX 页数:34 大小:667.04KB
下载 相关 举报
CNN卷积神经网络原理Word文档格式.docx_第1页
第1页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第2页
第2页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第3页
第3页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第4页
第4页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第5页
第5页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第6页
第6页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第7页
第7页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第8页
第8页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第9页
第9页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第10页
第10页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第11页
第11页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第12页
第12页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第13页
第13页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第14页
第14页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第15页
第15页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第16页
第16页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第17页
第17页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第18页
第18页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第19页
第19页 / 共34页
CNN卷积神经网络原理Word文档格式.docx_第20页
第20页 / 共34页
亲,该文档总共34页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

CNN卷积神经网络原理Word文档格式.docx

《CNN卷积神经网络原理Word文档格式.docx》由会员分享,可在线阅读,更多相关《CNN卷积神经网络原理Word文档格式.docx(34页珍藏版)》请在冰点文库上搜索。

CNN卷积神经网络原理Word文档格式.docx

os 

4.import 

sys 

5.import 

time 

6. 

7.import 

numpy 

8. 

9.import 

theano 

10.import 

as 

11.from 

import 

downsample 

12.from 

conv 

(2)定义CNN的基本"

构件"

CNN的基本构件包括卷积采样层、隐含层、分类器,如下

定义LeNetConvPoolLayer(卷积+采样层)

见代码注释:

1."

"

2.卷积+下采样合成一个层LeNetConvPoolLayer 

3.rng:

随机数生成器,用于初始化W 

4.input:

4维的向量, 

5.filter_shape:

(number 

of 

filters, 

num 

input 

feature 

maps,filter 

height, 

filter 

width) 

6.image_shape:

(batch 

size, 

maps,image 

image 

7.poolsize:

(#rows, 

#cols) 

8."

9.class 

LeNetConvPoolLayer(object):

10. 

def 

__init__(self, 

rng, 

input, 

filter_shape, 

image_shape, 

poolsize=(2, 

2)):

11. 

12.#assert 

condition,condition为True,则继续往下执行,condition为False,中断程序 

13.#image_shape[1]和filter_shape[1]都是num 

maps,它们必须是一样的。

14. 

assert 

image_shape[1] 

== 

filter_shape[1] 

15. 

16. 

17.#每个隐层神经元(即像素)与上一层的连接数为num 

maps 

height 

width。

18.#可以用(filter_shape[1:

])来求得 

19. 

fan_in 

(filter_shape[1:

]) 

20. 

21.#lower 

layer上每个神经元获得的梯度来自于:

output 

width"

/pooling 

size 

22. 

fan_out 

(filter_shape[0] 

(filter_shape[2:

23. 

(poolsize)) 

24. 

25.#以上求得fan_in、fan_out 

,将它们代入公式,以此来随机初始化W,W就是线性卷积核 

26. 

W_bound 

(6. 

(fan_in 

fan_out)) 

27. 

( 

28. 

29. 

(low=-W_bound, 

high=W_bound, 

size=filter_shape), 

30. 

dtype= 

31. 

), 

32. 

borrow=True 

33. 

) 

34. 

35.# 

the 

bias 

is 

1D 

tensor 

-- 

one 

per 

map 

36.#偏置b是一维向量,每个输出图的特征图都对应一个偏置, 

37.#而输出的特征图的个数由filter个数决定,因此用filter_shape[0]即number 

filters来初始化 

38. 

b_values 

((filter_shape[0],), 

39. 

(value=b_values, 

borrow=True) 

40. 

41.#将输入图像与filter卷积,函数 

42.#卷积完没有加b再通过sigmoid,这里是一处简化。

43. 

conv_out 

44. 

input=input, 

45. 

filters=, 

46. 

filter_shape=filter_shape, 

47. 

image_shape=image_shape 

48. 

49. 

50.#maxpooling,最大子采样过程 

51. 

pooled_out 

52. 

input=conv_out, 

53. 

ds=poolsize, 

54. 

ignore_border=True 

55. 

56. 

57.#加偏置,再通过tanh映射,得到卷积+子采样层的最终输出 

58.#因为b是一维向量,这里用维度转换函数dimshuffle将其reshape。

比如b是(10,), 

59.#则('

x'

 

0, 

'

))将其reshape为(1,10,1,1) 

60. 

(pooled_out 

)) 

61.#卷积+采样层的参数 

62. 

[, 

定义隐含层HiddenLayer

这个跟上一篇文章《 

DeepLearningtutorial(3)MLP多层感知机原理简介+代码详解》中的HiddenLayer是一致的,直接拿过来:

2.注释:

3.这是定义隐藏层的类,首先明确:

隐藏层的输入即input,输出即隐藏层的神经元个数。

输入层与隐藏层是全连接的。

4.假设输入是n_in维的向量(也可以说时n_in个神经元),隐藏层有n_out个神经元,则因为是全连接, 

5.一共有n_in*n_out个权重,故W大小时(n_in,n_out),n_in行n_out列,每一列对应隐藏层的每一个神经元的连接权重。

6.b是偏置,隐藏层有n_out个神经元,故b时n_out维向量。

7.rng即随机数生成器,,用于初始化W。

8.input训练模型所用到的所有输入,并不是MLP的输入层,MLP的输入层的神经元个数时n_in,而这里的参数input大小是(n_example,n_in),每一行一个样本,即每一行作为MLP的输入层。

9.activation:

激活函数,这里定义为函数tanh 

10."

11.class 

HiddenLayer(object):

12. 

n_in, 

n_out, 

W=None, 

b=None, 

13. 

activation=:

#类HiddenLayer的input即所传递进来的input 

17. 

注释:

18. 

代码要兼容GPU,则必须使用 

dtype=并且定义为 

另外,W的初始化有个规则:

如果使用tanh函数,则在-sqrt(6./(n_in+n_hidden))到sqrt(6./(n_in+n_hidden))之间均匀 

抽取数值来初始化W,若时sigmoid函数,则以上再乘4倍。

21. 

#如果W未初始化,则根据上述方法初始化。

#加入这个判断的原因是:

有时候我们可以用训练好的参数来初始化W,见我的上一篇文章。

if 

None:

25. 

W_values 

low=(6. 

(n_in 

n_out)), 

high=(6. 

size=(n_in, 

n_out) 

activation 

*= 

35. 

(value=W_values, 

name='

W'

36. 

37. 

((n_out,), 

b'

41. 

#用上面定义的W、b来初始化类HiddenLayer的W、b 

42. 

#隐含层的输出 

lin_output 

(input, 

None 

else 

activation(lin_output) 

50. 

#隐含层的参数 

定义分类器(Softmax回归)

采用Softmax,这跟《DeepLearningtutorial

(1)Softmax回归原理简介+代码详解》中的LogisticRegression是一样的,直接拿过来:

2.定义分类层LogisticRegression,也即Softmax回归 

3.在deeplearning 

tutorial中,直接将LogisticRegression视为Softmax, 

4.而我们所认识的二类别的逻辑回归就是当n_out=2时的LogisticRegression 

5."

6.#参数说明:

7.#input,大小就是(n_example,n_in),其中n_example是一个batch的大小, 

8.#因为我们训练时用的是Minibatch 

SGD,因此input这样定义 

9.#n_in,即上一层(隐含层)的输出 

10.#n_out,输出的类别数 

LogisticRegression(object):

n_out):

14.#W大小是n_in行n_out列,b为n_out维向量。

即:

每个输出对应W的一列以及b的一个元素。

value=( 

(n_in, 

n_out), 

(n_out,), 

33.#input是(n_example,n_in),W是(n_in,n_out),点乘得到(n_example,n_out),加上偏置b, 

34.#再作为的输入,得到p_y_given_x 

35.#故p_y_given_x每一行代表每一个样本被估计为各类别的概率 

36.#PS:

b是n_out维向量,与(n_example,n_out)矩阵相加,内部其实是先复制n_example个b, 

37.#然后(n_example,n_out)矩阵的每一行都加b 

40.#argmax返回最大值下标,因为本例数据集是MNIST,下标刚好就是类别。

axis=1表示按行操作。

axis=1) 

43.#params,LogisticRegression的参数 

到这里,CNN的基本”构件“都有了,下面要用这些”构件“组装成LeNet5(当然,是简化的,上面已经说了),具体来说,就是组装成:

LeNet5=input+LeNetConvPoolLayer_1+LeNetConvPoolLayer_2+HiddenLayer+LogisticRegression+output。

然后将其应用于MNIST数据集,用BP算法去解这个模型,得到最优的参数。

(3)加载MNIST数据集()

2.加载MNIST数据集load_data() 

3."

4.def 

load_data(dataset):

5. 

dataset是数据集的路径,程序首先检测该路径下有没有MNIST数据集,没有的话就下载MNIST数据集 

#这一部分就不解释了,与softmax回归算法无关。

7. 

data_dir, 

data_file 

data_dir 

and 

not 

9. 

Check 

dataset 

in 

data 

directory. 

new_path 

.."

data"

or 

:

(not 

urllib 

origin 

print 

Downloading 

from 

%s'

(origin, 

dataset) 

... 

loading 

data'

28.#以上是检测并下载数据集,不是本文重点。

下面才是load_data的开始 

30.#从"

里加载train_set, 

valid_set, 

test_set,它们都是包括label的 

31.#主要用到python里的()函数,以及 

()。

32.#‘rb’表示以二进制可读的方式打开文件 

(dataset, 

rb'

train_set, 

test_set 

(f) 

() 

38.#将数据设置成shared 

variables,主要时为了GPU加速,只有shared 

variables才能存到GPU 

memory中 

39.#GPU里数据类型只能是float。

而data_y是类别,所以最后又转换为int返回 

shared_dataset(data_xy, 

borrow=True):

data_x, 

data_y 

data_xy 

shared_x 

(data_x, 

borrow=borrow) 

shared_y 

(data_y, 

return 

shared_x, 

(shared_y, 

int32'

test_set_x, 

test_set_y 

shared_dataset(test_set) 

valid_set_x, 

valid_set_y 

shared_dataset(valid_set) 

train_set_x, 

train_set_y 

shared_dataset(train_set) 

rval 

[(train_set_x, 

train_set_y), 

(valid_set_x, 

valid_set_y), 

(test_set_x, 

test_set_y)] 

57. 

(4)实现LeNet5并测试

2.实现LeNet5 

3.LeNet5有两个卷积层,第一个卷积层有20个卷积核,第二个卷积层有50个卷积核 

4."

5.def 

evaluate_lenet5(learning_rate=, 

n_epochs=200, 

dataset='

nkerns=[20, 

50], 

batch_size=500):

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2