博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
卷积神经网络(CNN)之一维卷积、二维卷积、三维卷积详解
阅读量:4982 次
发布时间:2019-06-12

本文共 1519 字,大约阅读时间需要 5 分钟。

作者:szx_spark

由于计算机视觉的大红大紫,二维卷积的用处范围最广。因此本文首先介绍二维卷积,之后再介绍一维卷积与三维卷积的具体流程,并描述其各自的具体应用。

1. 二维卷积

1223117-20180212184502796-2124697190.png

  • 图中的输入的数据维度为14×1414×14,过滤器大小为5×55×5,二者做卷积,输出的数据维度为10×1010×10145+1=1014−5+1=10)。如果你对卷积维度的计算不清楚,可以参考我之前的博客。

  • 上述内容没有引入channel的概念,也可以说channel的数量为1。如果将二维卷积中输入的channel的数量变为3,即输入的数据维度变为(14×14×314×14×3)。由于卷积操作中过滤器的channel数量必须与输入数据的channel数量相同,过滤器大小也变为5×5×35×5×3。在卷积的过程中,过滤器与数据在channel方向分别卷积,之后将卷积后的数值相加,即执行10×1010×10次3个数值相加的操作,最终输出的数据维度为10×1010×10

  • 以上都是在过滤器数量为1的情况下所进行的讨论。如果将过滤器的数量增加至16,即16个大小为10×10×310×10×3的过滤器,最终输出的数据维度就变为10×10×1610×10×16。可以理解为分别执行每个过滤器的卷积操作,最后将每个卷积的输出在第三个维度(channel 维度)上进行拼接。

  • 二维卷积常用于计算机视觉、图像处理领域。

2. 一维卷积

1223117-20180212193102531-761358003.png

  • 图中的输入的数据维度为8,过滤器的维度为5。与二维卷积类似,卷积后输出的数据维度为85+1=48−5+1=4

  • 如果过滤器数量仍为1,输入数据的channel数量变为16,即输入数据维度为8×168×16。这里channel的概念相当于自然语言处理中的embedding,而该输入数据代表8个单词,其中每个单词的词向量维度大小为16。在这种情况下,过滤器的维度由55变为5×165×16,最终输出的数据维度仍为44

  • 如果过滤器数量为nn,那么输出的数据维度就变为4×n4×n

  • 一维卷积常用于序列模型,自然语言处理领域。

3. 三维卷积

1223117-20180212194618921-376193862.png

这里采用代数的方式对三维卷积进行介绍,具体思想与一维卷积、二维卷积相同。

  • 假设输入数据的大小为a1×a2×a3a1×a2×a3,channel数为cc,过滤器大小为ff,即过滤器维度为f×f×f×cf×f×f×c(一般不写channel的维度),过滤器数量为nn

  • 基于上述情况,三维卷积最终的输出为(a1f+1)×(a2f+1)×(a3f+1)×n(a1−f+1)×(a2−f+1)×(a3−f+1)×n。该公式对于一维卷积、二维卷积仍然有效,只有去掉不相干的输入数据维度就行。

  • 三维卷积常用于医学领域(CT影响),视频处理领域(检测动作及人物行为)。

分类:
+加关注
4
1
上一篇:
下一篇:
posted @
2018-02-12 19:55 阅读(
33325) 评论(
2)
  
回复引用
2019-06-17 10:01
作者您好,感谢您的分享,内容很详细,很有帮助。
在此纠正一个小错误,在1二维卷积中,第三条,当过滤器数量增加到16时,过滤器的大小应该时5*5*16。
  
回复引用
4281411
2019/6/17 10:02:55
2019-06-17 10:02
16个5*5*3
发表评论

昵称:

评论内容:
引用
粗体
链接
缩进
代码
图片

不改了 退出

[Ctrl+Enter快捷键提交]

相关博文:
·
·
·
·
·
最新新闻
·
·
·
·
·
»

转载于:https://www.cnblogs.com/SanguineBoy/p/11215308.html

你可能感兴趣的文章
PSexec以及xcopy的简单使用
查看>>
Postgresql迁移数据文件存放位置
查看>>
性能优化——存储性能优化
查看>>
写一篇博文介绍JSP
查看>>
C++笔记 3
查看>>
windows 2008 下C#调用office组件访问拒绝的解决方法(failed due to the following error: 80070005 拒绝访问)...
查看>>
golang-gin框架
查看>>
java程序中中常用到的linux操作
查看>>
asp.net的3个经典范例(ASP.NET Starter Kit ,Duwamish,NET Pet Shop)学习资料
查看>>
百度star2012初赛第一场的题目
查看>>
武汉第二十七天
查看>>
最长公共子序列
查看>>
MFC 鼠标去留
查看>>
怎么用xmind给自己制定计划目标
查看>>
word转PDF-jacob
查看>>
20条技巧,让Chrome超越Firefox
查看>>
正确释放WORD对象(COM组件) COMException: 被调用的对象已与其客户端断开连接
查看>>
Leetcode题解(一)
查看>>
SSIS报不能把DBNull convert成其他类型,Object等错误的解决办法
查看>>
【31】126. Word Ladder II
查看>>