[68]一次元および三次元のコンボリューション

1.2次元データ
の画像認識、オブジェクト検出、顔認識ニューラルネットワークのためにそれを使用すること変換する方法フレーム畳み込みニューラルネットワークから、
議論の多くは、ある意味の2Dデータを考慮した場合でも、画像データを画像は、にそれほど一般的で
あっても、3Dデータのみを2D画像に限定されるものではない思考の手の多く、さらに1Dに拡張することができ、そして

入力画像上の2次元コンボリューションは、14×14であり、5×5フィルタ重畳が使用できる
14×14の画像が5×5のフィルタと畳み込みする方法を見て、その後
これによって操作は、10×10に出力されます

そのような14×14×3のように複数のチャネル、場合には、整合フィルタは、5×5×3かもしれ
な16のように複数のフィルタは、あなたが最終的には10×10×16で取得した場合

2.1次元データを
1次元データのための早すぎるアイデアであることが判明しました

例えば、EKG信号が残っている、または心電図(心電図)
一方の電極が胸の上に配置され、心拍胸に起因する微弱な貫通電流測定電極
ため心拍のは、微弱電波は、測定電極の組を生成することができます
これは、ハートビートと各ピークに相当する人物EKGの心拍世代であります

そのような医療診断として、EKG信号を使用する
データは、各時系列のEKG瞬時電圧であるため、1次元データを処理することにより構成されている
入力の大きさは14×14ではない、14サイズの入力であってもよいです

一次元畳み込みフィルタの使用を必要とし得るようなA状況に
代えて、5×5のわずか1×5フィルタを必要とします

信号の一次元畳み込みを使用することは、5次元回旋データに14次元のデータを検索し、10次元の出力を生成する場合

マルチチャンネルの場合は再度、そのようなAシナリオでは14×1の通路を得ることができ
、フィルタ16は、場合EKG場合、5×1である
10×16の最後のデータを得ることができ、その畳み込みは、ネットワーク内の層であってもよいです

次の層畳み込みネットワークのための
16に一致するチャネルを必要と10×16の入力データは5次元畳み込みフィルタのために使用することができる場合、
フィルタ32は、さらに層6の出力である場合×32

10×10×16のデータ処理が類似している2次元データは、
5×5×16畳み込みを使用することができる、前記数16に一致するように2つのチャネルは、
6×6を取得する出力である
場合図32は、出力源は32であり、6×6×32フィルタであります

これらの方法の全てはまた、1次元データに適用することができ、異なる場所で同一の特徴検出器を使用することができ
、例えば、差分心拍EKG信号を区別するために、時間のハートビートを検出するために、異なる位置で同じ機能を使用することができることは、軸
そう畳み込み1Dネットワークは、同様に、多くの用途のために一次元データは、データのために使用することができ
、実際に再帰的ニューラルネットワーク処理を使用します

3.3次元データ
今3Dブロック、データ入力3Dを持つ列1Dデジタルマトリックスまたは異なる数に、

一例として、CTスキャンでは、これは、X線の使用がされた後、身体の3Dモデル出力
(画像)CTスキャンは、それが別体セグメントを得る達成することができるということです

 

CTスキャン、今同じことをやっているときは、胴体異なるスライスを見ることができ、このデータは、本質的に3次元です

データのこの実施形態の理解は、次のとおり
、データは今長さ、幅及び高さを含むと仮定し、前記胴体のスライスに対して各スライスの対応

如果想要在3D扫描或CT扫描中应用卷积网络进行特征识别
也可以从二维和一维的卷积里得到想法,并将其应用到3D卷积中

为了简单起见,如果有一个3D对象,比如说是14×14×14
这也是输入CT扫描的宽度与深度(后两个14)
再次提醒,正如图像不是必须以矩形呈现,3D对象也不是一定是一个完美立方体
所以长和宽可以不一样
同样CT扫描结果的长宽高也可以是不一致的
为了简化讨论,仅使用14×14×14为例

如果现在使用5×5×5过滤器进行卷积,过滤器现在也是3D的,这将会给一个10×10×10的结果输出
技术上来说也可以再×1(编号1所示),如果这有一个1的通道
这仅仅是一个3D模块,但是数据可以有不同数目的通道
那种情况下也是乘1(编号2所示),因为通道的数目必须与过滤器匹配
如果使用16过滤器处理5×5×5×1,接下来的输出将是10×10×10×16
这将成为3D数据卷积网络上的一层

如果下一层卷积使用5×5×5×16维度的过滤器再次卷积,通道数目也与往常一样匹配
如果有32个过滤器,操作也与之前相同,最终得到一个6×6×6×32的输出

某种程度上3D数据也可以使用3D卷积网络学习,这些过滤器实现的功能正是通过3D数据进行特征检测
CT医疗扫描是3D数据的一个实例

另一个数据处理的例子是可以将电影中随时间变化的不同视频切片看作是3D数据
可以将这个技术用于检测动作及人物行为

总而言之这就是1D、2D及3D数据处理,图像数据无处不在
以至于大多数卷积网络都是基于图像上的2D数据
但希望其他模型同样会有帮助

おすすめ

転載: www.cnblogs.com/lau1997/p/12391280.html