컨볼루션 신경망의 레이어별 데이터 형태의 변화

        일반적인 컨벌루션 신경망의 입력은 4차원 텐서, NCHW 또는 NHWC 형식의 4-D 텐서, N은 batch_size vernacular, 즉 배치에 여러 그림이 있음을 의미하고, C는 채널 수, 색상 그림은 3, 흑백은 1, H는 높이, W는 이미지 너비, 컨볼루션 레이어의 매개변수에는 일반적으로 두 가지 필수 옵션이 있습니다. 하나는 입력 채널, 입력 채널, 출력 채널, 출력 채널입니다. 이 두 매개변수는 계산 중 데이터의 모양을 변경, 구체적으로 데이터의 처음 두 차원을 변경하는 것으로 나타나며, 더 구체적으로 이미지의 채널 번호 차원입니다.

        그런 다음 또 다른 레이어인 풀링 레이어인 Pool2D는 데이터의 모양, 특히 데이터의 높이와 너비를 변경합니다. 일반적으로 해당 매개 변수는 2*2로 설정되고 높이와 너비는 예를 들어, 입력 데이터는 N*1*28*28이고 컨볼루션 레이어(매개 변수는 입력 채널 1, 출력 채널 32) 후 출력 결과는 N입니다. *32*28* 28, 풀링 레이어 후(매개변수는 2*2) 출력 결과는 N*32*14*14입니다.

        이 글은 제가 배우기 시작했을 때 다소 혼란스러웠던 최근 연구의 요점을 주로 기록한 것입니다.

рекомендация

отblog.csdn.net/zy1620454507/article/details/128901279
рекомендация