목차
1. 신경망
전체 구조:
그림은 입력층, 은닉층 1, 은닉층 2, 출력층
입력 레이어를 통해 특정 값을 입력한 후 히든 레이어 1, 2, 3, ...을 사용하여 x를 연속적으로 변경
아키텍처 세부정보:
입력 레이어와 은닉 레이어 사이의 선은 w1을 나타내며 입력 레이어의 데이터를 은닉 레이어의 데이터로 변환하는 알고리즘을 나타냅니다.
뉴런 수의 영향:
뉴런의 수가 많을수록 적합도는 낮아지지만 과적합 상황을 고려해야 한다.
신경망 과적합 솔루션:
데이터 전처리: 각 숫자에서 평균을 뺀 값
매개변수 초기화: 일반적으로 매개변수 초기화에는 무작위 전략이 사용됩니다.
컨벌루션 네트워크
기존 네트워크와의 차이점:
데이터를 1D로 변환하지 않고 3D 데이터 처리
전체 구조:
컨볼루션 레이어
이미지를 여러 부분으로 나눈 후 알고리즘에 따라 각 부분에 대해 특징 추출을 수행합니다.
이미지는 3차원이며 각 차원은 계산 방법에 해당합니다.
컨볼루션 계층 설계 매개변수: 슬라이딩 윈도우 스텝 크기, 컨볼루션 커널 크기, 에지 패딩, 컨볼루션 커널 수
가장자리 패딩
외부에 0의 원을 추가하면 내부 데이터의 부족을 어느 정도 보완할 수 있고 중간 값의 계산 횟수를 늘릴 수 있습니다.
기능 크기 계산
풀링 레이어
기능 맵의 수는 변경되지 않으며 원래 기능에 대해 필터링이 수행됩니다.
기능 맵 변경
클래식 네트워크 Resnet은 현재 가장 일반적으로 사용되는 모델입니다.
순환 신경망
데이터가 은닉층을 통과한 후 다시 은닉층을 통과할 수도 있습니다.
CNN은 주로 컴퓨터 비전에 사용됩니다.
RNN은 주로 자연어 처리에 사용됩니다.