09_DL(Deep_Learning)

12_CIFAR10

chuuvelop 2025. 4. 28. 17:18

728x90

CIFAR10

from tensorflow import keras
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

labels = ["Airplane", "Automobile", "Bird", "Cat", "Deer", "Dog", "Frog", "Horse", "Ship", "Truck"]

# cifar10 데이터 로드
(x_train, y_train), (x_test, y_test) = keras.datasets.cifar10.load_data()

x_train.shape, x_test.shape

((50000, 32, 32, 3), (10000, 32, 32, 3))

np.unique(y_train, return_counts = True)

(array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], dtype=uint8),
 array([5000, 5000, 5000, 5000, 5000, 5000, 5000, 5000, 5000, 5000],
       dtype=int64))

fig, axs = plt.subplots(1, 10, figsize = (15, 15))

for i in range(10):
axs[i].imshow(x_train[i])
axs[i].axis("off")
plt.show()

[labels[i] for i in y_train[:10, 0]]

['Frog',
 'Truck',
 'Truck',
 'Deer',
 'Automobile',
 'Automobile',
 'Bird',
 'Horse',
 'Ship',
 'Cat']

x_train.min(), x_train.max()

(0, 255)

scaled_train = x_train / 255
scaled_test = x_test / 255

scaled_sub, scaled_val, y_sub, y_val = train_test_split(scaled_train, y_train, test_size = 0.2,
stratify = y_train, random_state = 26)

scaled_sub.shape, scaled_val.shape, scaled_test.shape

((40000, 32, 32, 3), (10000, 32, 32, 3), (10000, 32, 32, 3))

y_sub.shape

(40000, 1)

모델 설계

배치 정규화(Batch Normalization)

의의
- 딥러닝 모델의 학습을 안정화하고 속도를 향상시키기 위해 사용하는 기법
- 각 층에서 입력 데이터의 분포를 정규화하여 학습 과정을 개선
목적
- 내부 공변량 변화 감소
  - 신경망의 각 층이 학습되는 동안 입력데이터의 분포가 지속적으로 변화하는 문제를 완화
  - 각 층이 안정적으로 학습할 수 있도록 하는 역할
- 학습 속도 향상
  - 정규화된 입력으로 더 높은 학습률을 사용할 수 있게 하여 학습 속도를 높일 수 있음
- 초기화에 대한 민감도 감소
  - 가중치 초기화에 덜 민감하게 만들어 초기화 방법의 선택에 따른 영향을 줄임
- 규제
  - 과대적합을 방지
작동 원리
- 주로 신경망의 각 층에서 활성화 함수 입력 전에 적용
1. 미니배치 통계 계산
  - 미니배치 내의 각 특성에 대해 평균과 분산을 계산
2. 정규화
  - 각 입력 특성을 정규화하여 평균이 0이고 분산이 1인 값으로 변환
3. 스케일링 및 이동
  - 정규화된 값에 학습 가능한 파라미터 감마와 베타를 적용하여 출력값을 조정
  - 모델이 필요에 따라 데이터를 재조정하는 역할
배치 정규화의 적용 예시
- 밀집층 이후 활성화 함수 적용 전
- 합성곱층 연산 후, 활성화 함수 적용 전

model = keras.Sequential()

model.add(keras.Input(shape = (32, 32, 3)))

model.add(keras.layers.Conv2D(64, 4, padding = "same"))
model.add(keras.layers.BatchNormalization())
model.add(keras.layers.Activation(keras.activations.relu))
model.add(keras.layers.Dropout(0.3))
model.add(keras.layers.Conv2D(64, 4, padding = "same"))
model.add(keras.layers.BatchNormalization())
model.add(keras.layers.Activation(keras.activations.relu))
model.add(keras.layers.MaxPool2D(2))
model.add(keras.layers.Dropout(0.3))

model.add(keras.layers.Conv2D(128, 4, padding = "same"))
model.add(keras.layers.BatchNormalization())
model.add(keras.layers.Activation(keras.activations.relu))
model.add(keras.layers.Dropout(0.3))
model.add(keras.layers.Conv2D(128, 4, padding = "same"))
model.add(keras.layers.BatchNormalization())
model.add(keras.layers.Activation(keras.activations.relu))
model.add(keras.layers.MaxPool2D(2))
model.add(keras.layers.Dropout(0.3))

model.add(keras.layers.Conv2D(128, 4, padding = "same"))
model.add(keras.layers.BatchNormalization())
model.add(keras.layers.Activation(keras.activations.relu))
model.add(keras.layers.Dropout(0.3))
model.add(keras.layers.Conv2D(128, 4, padding = "same"))
model.add(keras.layers.BatchNormalization())
model.add(keras.layers.Activation(keras.activations.relu))
model.add(keras.layers.MaxPool2D(2))
model.add(keras.layers.Dropout(0.3))

model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(256))
model.add(keras.layers.BatchNormalization())
model.add(keras.layers.Activation(keras.activations.relu))
model.add(keras.layers.Dropout(0.3))

model.add(keras.layers.Dense(10, activation = "softmax"))

model.compile(loss = "sparse_categorical_crossentropy", optimizer = "adam", metrics = ["accuracy"])

model.summary()

...

es_cb = keras.callbacks.EarlyStopping(patience = 4, restore_best_weights = True)

history = model.fit(scaled_sub, y_sub, epochs = 100, validation_data = (scaled_val, y_val),
callbacks = [es_cb], batch_size = 64)

...

728x90

'09_DL(Deep_Learning)' 카테고리의 다른 글

14_순환신경망(텍스트 분류)-IMDB리뷰_데이터셋 (4)	2025.04.28
13_순환 신경망(RNN) (1)	2025.04.28
11_CNN_MNIST (0)	2025.04.25
10_합성곱 신경망_시각화(부츠) (1)	2025.04.25
09_합성곱 신경망(컬러 이미지 분류) (0)	2025.04.24

현재글12_CIFAR10

250x250

chuuvelop 님의 블로그

chuuvelop 님의 블로그 입니다.

파이썬리스트, 파이썬continue, 파이썬튜플, 판다스데이터자르기, 파이썬enumerate, 파이썬리스트내포, pandas, 한국어형태소분석기설치, 판다스split, 파이썬조건식, 파이토치기초문법, konlpy설치방법, 파이썬세트, konlpy설치, 파이썬제어문, 형태소분석기konlpy설치, 판다스시리즈, 파이썬컬렉션, 한국어형태소분석기, 판다스데이터프레임,

Today :
Yesterday :

chuuvelop 님의 블로그

12_CIFAR10

모델 설계

배치 정규화(Batch Normalization)

'09_DL(Deep_Learning)' 카테고리의 다른 글

'09_DL(Deep_Learning)'의 다른글

티스토리툴바

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

12_CIFAR10

모델 설계

배치 정규화(Batch Normalization)

'09_DL(Deep_Learning)' 카테고리의 다른 글

'09_DL(Deep_Learning)'의 다른글

관련글

티스토리툴바