메인 콘텐츠로 건너뛰기
Colab에서 실행해 보기 머신러닝 실험 추적, 데이터셋 버저닝, 프로젝트 협업을 위해 W&B를 사용하세요.
W&B 사용의 이점
이 Colab 노트북에서는 추상 콜백인 WandbEvalCallback을 소개합니다. 이 콜백을 상속하여 모델 예측 시각화와 데이터셋 시각화를 위한 유용한 콜백을 구성할 수 있습니다.

설정 및 설치

먼저 최신 버전의 W&B를 설치합니다. 그런 다음 이 Colab 인스턴스에서 W&B를 사용할 수 있도록 인증을 진행합니다.
pip install -qq -U wandb
import os
import numpy as np
import tensorflow as tf
from tensorflow.keras import layers
from tensorflow.keras import models
import tensorflow_datasets as tfds

# W&B 관련 임포트
import wandb
from wandb.integration.keras import WandbMetricsLogger
from wandb.integration.keras import WandbModelCheckpoint
from wandb.integration.keras import WandbEvalCallback
W&B를 처음 사용하거나 로그인하지 않은 경우 wandb.login()을 실행한 뒤 표시되는 링크를 클릭하면 회원가입/로그인 페이지로 이동합니다. 무료 계정은 몇 번만 클릭하면 가입할 수 있습니다.
wandb.login()

하이퍼파라미터

재현 가능한 머신 러닝을 위해서는 적절한 설정(config) 시스템을 사용하는 것이 권장되는 모범 사례입니다. W&B를 사용하면 각 실험의 하이퍼파라미터를 추적할 수 있습니다. 이 Colab에서는 간단한 Python dict를 설정(config) 시스템으로 사용합니다.
configs = dict(
    num_classes=10,
    shuffle_buffer=1024,
    batch_size=64,
    image_size=28,
    image_channels=1,
    earlystopping_patience=3,
    learning_rate=1e-3,
    epochs=10,
)

데이터셋

이 Colab 노트북에서는 TensorFlow Datasets 카탈로그에 있는 Fashion-MNIST 데이터셋을 사용합니다. TensorFlow/Keras를 사용해 간단한 이미지 분류 파이프라인을 구축하는 것이 목표입니다.
train_ds, valid_ds = tfds.load("fashion_mnist", split=["train", "test"])
AUTOTUNE = tf.data.AUTOTUNE


def parse_data(example):
    # 이미지 가져오기
    image = example["image"]
    # image = tf.image.convert_image_dtype(image, dtype=tf.float32)

    # 레이블 가져오기
    label = example["label"]
    label = tf.one_hot(label, depth=configs["num_classes"])

    return image, label


def get_dataloader(ds, configs, dataloader_type="train"):
    dataloader = ds.map(parse_data, num_parallel_calls=AUTOTUNE)

    if dataloader_type=="train":
        dataloader = dataloader.shuffle(configs["shuffle_buffer"])
      
    dataloader = (
        dataloader
        .batch(configs["batch_size"])
        .prefetch(AUTOTUNE)
    )

    return dataloader
trainloader = get_dataloader(train_ds, configs)
validloader = get_dataloader(valid_ds, configs, dataloader_type="valid")

모델

def get_model(configs):
    backbone = tf.keras.applications.mobilenet_v2.MobileNetV2(
        weights="imagenet", include_top=False
    )
    backbone.trainable = False

    inputs = layers.Input(
        shape=(configs["image_size"], configs["image_size"], configs["image_channels"])
    )
    resize = layers.Resizing(32, 32)(inputs)
    neck = layers.Conv2D(3, (3, 3), padding="same")(resize)
    preprocess_input = tf.keras.applications.mobilenet.preprocess_input(neck)
    x = backbone(preprocess_input)
    x = layers.GlobalAveragePooling2D()(x)
    outputs = layers.Dense(configs["num_classes"], activation="softmax")(x)

    return models.Model(inputs=inputs, outputs=outputs)
tf.keras.backend.clear_session()
model = get_model(configs)
model.summary()

모델 컴파일하기

model.compile(
    optimizer="adam",
    loss="categorical_crossentropy",
    metrics=[
        "accuracy",
        tf.keras.metrics.TopKCategoricalAccuracy(k=5, name="top@5_accuracy"),
    ],
)

WandbEvalCallback

WandbEvalCallback는 주로 모델 예측 시각화, 그리고 부가적으로 데이터셋 시각화를 위한 Keras 콜백을 만들기 위한 추상 기본 클래스입니다. 이 콜백은 데이터셋과 태스크에 독립적인 추상 콜백입니다. 이를 사용하려면 이 기본 콜백 클래스를 상속하고 add_ground_truthadd_model_prediction 메서드를 구현하면 됩니다. WandbEvalCallback는 다음과 같은 유용한 메서드를 제공하는 유틸리티 클래스입니다:
  • 데이터 및 예측 wandb.Table 인스턴스 생성,
  • 데이터 및 예측 테이블을 wandb.Artifact로 로깅,
  • on_train_begin에서 데이터 테이블 로깅,
  • on_epoch_end에서 예측 테이블 로깅.
예시로, 아래에는 이미지 분류 태스크를 위한 WandbClfEvalCallback 구현이 있습니다. 이 예시 콜백은 다음을 수행합니다:
  • 검증 데이터(data_table)를 W&B에 로깅하고,
  • 각 에포크가 끝날 때마다 추론을 수행하고 예측(pred_table)을 W&B에 로깅합니다.

메모리 사용량이 줄어드는 원리

on_train_begin 메서드가 호출될 때 data_table을 W&B에 로깅합니다. 이 테이블이 W&B 아티팩트로 업로드되면, data_table_ref 클래스 변수를 통해 이 테이블에 대한 참조를 가져올 수 있습니다. data_table_ref는 2차원 리스트이며 self.data_table_ref[idx][n]처럼 인덱싱할 수 있습니다. 여기서 idx는 행 번호이고 n은 열 번호입니다. 아래 예시에서 사용 방법을 살펴보겠습니다.
class WandbClfEvalCallback(WandbEvalCallback):
    def __init__(
        self, validloader, data_table_columns, pred_table_columns, num_samples=100
    ):
        super().__init__(data_table_columns, pred_table_columns)

        self.val_data = validloader.unbatch().take(num_samples)

    def add_ground_truth(self, logs=None):
        for idx, (image, label) in enumerate(self.val_data):
            self.data_table.add_data(idx, wandb.Image(image), np.argmax(label, axis=-1))

    def add_model_predictions(self, epoch, logs=None):
        # 예측값 가져오기
        preds = self._inference()
        table_idxs = self.data_table_ref.get_index()

        for idx in table_idxs:
            pred = preds[idx]
            self.pred_table.add_data(
                epoch,
                self.data_table_ref.data[idx][0],
                self.data_table_ref.data[idx][1],
                self.data_table_ref.data[idx][2],
                pred,
            )

    def _inference(self):
        preds = []
        for image, label in self.val_data:
            pred = self.model(tf.expand_dims(image, axis=0))
            argmax_pred = tf.argmax(pred, axis=-1).numpy()[0]
            preds.append(argmax_pred)

        return preds

학습

# W&B 실행 초기화
run = wandb.init(project="intro-keras", config=configs)

# 모델 학습
model.fit(
    trainloader,
    epochs=configs["epochs"],
    validation_data=validloader,
    callbacks=[
        WandbMetricsLogger(log_freq=10),
        WandbClfEvalCallback(
            validloader,
            data_table_columns=["idx", "image", "ground_truth"],
            pred_table_columns=["epoch", "idx", "image", "ground_truth", "prediction"],
        ),  # 여기서 WandbEvalCallback 사용에 주목하세요
    ],
)

# W&B 실행 종료
run.finish()