Comet ML 로고, 머신러닝 실험 추적

YOLOv5와 Comet

본 가이드에서는 머신러닝 실험을 추적, 비교 및 최적화하는 강력한 도구인 Comet과 YOLOv5를 함께 사용하는 방법을 다룹니다.

Comet 소개

Comet은 데이터 과학자, 엔지니어 및 팀 리더가 머신러닝딥러닝 모델을 가속화하고 최적화할 수 있도록 돕는 도구를 구축합니다.

실시간으로 모델 메트릭을 추적 및 시각화하고, 하이퍼파라미터, 데이터셋, 모델 체크포인트를 저장하며, Comet Custom Panels로 모델 예측을 시각화하십시오! Comet은 작업 기록이 손실되지 않도록 보장하며, 모든 규모의 팀에서 결과를 공유하고 협업하기 쉽게 만들어 줍니다!

시작하기

Comet 설치

pip install comet_ml

Comet 자격 증명 구성

YOLOv5에서 Comet을 구성하는 방법은 두 가지가 있습니다.

환경 변수를 통해 자격 증명을 설정할 수 있습니다:

환경 변수

export COMET_API_KEY=YOUR_API_KEY
export COMET_PROJECT_NAME=YOUR_COMET_PROJECT_NAME # This will default to 'yolov5'

또는 작업 디렉토리에 .comet.config 파일을 생성하고 해당 파일에 자격 증명을 설정할 수 있습니다:

Comet 구성 파일

[comet]
api_key=YOUR_API_KEY
project_name=YOUR_COMET_PROJECT_NAME # This will default to 'yolov5'

학습 스크립트 실행

# Train YOLOv5s on COCO128 for 5 epochs
python train.py --img 640 --batch 16 --epochs 5 --data coco128.yaml --weights yolov5s.pt

이것으로 끝입니다! Comet은 하이퍼파라미터, 명령줄 인수, 학습 및 검증 메트릭을 자동으로 기록합니다. Comet UI에서 실행 결과를 시각화하고 분석할 수 있습니다.

YOLOv5 학습 메트릭 및 실험 추적을 보여주는 Comet 대시보드

예제를 체험해 보세요!

완료된 실행 예제를 확인해 보세요.

더 나아가 이 Colab Notebook에서 직접 체험해 보세요:

Open In Colab

자동 기록

기본적으로 Comet은 다음 항목을 기록합니다:

메트릭

파라미터

  • 모델 하이퍼파라미터
  • 명령줄 옵션을 통해 전달된 모든 매개변수

시각화

  • 검증 데이터에 대한 모델 예측의 혼동 행렬(Confusion Matrix)
  • 모든 클래스에 걸친 PR 및 F1 곡선 플롯
  • 클래스 레이블의 상관관계 도표(Correlogram)

Comet 로깅 구성

Comet은 학습 스크립트에 전달되는 명령줄 플래그나 환경 변수를 통해 추가 데이터를 기록하도록 구성할 수 있습니다:

export COMET_MODE=online                           # Set whether to run Comet in 'online' or 'offline' mode. Defaults to online
export COMET_MODEL_NAME="yolov5"                   # Set the name for the saved model. Defaults to yolov5
export COMET_LOG_CONFUSION_MATRIX=false            # Set to disable logging a Comet Confusion Matrix. Defaults to true
export COMET_MAX_IMAGE_UPLOADS=30                  # Controls how many total image predictions to log to Comet. Defaults to 100.
export COMET_LOG_PER_CLASS_METRICS=true            # Set to log evaluation metrics for each detected class at the end of training. Defaults to false
export COMET_DEFAULT_CHECKPOINT_FILENAME="last.pt" # Set this if you would like to resume training from a different checkpoint. Defaults to 'last.pt'
export COMET_LOG_BATCH_LEVEL_METRICS=true          # Set this if you would like to log training metrics at the batch level. Defaults to false.
export COMET_LOG_PREDICTIONS=true                  # Set this to false to disable logging model predictions

Comet으로 체크포인트 기록하기

Comet에 모델을 기록하는 기능은 기본적으로 비활성화되어 있습니다. 활성화하려면 save-period 인수를 학습 스크립트에 전달하십시오. 이렇게 하면 save-period로 제공된 간격에 따라 기록된 체크포인트가 Comet에 저장됩니다:

python train.py \
  --img 640 \
  --batch 16 \
  --epochs 5 \
  --data coco128.yaml \
  --weights yolov5s.pt \
  --save-period 1

모델 예측 기록하기

기본적으로 모델 예측(이미지, 정답 레이블 및 바운딩 박스)은 Comet에 기록됩니다.

bbox_interval 명령줄 인수를 전달하여 기록되는 예측 및 관련 이미지의 빈도를 제어할 수 있습니다. 예측은 Comet의 객체 탐지(Object Detection) 커스텀 패널을 사용하여 시각화할 수 있습니다. 이 빈도는 에포크(epoch)당 N번째 데이터 배치에 해당합니다. 아래 예제에서는 각 에포크마다 2번째 데이터 배치마다 기록하고 있습니다.

참고: YOLOv5 검증 데이터 로더는 기본적으로 배치 크기(batch size)를 32로 설정하므로, 그에 맞춰 로깅 빈도를 설정해야 합니다.

패널을 사용하는 예제 프로젝트를 참조하십시오.

python train.py \
  --img 640 \
  --batch 16 \
  --epochs 5 \
  --data coco128.yaml \
  --weights yolov5s.pt \
  --bbox_interval 2

Comet에 기록되는 예측 이미지 수 제어

YOLOv5에서 예측을 기록할 때, Comet은 각 예측 세트와 관련된 이미지를 기록합니다. 기본적으로 최대 100개의 검증 이미지가 기록됩니다. COMET_MAX_IMAGE_UPLOADS 환경 변수를 사용하여 이 숫자를 늘리거나 줄일 수 있습니다:

env COMET_MAX_IMAGE_UPLOADS=200 python train.py \
  --img 640 \
  --batch 16 \
  --epochs 5 \
  --data coco128.yaml \
  --weights yolov5s.pt \
  --bbox_interval 1

클래스 수준 메트릭 기록하기

COMET_LOG_PER_CLASS_METRICS 환경 변수를 사용하여 각 클래스에 대한 mAP, 정밀도, 재현율, f1을 기록하십시오:

env COMET_LOG_PER_CLASS_METRICS=true python train.py \
  --img 640 \
  --batch 16 \
  --epochs 5 \
  --data coco128.yaml \
  --weights yolov5s.pt

Comet Artifacts에 데이터셋 업로드

Comet Artifacts를 사용하여 데이터를 저장하려면 upload_dataset 플래그를 사용하면 됩니다.

데이터셋은 YOLOv5 문서에 설명된 대로 구성되어야 합니다. 데이터셋 구성 yaml 파일은 coco128.yaml 파일과 동일한 형식을 따라야 합니다.

python train.py \
  --img 640 \
  --batch 16 \
  --epochs 5 \
  --data coco128.yaml \
  --weights yolov5s.pt \
  --upload_dataset

업로드된 데이터셋은 Comet 워크스페이스의 Artifacts 탭에서 찾을 수 있습니다:

데이터셋 버전 관리를 위한 Comet Artifacts 패널

Comet UI에서 데이터를 직접 미리 볼 수 있습니다:

Comet 데이터셋 미리보기 및 버전 기록

Artifact는 버전이 지정되며 데이터셋에 대한 메타데이터 추가도 지원합니다. Comet은 데이터셋 yaml 파일의 메타데이터를 자동으로 기록합니다:

Comet Artifact 메타데이터

저장된 Artifact 사용하기

If you would like to use a dataset from Comet Artifacts, set the path variable in your dataset yaml file to point to the following Artifact resource URL:

# Contents of artifact.yaml file
path: "comet://WORKSPACE_NAME/ARTIFACT_NAME:ARTIFACT_VERSION_OR_ALIAS"

그런 다음 다음과 같은 방법으로 이 파일을 학습 스크립트에 전달하십시오:

python train.py \
  --img 640 \
  --batch 16 \
  --epochs 5 \
  --data artifact.yaml \
  --weights yolov5s.pt

Artifact를 사용하면 실험 워크플로를 통과하는 데이터의 출처(lineage)를 추적할 수도 있습니다. 여기에서 업로드된 데이터셋을 사용한 모든 실험을 보여주는 그래프를 볼 수 있습니다:

Comet Artifact 출처 그래프

학습 실행 재개

인터넷 연결 끊김 등으로 인해 학습이 중단된 경우, resume 플래그와 Comet Run Path를 사용하여 실행을 재개할 수 있습니다.

Run Path는 comet://WORKSPACE_NAME/PROJECT_NAME/EXPERIMENT_ID 형식을 가집니다.

이렇게 하면 체크포인트에서 모델을 복원하고, 모든 하이퍼파라미터와 학습 인수를 복원하며, 원본 실행에서 사용된 경우 Comet 데이터셋 Artifact를 다운로드하는 등 중단 전 상태로 실행이 복원됩니다. 재개된 실행은 Comet UI의 기존 실험에 계속 기록됩니다:

python train.py \
  --resume "comet://YOUR_RUN_PATH"

Comet Optimizer를 사용한 하이퍼파라미터 검색

YOLOv5는 Comet의 Optimizer와 통합되어 있어, Comet UI에서 하이퍼파라미터 스윕(sweep)을 쉽게 시각화할 수 있습니다.

Optimizer 스윕 구성

Comet Optimizer를 구성하려면 스윕 정보가 포함된 JSON 파일을 생성해야 합니다. 예제 파일은 utils/loggers/comet/optimizer_config.json에 제공되어 있습니다:

python utils/loggers/comet/hpo.py \
  --comet_optimizer_config "utils/loggers/comet/optimizer_config.json"

hpo.py 스크립트는 train.py와 동일한 인수를 허용합니다. 스윕에 추가 인수를 전달하려면 스크립트 뒤에 추가하기만 하면 됩니다:

python utils/loggers/comet/hpo.py \
  --comet_optimizer_config "utils/loggers/comet/optimizer_config.json" \
  --save-period 1 \
  --bbox_interval 1

결과 시각화

Comet은 스윕 결과를 시각화하는 다양한 방법을 제공합니다. 스윕이 완료된 프로젝트를 여기에서 살펴보세요.

Comet 하이퍼파라미터 시각화

댓글