
YOLOv5와 Comet
본 가이드에서는 머신러닝 실험을 추적, 비교 및 최적화하는 강력한 도구인 Comet과 YOLOv5를 함께 사용하는 방법을 다룹니다.
Comet 소개
Comet은 데이터 과학자, 엔지니어 및 팀 리더가 머신러닝 및 딥러닝 모델을 가속화하고 최적화할 수 있도록 돕는 도구를 구축합니다.
실시간으로 모델 메트릭을 추적 및 시각화하고, 하이퍼파라미터, 데이터셋, 모델 체크포인트를 저장하며, Comet Custom Panels로 모델 예측을 시각화하십시오! Comet은 작업 기록이 손실되지 않도록 보장하며, 모든 규모의 팀에서 결과를 공유하고 협업하기 쉽게 만들어 줍니다!
시작하기
Comet 설치
pip install comet_mlComet 자격 증명 구성
YOLOv5에서 Comet을 구성하는 방법은 두 가지가 있습니다.
환경 변수를 통해 자격 증명을 설정할 수 있습니다:
환경 변수
export COMET_API_KEY=YOUR_API_KEY
export COMET_PROJECT_NAME=YOUR_COMET_PROJECT_NAME # This will default to 'yolov5'또는 작업 디렉토리에 .comet.config 파일을 생성하고 해당 파일에 자격 증명을 설정할 수 있습니다:
Comet 구성 파일
[comet]
api_key=YOUR_API_KEY
project_name=YOUR_COMET_PROJECT_NAME # This will default to 'yolov5'학습 스크립트 실행
# Train YOLOv5s on COCO128 for 5 epochs
python train.py --img 640 --batch 16 --epochs 5 --data coco128.yaml --weights yolov5s.pt이것으로 끝입니다! Comet은 하이퍼파라미터, 명령줄 인수, 학습 및 검증 메트릭을 자동으로 기록합니다. Comet UI에서 실행 결과를 시각화하고 분석할 수 있습니다.

예제를 체험해 보세요!
완료된 실행 예제를 확인해 보세요.
더 나아가 이 Colab Notebook에서 직접 체험해 보세요:
자동 기록
기본적으로 Comet은 다음 항목을 기록합니다:
메트릭
- 학습 및 검증 데이터에 대한 박스 손실(Box Loss), 객체 손실(Object Loss), 분류 손실(Classification Loss)
- 검증 데이터에 대한 mAP_0.5, mAP_0.5:0.95 메트릭
- 검증 데이터에 대한 정밀도(Precision) 및 재현율(Recall)
파라미터
- 모델 하이퍼파라미터
- 명령줄 옵션을 통해 전달된 모든 매개변수
시각화
- 검증 데이터에 대한 모델 예측의 혼동 행렬(Confusion Matrix)
- 모든 클래스에 걸친 PR 및 F1 곡선 플롯
- 클래스 레이블의 상관관계 도표(Correlogram)
Comet 로깅 구성
Comet은 학습 스크립트에 전달되는 명령줄 플래그나 환경 변수를 통해 추가 데이터를 기록하도록 구성할 수 있습니다:
export COMET_MODE=online # Set whether to run Comet in 'online' or 'offline' mode. Defaults to online
export COMET_MODEL_NAME="yolov5" # Set the name for the saved model. Defaults to yolov5
export COMET_LOG_CONFUSION_MATRIX=false # Set to disable logging a Comet Confusion Matrix. Defaults to true
export COMET_MAX_IMAGE_UPLOADS=30 # Controls how many total image predictions to log to Comet. Defaults to 100.
export COMET_LOG_PER_CLASS_METRICS=true # Set to log evaluation metrics for each detected class at the end of training. Defaults to false
export COMET_DEFAULT_CHECKPOINT_FILENAME="last.pt" # Set this if you would like to resume training from a different checkpoint. Defaults to 'last.pt'
export COMET_LOG_BATCH_LEVEL_METRICS=true # Set this if you would like to log training metrics at the batch level. Defaults to false.
export COMET_LOG_PREDICTIONS=true # Set this to false to disable logging model predictionsComet으로 체크포인트 기록하기
Comet에 모델을 기록하는 기능은 기본적으로 비활성화되어 있습니다. 활성화하려면 save-period 인수를 학습 스크립트에 전달하십시오. 이렇게 하면 save-period로 제공된 간격에 따라 기록된 체크포인트가 Comet에 저장됩니다:
python train.py \
--img 640 \
--batch 16 \
--epochs 5 \
--data coco128.yaml \
--weights yolov5s.pt \
--save-period 1모델 예측 기록하기
기본적으로 모델 예측(이미지, 정답 레이블 및 바운딩 박스)은 Comet에 기록됩니다.
bbox_interval 명령줄 인수를 전달하여 기록되는 예측 및 관련 이미지의 빈도를 제어할 수 있습니다. 예측은 Comet의 객체 탐지(Object Detection) 커스텀 패널을 사용하여 시각화할 수 있습니다. 이 빈도는 에포크(epoch)당 N번째 데이터 배치에 해당합니다. 아래 예제에서는 각 에포크마다 2번째 데이터 배치마다 기록하고 있습니다.
참고: YOLOv5 검증 데이터 로더는 기본적으로 배치 크기(batch size)를 32로 설정하므로, 그에 맞춰 로깅 빈도를 설정해야 합니다.
패널을 사용하는 예제 프로젝트를 참조하십시오.
python train.py \
--img 640 \
--batch 16 \
--epochs 5 \
--data coco128.yaml \
--weights yolov5s.pt \
--bbox_interval 2Comet에 기록되는 예측 이미지 수 제어
YOLOv5에서 예측을 기록할 때, Comet은 각 예측 세트와 관련된 이미지를 기록합니다. 기본적으로 최대 100개의 검증 이미지가 기록됩니다. COMET_MAX_IMAGE_UPLOADS 환경 변수를 사용하여 이 숫자를 늘리거나 줄일 수 있습니다:
env COMET_MAX_IMAGE_UPLOADS=200 python train.py \
--img 640 \
--batch 16 \
--epochs 5 \
--data coco128.yaml \
--weights yolov5s.pt \
--bbox_interval 1클래스 수준 메트릭 기록하기
COMET_LOG_PER_CLASS_METRICS 환경 변수를 사용하여 각 클래스에 대한 mAP, 정밀도, 재현율, f1을 기록하십시오:
env COMET_LOG_PER_CLASS_METRICS=true python train.py \
--img 640 \
--batch 16 \
--epochs 5 \
--data coco128.yaml \
--weights yolov5s.ptComet Artifacts에 데이터셋 업로드
Comet Artifacts를 사용하여 데이터를 저장하려면 upload_dataset 플래그를 사용하면 됩니다.
데이터셋은 YOLOv5 문서에 설명된 대로 구성되어야 합니다. 데이터셋 구성 yaml 파일은 coco128.yaml 파일과 동일한 형식을 따라야 합니다.
python train.py \
--img 640 \
--batch 16 \
--epochs 5 \
--data coco128.yaml \
--weights yolov5s.pt \
--upload_dataset업로드된 데이터셋은 Comet 워크스페이스의 Artifacts 탭에서 찾을 수 있습니다:

Comet UI에서 데이터를 직접 미리 볼 수 있습니다:

Artifact는 버전이 지정되며 데이터셋에 대한 메타데이터 추가도 지원합니다. Comet은 데이터셋 yaml 파일의 메타데이터를 자동으로 기록합니다:

저장된 Artifact 사용하기
If you would like to use a dataset from Comet Artifacts, set the path variable in your dataset yaml file to point to the following Artifact resource URL:
# Contents of artifact.yaml file
path: "comet://WORKSPACE_NAME/ARTIFACT_NAME:ARTIFACT_VERSION_OR_ALIAS"그런 다음 다음과 같은 방법으로 이 파일을 학습 스크립트에 전달하십시오:
python train.py \
--img 640 \
--batch 16 \
--epochs 5 \
--data artifact.yaml \
--weights yolov5s.ptArtifact를 사용하면 실험 워크플로를 통과하는 데이터의 출처(lineage)를 추적할 수도 있습니다. 여기에서 업로드된 데이터셋을 사용한 모든 실험을 보여주는 그래프를 볼 수 있습니다:

학습 실행 재개
인터넷 연결 끊김 등으로 인해 학습이 중단된 경우, resume 플래그와 Comet Run Path를 사용하여 실행을 재개할 수 있습니다.
Run Path는 comet://WORKSPACE_NAME/PROJECT_NAME/EXPERIMENT_ID 형식을 가집니다.
이렇게 하면 체크포인트에서 모델을 복원하고, 모든 하이퍼파라미터와 학습 인수를 복원하며, 원본 실행에서 사용된 경우 Comet 데이터셋 Artifact를 다운로드하는 등 중단 전 상태로 실행이 복원됩니다. 재개된 실행은 Comet UI의 기존 실험에 계속 기록됩니다:
python train.py \
--resume "comet://YOUR_RUN_PATH"Comet Optimizer를 사용한 하이퍼파라미터 검색
YOLOv5는 Comet의 Optimizer와 통합되어 있어, Comet UI에서 하이퍼파라미터 스윕(sweep)을 쉽게 시각화할 수 있습니다.
Optimizer 스윕 구성
Comet Optimizer를 구성하려면 스윕 정보가 포함된 JSON 파일을 생성해야 합니다. 예제 파일은 utils/loggers/comet/optimizer_config.json에 제공되어 있습니다:
python utils/loggers/comet/hpo.py \
--comet_optimizer_config "utils/loggers/comet/optimizer_config.json"hpo.py 스크립트는 train.py와 동일한 인수를 허용합니다. 스윕에 추가 인수를 전달하려면 스크립트 뒤에 추가하기만 하면 됩니다:
python utils/loggers/comet/hpo.py \
--comet_optimizer_config "utils/loggers/comet/optimizer_config.json" \
--save-period 1 \
--bbox_interval 1결과 시각화
Comet은 스윕 결과를 시각화하는 다양한 방법을 제공합니다. 스윕이 완료된 프로젝트를 여기에서 살펴보세요.
