사용자 지정 데이터로 YOLOv5 학습하기
📚 This guide explains how to train your own custom dataset using the YOLOv5 model 🚀. Training custom models is a fundamental step in tailoring computer vision solutions to specific real-world applications beyond generic object detection.
시작하기 전에
먼저 필요한 환경이 설정되었는지 확인하십시오. YOLOv5 저장소를 복제하고 requirements.txt에서 필수 종속 항목을 설치하십시오. Python>=3.8.0 환경과 PyTorch>=1.8은 필수입니다. 모델과 데이터셋은 로컬에서 찾을 수 없는 경우 최신 YOLOv5 릴리스에서 자동으로 다운로드됩니다.
git clone https://github.com/ultralytics/yolov5 # Clone the repository
cd yolov5
pip install -r requirements.txt # Install dependencies사용자 지정 데이터로 학습하기
사용자 지정 객체 탐지 모델을 개발하는 것은 반복적인 과정입니다:
- 이미지 수집 및 정리: 특정 작업과 관련된 이미지를 수집하십시오. 고품질의 다양한 데이터가 매우 중요합니다. 데이터 수집 및 주석에 대한 당사 가이드를 참조하십시오.
- 객체 라벨링: 이미지 내 관심 객체를 정확하게 주석으로 표시하십시오.
- 모델 학습: 라벨링된 데이터를 사용하여 YOLOv5 모델을 학습시키십시오. 사전 학습된 가중치로 시작하여 전이 학습을 활용하십시오.
- 배포 및 예측: 학습된 모델을 사용하여 새롭고 본 적 없는 데이터에 대한 추론을 수행하십시오.
- 엣지 케이스 수집: 모델이 잘 작동하지 않는 시나리오(엣지 케이스)를 식별하고 유사한 데이터를 데이터셋에 추가하여 견고성을 향상시키십시오. 이 주기를 반복하십시오.
Ultralytics Platform은 데이터셋 관리, 모델 학습 및 배포를 포함한 전체 머신 러닝 운영(MLOps) 주기에 대해 간소화된 노코드 솔루션을 제공합니다.
Ultralytics는 다양한 사용 시나리오를 수용하기 위해 두 가지 라이선스 옵션을 제공합니다:
- AGPL-3.0 라이선스: 이 OSI 승인 오픈 소스 라이선스는 개방형 협업과 지식 공유에 열정적인 학생, 연구원 및 애호가에게 이상적입니다. 파생된 작업물을 동일한 라이선스 하에 공유해야 합니다. 자세한 내용은 LICENSE 파일을 참조하십시오.
- 엔터프라이즈 라이선스: 상업용 애플리케이션을 위해 설계된 이 라이선스는 AGPL-3.0의 오픈 소스 조항 없이도 Ultralytics 소프트웨어와 AI 모델을 상업용 제품 및 서비스에 원활하게 통합할 수 있도록 허용합니다. 프로젝트에 상업적 배포가 필요한 경우 엔터프라이즈 라이선스를 요청하십시오.
Ultralytics 라이선스 페이지에서 당사의 라이선스 옵션을 추가로 살펴보십시오.
학습을 시작하기 전에 데이터셋 준비가 필수적입니다.
데이터셋 생성
YOLOv5 모델은 객체 클래스의 시각적 특성을 학습하기 위해 라벨링된 데이터가 필요합니다. 데이터셋을 올바르게 정리하는 것이 핵심입니다.
1.1 dataset.yaml 생성
데이터셋 구성 파일(예: coco128.yaml)은 데이터셋 구조, 클래스 이름 및 이미지 디렉터리 경로를 명시합니다. COCO128은 방대한 COCO 데이터셋의 처음 128개 이미지를 포함하는 작은 예제 데이터셋 역할을 합니다. 이는 학습 파이프라인을 빠르게 테스트하고 과적합과 같은 잠재적 문제를 진단하는 데 유용합니다.
dataset.yaml 파일 구조는 다음을 포함합니다:
path: 데이터셋을 포함하는 루트 디렉터리.train,val,test: 학습, 검증 및 테스트 세트에 대한 이미지나 이미지 경로가 나열된 텍스트 파일을 포함하는 디렉터리로의path기준 상대 경로.names: 클래스 인덱스(0부터 시작)를 해당 클래스 이름에 매핑하는 딕셔너리.
학습을 시작할 때 path를 절대 디렉터리(예: /home/user/datasets/coco128)로 설정하거나 YOLOv5 저장소 루트에서 ../datasets/coco128과 같은 상대 경로로 설정할 수 있습니다.
다음은 coco128.yaml의 구조입니다(GitHub에서 보기):
# Dataset root directory relative to the yolov5 directory
path: coco128
# Train/val/test sets: specify directories, *.txt files, or lists
train: images/train2017 # 128 images for training
val: images/train2017 # 128 images for validation
test: # Optional path to test images
# Classes (example using 80 COCO classes)
names:
0: person
1: bicycle
2: car
# ... (remaining COCO classes)
77: teddy bear
78: hair drier
79: toothbrush1.2 자동 라벨링을 위한 모델 활용
수동 라벨링은 일반적인 접근 방식이지만 시간이 많이 걸립니다. 파운데이션 모델은 주석을 자동화하거나 반자동화하여 데이터셋 생성 속도를 높일 수 있습니다. 라벨 생성에 도움이 될 수 있는 모델의 예:
- Google Gemini: Gemini와 같은 대형 멀티모달 모델은 강력한 이미지 이해 능력을 갖추고 있습니다. 이미지 내 객체를 식별하고 위치를 파악하도록 프롬프트를 입력하여 YOLO 형식 라벨로 변환할 수 있는 바운딩 박스나 설명을 생성할 수 있습니다. 제공된 튜토리얼 노트북에서 그 가능성을 탐색해보십시오.
- SAM2 (Segment Anything Model 2): SAM2와 같이 세그멘테이션에 초점을 맞춘 파운데이션 모델은 객체를 고정밀도로 식별하고 윤곽을 그릴 수 있습니다. 주로 세그멘테이션용이지만, 결과로 생성된 마스크는 종종 객체 탐지 작업에 적합한 바운딩 박스 주석으로 변환될 수 있습니다.
- YOLOWorld: 이 모델은 오픈 어휘 탐지 기능을 제공합니다. 관심 있는 객체에 대한 텍스트 설명을 제공하면 YOLOWorld가 해당 클래스에 대한 사전 학습 없이도 이미지 내에서 객체를 찾을 수 있습니다. 이는 초기 라벨을 생성하기 위한 시작점으로 사용할 수 있으며, 이후 정제할 수 있습니다.
이 모델들을 사용하면 "사전 라벨링" 단계를 제공하여 수동 작업을 줄일 수 있습니다. 그러나 품질이 학습된 YOLOv5 모델의 성능에 직접적인 영향을 미치므로 자동으로 생성된 라벨을 검토하고 정제하여 정확성과 일관성을 확보하는 것이 중요합니다. 라벨을 생성(및 정제)한 후에는 YOLO 형식을 준수하는지 확인하십시오: 이미지당 하나의 *.txt 파일, 각 줄은 객체를 class_index x_center y_center width height(정규화된 좌표, 0부터 시작하는 인덱스)로 표현합니다. 이미지에 관심 객체가 없는 경우 해당 *.txt 파일은 필요하지 않습니다.
YOLO 형식 *.txt 파일 사양은 다음과 같습니다:
- 객체 바운딩 박스당 한 행.
- 각 행은
class_index x_center y_center width height를 포함해야 합니다. - 좌표는 0과 1 사이의 범위로 정규화되어야 합니다. 이를 달성하려면
x_center와width의 픽셀 값을 이미지의 전체 너비로 나누고,y_center와height를 이미지의 전체 높이로 나누십시오. - 클래스 인덱스는 0부터 시작합니다(즉, 첫 번째 클래스는
0, 두 번째 클래스는1로 표시됨).

두 개의 '사람' 객체(클래스 인덱스 0)와 하나의 '넥타이' 객체(클래스 인덱스 27)를 포함하는 위 이미지에 해당하는 라벨 파일은 다음과 같습니다:

1.3 디렉터리 정리
Structure your datasets directory as illustrated below. By default, YOLOv5 anticipates the dataset directory (e.g., /coco128) to reside within a /datasets folder located adjacent to the /yolov5 repository directory.
YOLOv5는 이미지 경로에서 마지막 /images/ 인스턴스를 /labels/로 대체하여 각 이미지에 대한 라벨을 자동으로 찾습니다. 예시:
../datasets/coco128/images/im0.jpg # Path to the image file
../datasets/coco128/labels/im0.txt # Path to the corresponding label file권장되는 디렉터리 구조는 다음과 같습니다:
/datasets/
└── coco128/ # Dataset root
├── images/
│ ├── train2017/ # Training images
│ │ ├── 000000000009.jpg
│ │ └── ...
│ └── val2017/ # Validation images (optional if using same set for train/val)
│ └── ...
└── labels/
├── train2017/ # Training labels
│ ├── 000000000009.txt
│ └── ...
└── val2017/ # Validation labels (optional if using same set for train/val)
└── ...
모델 선택
Choose a pretrained model to initiate the training process. Starting with pretrained weights significantly accelerates learning and improves performance compared to training from scratch. YOLOv5 offers various model sizes, each balancing speed and accuracy differently. For example, YOLOv5s is the second-smallest and fastest model, suitable for resource-constrained environments. Consult the README table for a detailed comparison of all available models.

학습
Begin the model training using the train.py script. Essential arguments include:
--img: 입력 이미지 크기를 정의합니다(예:--img 640). 더 큰 크기는 일반적으로 더 나은 정확도를 제공하지만 더 많은 GPU 메모리가 필요합니다.--batch: 배치 크기를 결정합니다(예:--batch 16). GPU가 처리할 수 있는 가장 큰 크기를 선택하십시오.--epochs: 총 학습 에포크 수를 지정합니다(예:--epochs 100). 한 에포크는 전체 학습 데이터셋을 한 번 통과하는 것을 의미합니다.--data:dataset.yaml파일의 경로(예:--data coco128.yaml).--weights: 초기 가중치 파일의 경로. 더 빠른 수렴과 우수한 결과를 위해 사전 학습된 가중치(예:--weights yolov5s.pt)를 사용하는 것을 강력히 권장합니다. 처음부터 학습하려면(매우 큰 데이터셋이 있고 특별한 요구 사항이 있는 경우를 제외하고는 권장하지 않음),--weights '' --cfg yolov5s.yaml을 사용하십시오.
사전 학습된 가중치는 로컬에서 찾을 수 없는 경우 최신 YOLOv5 릴리스에서 자동으로 다운로드됩니다.
# Example: Train YOLOv5s on the COCO128 dataset for 3 epochs
python train.py --img 640 --batch 16 --epochs 3 --data coco128.yaml --weights yolov5s.pt💡 --cache ram 또는 --cache disk를 사용하여 데이터셋 이미지를 RAM 또는 로컬 디스크에 캐시하십시오. 이는 특히 데이터셋 I/O(입력/출력) 작업이 병목 현상일 때 학습 속도를 크게 높여줍니다. 단, 이를 위해서는 충분한 RAM 또는 디스크 공간이 필요합니다.
💡 항상 로컬에 저장된 데이터셋을 사용하여 학습하십시오. 네트워크 드라이브(예: Google Drive)나 원격 저장소에서 데이터에 액세스하는 것은 훨씬 느릴 수 있으며 학습 성능을 저해할 수 있습니다. 데이터셋을 로컬 SSD에 복사하는 것이 가장 좋은 방법입니다.
가중치와 로그를 포함한 모든 학습 결과는 runs/train/ 디렉터리에 저장됩니다. 각 학습 세션은 새로운 하위 디렉터리(예: runs/train/exp, runs/train/exp-2 등)를 생성합니다. 대화형으로 직접 경험하려면 공식 튜토리얼 노트북의 학습 섹션을 살펴보십시오:
시각화
YOLOv5는 학습 진행 상황을 시각화하고, 결과를 평가하며, 성능을 실시간으로 모니터링하기 위한 다양한 도구와 원활하게 통합됩니다.
Comet 로깅 및 시각화
Comet은 포괄적인 실험 추적을 위해 완전히 통합되어 있습니다. 지표를 실시간으로 시각화하고, 하이퍼파라미터를 저장하며, 데이터셋과 모델 체크포인트를 관리하고, 대화형 Comet 사용자 지정 패널을 사용하여 모델 예측을 분석하십시오.
시작하는 것은 간단합니다:
pip install comet_ml # 1. Install Comet library
export COMET_API_KEY=YOUR_API_KEY_HERE # 2. Set your Comet API key (create a free account at Comet.ml)
python train.py --img 640 --epochs 3 --data coco128.yaml --weights yolov5s.pt # 3. Train your model - Comet automatically logs everything!당사의 Comet 통합 가이드에서 지원되는 기능을 더 깊이 알아보십시오. Comet의 기능에 대한 자세한 내용은 공식 문서를 참조하십시오. 라이브 데모를 위해 Comet Colab 노트북을 시도해보십시오:
ClearML 로깅 및 자동화
ClearML 통합은 상세한 실험 추적, 데이터셋 버전 관리 및 학습 실행의 원격 제어까지 가능하게 합니다. 다음 간단한 단계로 ClearML을 활성화하십시오:
- 패키지 설치:
pip install clearml - ClearML 초기화:
clearml-init을 한 번 실행하여 ClearML 서버(자체 호스팅 또는 무료 계층)에 연결하십시오.
ClearML은 실험 세부 정보, 모델 업로드, 비교, 커밋되지 않은 코드 변경 사항 및 설치된 패키지를 자동으로 캡처하여 완벽한 재현성을 보장합니다. ClearML Data를 사용하여 원격 에이전트에서 학습 작업을 쉽게 예약하고 데이터셋 버전을 관리할 수 있습니다. 자세한 내용은 ClearML 통합 가이드를 살펴보십시오.
로컬 로깅
Training results are automatically logged using TensorBoard and saved as CSV files within the specific experiment directory (e.g., runs/train/exp). Logged data includes:
- 학습 및 검증 손실과 성능 지표.
- 적용된 증강(예: 모자이크)을 보여주는 샘플 이미지.
- 시각적 검사를 위한 모델 예측과 나란히 표시된 정답 라벨.
- 정밀도-재현율 (PR) 곡선과 같은 주요 평가 지표.
- 자세한 클래스별 성능 분석을 위한 혼동 행렬.
results.csv 파일은 매 에포크마다 업데이트되며 학습이 종료되면 results.png로 플롯됩니다. 또한 제공된 유틸리티 함수를 사용하여 모든 results.csv 파일을 수동으로 플롯할 수 있습니다:
from utils.plots import plot_results
# Plot results from a specific training run directory
plot_results("runs/train/exp/results.csv") # This will generate 'results.png' in the same directory
다음 단계
학습이 성공적으로 완료되면 가장 성능이 좋은 모델 체크포인트(best.pt)가 저장되며 배포 또는 추가 정제를 위해 준비됩니다. 잠재적인 다음 단계는 다음과 같습니다:
- Run inference on new images or videos using the trained model via the CLI or Python.
- 검증을 수행하여 다양한 데이터 분할(예: 테스트 세트)에 대한 모델의 정확도와 일반화 능력을 평가하십시오.
- Export the model to various deployment formats like ONNX, TensorFlow SavedModel, or TensorRT for optimized inference on diverse platforms.
- 하이퍼파라미터 튜닝 기술을 사용하여 성능 향상을 추가로 꾀하십시오.
- 최고의 학습 결과를 위한 팁을 따르고 성능 분석을 기반으로 더 다양하고 어려운 데이터를 반복적으로 추가하여 모델을 지속적으로 개선하십시오.
지원되는 환경
Ultralytics는 CUDA, cuDNN, Python, PyTorch와 같은 필수 종속 항목이 갖춰진 즉시 사용 가능한 환경을 제공하여 원활한 시작을 돕습니다.
- 무료 GPU 노트북:
- 클라우드 플랫폼:
- Google Cloud: GCP 퀵스타트 가이드
- Amazon AWS: AWS 퀵스타트 가이드
- Microsoft Azure: AzureML 퀵스타트 가이드
- 로컬 설정:
- Docker: Docker 퀵스타트 가이드
- Docker: Docker 퀵스타트 가이드
프로젝트 상태
이 배지는 모든 YOLOv5 GitHub Actions 지속적 통합(CI) 테스트가 성공적으로 통과되었음을 나타냅니다. 이러한 엄격한 CI 테스트는 macOS, Windows 및 Ubuntu 운영 체제 전반에서 학습, 검증, 추론, 내보내기 및 벤치마크를 포함한 핵심 기능을 다룹니다. 테스트는 24시간마다 그리고 각 코드 커밋 시 자동으로 실행되어 일관된 안정성과 최적의 성능을 보장합니다.
FAQ
사용자 지정 데이터셋에서 YOLOv5를 어떻게 학습합니까?
사용자 지정 데이터셋에서 YOLOv5를 학습하는 것은 몇 가지 핵심 단계를 포함합니다:
- 데이터셋 준비: 이미지를 수집하고 주석을 답니다. 주석이 필수 YOLO format인지 확인하십시오. 이미지와 라벨을
train/및val/(선택적으로test/) 디렉토리로 구성합니다. 라벨링 과정을 보조하거나 자동화하려면 Google Gemini, SAM2 또는 YOLOWorld와 같은 모델을 사용하는 것을 고려하십시오(섹션 1.2 참조). - 환경 설정: YOLOv5 저장소를 클론하고
pip install -r requirements.txt를 사용하여 종속성을 설치합니다.git clone https://github.com/ultralytics/yolov5 cd yolov5 pip install -r requirements.txt - 데이터셋 구성 생성:
dataset.yaml파일에 데이터셋 경로, 클래스 수, 클래스 이름을 정의합니다. - Start Training: Execute the
train.pyscript, providing paths to yourdataset.yaml, desired pretrained weights (e.g.,yolov5s.pt), image size, batch size, and the number of epochs.python train.py --img 640 --batch 16 --epochs 100 --data path/to/your/dataset.yaml --weights yolov5s.pt
YOLO 모델 학습에 Ultralytics Platform을 사용해야 하는 이유는 무엇입니까?
Ultralytics Platform은 코드 작성 없이도 YOLO 모델 개발 라이프사이클 전체를 간소화하도록 설계된 종합 플랫폼입니다. 주요 이점은 다음과 같습니다:
- 간소화된 학습: 미리 구성된 환경과 직관적인 사용자 인터페이스를 사용하여 모델을 쉽게 학습시킵니다.
- 통합 데이터 관리: 플랫폼 내에서 데이터셋을 효율적으로 업로드, 버전 관리 및 관리합니다.
- 실시간 모니터링: Comet 또는 TensorBoard와 같은 통합 도구를 사용하여 학습 진행 상황을 추적하고 성능 지표를 시각화합니다.
- 협업 기능: 공유 리소스, 프로젝트 관리 도구 및 쉬운 모델 공유를 통해 팀워크를 촉진합니다.
- 노코드 배포: 학습된 모델을 다양한 타겟에 직접 배포합니다.
실습 가이드는 블로그 게시물 How to Train Your Custom Models with Ultralytics Platform을 확인하십시오.
주석이 달린 데이터를 YOLOv5 형식으로 변환하려면 어떻게 해야 합니까?
수동으로 주석을 달든 자동화 도구(섹션 1.2에 언급된 것과 같은)를 사용하든, 최종 라벨은 YOLOv5에 필요한 특정 YOLO format이어야 합니다:
- Create one
.txtfile for each image. The filename should match the image filename (e.g.,image1.jpgcorresponds toimage1.txt). Place these files in alabels/directory parallel to yourimages/directory (e.g.,../datasets/mydataset/labels/train/). .txt파일 내의 각 줄은 하나의 객체 주석을 나타내며class_index center_x center_y width height형식을 따릅니다.- 좌표(
center_x,center_y,width,height)는 이미지 치수에 상대적으로 정규화(0.0과 1.0 사이의 값)되어야 합니다. - 클래스 인덱스는 0부터 시작(첫 번째 클래스는
0, 두 번째는1등)합니다.
많은 수동 주석 도구는 YOLO 형식으로 직접 내보내기 기능을 제공합니다. 자동화된 모델을 사용하는 경우, 출력물(예: 바운딩 박스 좌표, 세그멘테이션 마스크)을 이 특정 정규화된 텍스트 형식으로 변환하는 스크립트나 프로세스가 필요합니다. 최종 데이터셋 구조가 가이드에 제공된 예시를 준수하는지 확인하십시오. 자세한 내용은 Data Collection and Annotation Guide를 참조하십시오.
상업적 애플리케이션에서 YOLOv5를 사용하기 위한 라이선스 옵션은 무엇입니까?
Ultralytics는 다양한 요구 사항에 맞춘 유연한 라이선스를 제공합니다:
- AGPL-3.0 License: 이 오픈 소스 라이선스는 학술 연구, 개인 프로젝트 및 오픈 소스 규정 준수가 허용되는 상황에 적합합니다. 이 라이선스는 수정 및 파생 저작물도 AGPL-3.0에 따라 오픈 소스로 공개할 것을 의무화합니다. AGPL-3.0 License details를 검토하십시오.
- Enterprise License: YOLOv5를 독점 제품이나 서비스에 통합하는 기업을 위해 설계된 상업용 라이선스입니다. 이 라이선스는 AGPL-3.0의 오픈 소스 의무를 제거하여 클로즈드 소스 배포를 허용합니다. 자세한 내용은 Licensing page를 방문하거나 Enterprise License를 요청하십시오.
프로젝트의 요구 사항 및 배포 모델에 가장 적합한 라이선스를 선택하십시오.
