Link to this section설정#

Q: YOLO 모델의 정확도에 영향을 주는 주요 하이퍼파라미터는 무엇인가요?

정확도에 영향을 주는 주요 하이퍼파라미터는 다음과 같습니다: 배치 크기 (batch): 크기가 클수록 학습은 안정될 수 있지만 더 많은 메모리가 필요합니다. 학습률 (lr0): 낮은 학습률은 미세한 조정을 가능하게 하지만 수렴 속도가 느려집니다. 모멘텀 (momentum): 그래디언트 벡터를 가속화하고 진동을 완화합니다. 이미지 크기 (imgsz): 큰 크기는 정확도를 향상시키지만 계산 부하를 증가시킵니다. 데이터셋과 하드웨어에 따라 이를 조정하세요. 자세한 내용은 학습 설정에서 확인하세요.

Q: YOLO 모델 학습을 위한 학습률은 어떻게 설정하나요?

The learning rate (lr0) is crucial; start with 0.01 for SGD or 0.001 for Adam optimizer. Monitor metrics and adjust as needed. Use cosine learning rate schedulers (cos_lr) or warmup (warmup_epochs, warmup_momentum). Details are in the Train Guide.

Q: YOLO 모델의 기본 추론 설정은 무엇인가요?

기본 설정은 다음과 같습니다: 신뢰도 임계값 (conf=0.25): 감지를 위한 최소 신뢰도. IoU 임계값 (iou=0.7): Non-Maximum Suppression (NMS)를 위한 값. 이미지 크기 (imgsz=640): 입력 이미지 크기 조정. 장치 (device=None): CPU, GPU, Apple MPS 또는 Huawei Ascend NPU(npu)를 선택합니다. 전체 개요는 예측 설정 및 예측 가이드를 참조하세요.

Q: YOLO 모델 학습에 왜 혼합 정밀도를 사용하나요?

혼합 정밀도 학습(amp=True)은 FP16과 FP32를 사용하여 메모리 사용량을 줄이고 학습 속도를 높입니다. 이는 최신 GPU에 유익하며, 정확도 손실을 크게 줄이면서 더 큰 모델과 빠른 연산을 가능하게 합니다. 자세한 내용은 학습 가이드에서 확인하세요.

YOLO 설정 및 하이퍼파라미터는 모델의 성능, 속도 및 정확도에 중요한 역할을 합니다. 이러한 설정은 학습, 검증 및 예측을 포함한 다양한 단계에서 모델의 동작에 영향을 줄 수 있습니다.

Watch: Mastering Ultralytics YOLO: Configuration

Ultralytics 명령어는 다음 구문을 사용합니다:

예시

yolo TASK MODE ARGS

구문 설명:

TASK(선택 사항)는 다음 중 하나입니다: (detect, segment, semantic, classify, pose, obb)
MODE(필수)는 다음 중 하나입니다: (train, val, predict, export, track, benchmark)
ARGS (optional) are arg=value pairs like imgsz=640 that override defaults.

기본 ARG 값은 이 페이지에 정의되어 있으며 cfg/default.yaml 파일에서 가져옵니다.

Link to this section작업#

Ultralytics YOLO 모델은 다음과 같은 다양한 컴퓨터 비전 작업을 수행할 수 있습니다:

Detect: 객체 탐지는 이미지나 비디오 내의 객체를 식별하고 위치를 파악합니다.
Segment: 인스턴스 세그멘테이션은 이미지나 비디오를 서로 다른 객체나 클래스에 해당하는 영역으로 나눕니다.
Semantic segmentation (semantic): 시맨틱 세그멘테이션은 상세한 장면 이해를 위해 이미지의 모든 픽셀에 클래스 레이블을 할당합니다.
Classify: 이미지 분류는 입력 이미지의 클래스 레이블을 예측합니다.
Pose: 자세 추정은 이미지나 비디오에서 객체를 식별하고 키포인트를 추정합니다.
OBB: 회전된 경계 상자는 위성 이미지나 의료 영상에 적합한 회전된 경계 상자를 사용합니다.

인수	기본값	설명
`task`	`'detect'`	Specifies the YOLO task: `detect` for object detection, `segment` for instance segmentation, `semantic` for semantic segmentation, `classify` for classification, `pose` for pose estimation, and `obb` for oriented bounding boxes. Each task is tailored to specific outputs and problems in image and video analysis.

작업 가이드

Link to this section모드#

Ultralytics YOLO 모델은 모델 수명 주기의 특정 단계를 위해 설계된 다양한 모드에서 작동합니다:

Train: 사용자 정의 데이터셋으로 YOLO 모델을 학습합니다.
Val: 학습된 YOLO 모델을 검증합니다.
Predict: 학습된 YOLO 모델을 사용하여 새 이미지나 비디오에 대해 예측을 수행합니다.
Export: 배포를 위해 YOLO 모델을 내보냅니다.
Track: YOLO 모델을 사용하여 실시간으로 객체를 추적합니다.
Benchmark: YOLO 내보내기(ONNX, TensorRT 등)의 속도와 정확도를 벤치마킹합니다.

인수	기본값	설명
`mode`	`'train'`	YOLO 모델의 작동 모드를 지정합니다: 모델 학습을 위한 `train`, 검증을 위한 `val`, 추론을 위한 `predict`, 배포 형식 변환을 위한 `export`, 객체 추적을 위한 `track`, 성능 평가를 위한 `benchmark`. 각 모드는 개발부터 배포까지의 다양한 단계를 지원합니다.

모드 가이드

Link to this section학습 설정#

YOLO 모델의 학습 설정에는 모델의 성능, 속도 및 정확도에 영향을 주는 하이퍼파라미터와 구성이 포함됩니다. 주요 설정에는 배치 크기, 학습률, 모멘텀, 가중치 감쇠(weight decay)가 있습니다. 옵티마이저 선택, 손실 함수 및 데이터셋 구성 또한 학습에 영향을 미칩니다. 최적의 성능을 위해서는 튜닝과 실험이 중요합니다. 자세한 내용은 Ultralytics 진입점 함수를 참조하십시오.

인수	유형	기본값	설명
`model`	`str`	`None`	학습을 위한 모델 파일을 지정합니다. 사전 학습된 `.pt` 모델 또는 `.yaml` 구성 파일 경로를 허용합니다. 모델 구조를 정의하거나 가중치를 초기화하는 데 필수적입니다.
`data`	`str`	`None`	데이터셋 구성 파일(예: `coco8.yaml`)의 경로입니다. 이 파일에는 학습 및 검증 데이터 경로, 클래스 이름 및 클래스 수를 포함하여 데이터셋 관련 매개변수가 포함되어 있습니다.
`epochs`	`int`	`100`	총 학습 에폭 수입니다. 각 에폭은 전체 데이터셋을 한 번 학습하는 과정을 의미합니다. 이 값을 조정하면 학습 기간과 모델 성능에 영향을 줄 수 있습니다.
`time`	`float`	`None`	시간 단위의 최대 학습 시간입니다. 설정하면 `epochs` 인수를 재정의하여 지정된 시간이 지난 후 학습을 자동으로 중지합니다. 시간 제한이 있는 학습 시나리오에 유용합니다.
`patience`	`int`	`100`	검증 지표가 개선되지 않았을 때 조기 중단을 수행하기 전까지 기다리는 에폭 수입니다. 성능이 정체될 때 학습을 중단하여 과적합을 방지하는 데 도움이 됩니다.
`batch`	`int` 또는 `float`	`16`	배치 크기로, 정수(예: `batch=16`), GPU 메모리 60% 활용을 위한 자동 모드(`batch=-1`), 지정된 활용 비율을 사용하는 자동 모드(`batch=0.70`) 등 세 가지 모드가 있습니다.
`imgsz`	`int`	`640`	학습을 위한 대상 이미지 크기입니다. 이미지는 지정된 값과 동일한 변을 가진 정사각형으로 크기가 조정되며(`rect=False`인 경우), YOLO 모델의 경우 가로세로 비율을 유지하지만 RT-DETR은 그렇지 않습니다. 모델 정확도와 계산 복잡성에 영향을 미칩니다.
`save`	`bool`	`True`	학습 체크포인트 및 최종 모델 가중치 저장을 활성화합니다. 학습을 재개하거나 모델 배포 시 유용합니다.
`save_period`	`int`	`-1`	모델 체크포인트 저장 빈도로 에폭 단위로 지정됩니다. -1은 이 기능을 비활성화합니다. 긴 학습 세션 중에 중간 모델을 저장하는 데 유용합니다.
`cache`	`bool`	`False`	메모리(`True`/`ram`) 또는 디스크(`disk`)에 데이터셋 이미지를 캐싱하거나 캐싱을 비활성화(`False`)합니다. 메모리 사용량이 증가하는 대신 디스크 I/O를 줄여 학습 속도를 향상시킵니다.
`device`	`int` 또는 `str` 또는 `list`	`None`	학습을 위한 계산 장치를 지정합니다: 단일 GPU(`device=0`), 다중 GPU(`device=[0,1]`), CPU(`device=cpu`), Apple Silicon용 MPS(`device=mps`), Huawei Ascend NPU(`device=npu` 또는 `device=npu:0`), 또는 가장 유휴 상태인 GPU 자동 선택(`device=-1`) 또는 여러 개의 유휴 GPU(`device=[-1,-1]`).
`workers`	`int`	`8`	데이터 로딩을 위한 워커 스레드 수입니다(다중 GPU 학습 시 `RANK`당 적용). 데이터 전처리 및 모델 입력 속도에 영향을 주며, 특히 다중 GPU 설정에서 유용합니다.
`project`	`str`	`None`	학습 출력이 저장되는 프로젝트 디렉터리 이름입니다. 다양한 실험을 체계적으로 저장할 수 있습니다.
`name`	`str`	`None`	학습 실행 이름입니다. 프로젝트 폴더 내에 학습 로그와 결과물이 저장되는 하위 디렉터리를 만드는 데 사용됩니다.
`exist_ok`	`bool`	`False`	True인 경우, 기존 프로젝트/이름 디렉터리를 덮어쓸 수 있습니다. 이전 결과물을 수동으로 삭제할 필요 없이 반복적인 실험을 수행할 때 유용합니다.
`save_dir`	`str`	`None`	실행 결과가 저장되는 정확한 디렉토리를 지정하며, `project`/`name` 조합을 재정의합니다. 경로는 자동 증가 없이 그대로 사용되므로 연속 실행 시 동일한 디렉토리를 재사용합니다.
`pretrained`	`bool` 또는 `str`	`True`	사전 학습된 가중치로 학습을 시작할지 결정합니다. 불리언 값이거나 불러올 가중치에 대한 문자열 경로일 수 있습니다. `pretrained=False`는 모델 아키텍처를 유지하면서 무작위로 초기화된 가중치로 학습합니다.
`optimizer`	`str`	`'auto'`	학습을 위한 옵티마이저 선택입니다. `SGD`, `MuSGD`, `Adam`, `Adamax`, `AdamW`, `NAdam`, `RAdam`, `RMSProp` 또는 모델 구성에 기반한 자동 선택을 위한 `auto`가 포함됩니다. 수렴 속도와 안정성에 영향을 미칩니다.
`seed`	`int`	`0`	학습을 위한 난수 시드를 설정하여 동일한 구성으로 실행할 때 결과의 재현성을 보장합니다.
`deterministic`	`bool`	`True`	결정론적 알고리즘 사용을 강제하여 재현성을 보장하지만, 비결정론적 알고리즘 사용 제한으로 인해 성능과 속도에 영향을 줄 수 있습니다.
`verbose`	`bool`	`True`	학습 중 상세 출력을 활성화하여 콘솔에 진행률 표시줄, 에포크별 메트릭 및 추가 학습 정보를 표시합니다.
`single_cls`	`bool`	`False`	학습 중 다중 클래스 데이터셋의 모든 클래스를 단일 클래스로 취급합니다. 이진 분류 작업이나 분류보다는 객체 존재 여부에 집중할 때 유용합니다.
`classes`	`list[int]`	`None`	학습할 클래스 ID 목록을 지정합니다. 학습 중 특정 클래스만 필터링하고 집중하는 데 유용합니다.
`rect`	`bool`	`False`	최소 패딩 전략을 활성화합니다. 배치 내 이미지는 가장 긴 변이 `imgsz`와 같아지도록 공통 크기에 맞춰 최소한으로 패딩됩니다. 효율성과 속도를 향상시킬 수 있지만 모델 정확도에 영향을 줄 수 있습니다.
`multi_scale`	`float`	`0.0`	각 배치마다 `imgsz`를 +/- `multi_scale`(예: `0.25` -> `0.75x` ~ `1.25x`) 범위에서 무작위로 변경하며, 모델 스트라이드 배수로 반올림합니다. `0.0`은 멀티 스케일 학습을 비활성화합니다.
`cos_lr`	`bool`	`False`	코사인 학습률 스케줄러를 사용하여 에포크에 따라 코사인 곡선을 따라 학습률을 조정합니다. 더 나은 수렴을 위해 학습률을 관리하는 데 도움이 됩니다.
`close_mosaic`	`int`	`10`	완료 전 마지막 N 에포크 동안 모자이크 데이터 증강을 비활성화하여 학습을 안정화합니다. 0으로 설정하면 이 기능이 비활성화됩니다.
`resume`	`bool`	`False`	마지막으로 저장된 체크포인트에서 학습을 재개합니다. 모델 가중치, 옵티마이저 상태 및 에포크 수를 자동으로 로드하여 학습을 원활하게 이어갑니다.
`amp`	`bool`	`True`	자동 혼합 정밀도(AMP) 학습을 활성화하여 메모리 사용량을 줄이고 정확도에 미치는 영향을 최소화하면서 학습 속도를 높일 수 있습니다.
`fraction`	`float`	`1.0`	학습에 사용할 데이터셋의 비율을 지정합니다. 전체 데이터셋의 하위 집합으로 학습할 수 있게 하여 실험이나 자원이 제한된 경우에 유용합니다.
`profile`	`bool`	`False`	학습 중 ONNX 및 TensorRT 속도 프로파일링을 활성화하여 모델 배포 최적화에 유용합니다.
`freeze`	`int` 또는 `list`	`None`	모델의 처음 N개 레이어 또는 인덱스로 지정된 레이어를 동결하여 학습 가능한 파라미터 수를 줄입니다. 파인 튜닝이나 전이 학습에 유용합니다.
`lr0`	`float`	`0.01`	초기 학습률(예: `SGD=1E-2`, `Adam=1E-3`). 이 값을 조정하는 것은 최적화 프로세스에 매우 중요하며 모델 가중치가 얼마나 빠르게 업데이트되는지에 영향을 미칩니다.
`lrf`	`float`	`0.01`	초기 학습률의 비율로 표현한 최종 학습률 = (`lr0 * lrf`). 스케줄러와 함께 사용하여 시간 경과에 따른 학습률을 조정합니다.
`momentum`	`float`	`0.937`	SGD의 모멘텀 팩터 또는 Adam 옵티마이저의 beta1 값으로, 현재 업데이트 시 과거 그래디언트를 포함하는 정도에 영향을 미칩니다.
`weight_decay`	`float`	`0.0005`	L2 정규화 항으로, 큰 가중치에 페널티를 주어 과적합을 방지합니다.
`warmup_epochs`	`float`	`3.0`	학습률 웜업을 위한 에포크 수로, 낮은 값에서 초기 학습률까지 점진적으로 학습률을 높여 초기 학습을 안정화합니다.
`warmup_momentum`	`float`	`0.8`	웜업 단계의 초기 모멘텀으로, 웜업 기간 동안 설정된 모멘텀으로 점진적으로 조정됩니다.
`warmup_bias_lr`	`float`	`0.1`	웜업 단계에서의 바이어스 파라미터에 대한 학습률로, 초기 에포크에서 모델 학습을 안정화하는 데 도움을 줍니다.
`distill_model`	`str`	`None`	지식 증류를 위한 교사 모델 체크포인트(예: `yolo26x.pt`) 경로입니다. 설정 시, 학생 모델은 고정된 교사의 지도를 받는 추가적인 증류 손실(distillation loss)을 통해 학습됩니다.
`dis`	`float`	`6.0`	표준 탐지 손실에 추가되는 증류 손실의 가중치입니다. 값이 클수록 교사의 특징 지침에 의한 영향력이 증가합니다.
`box`	`float`	`7.5`	손실 함수 내 박스 손실 성분의 가중치로, 바운딩 박스 좌표를 정확하게 예측하는 데 얼마나 중점을 둘지 결정합니다.
`cls`	`float`	`0.5`	전체 손실 함수에서 분류 손실의 가중치로, 다른 구성 요소 대비 올바른 클래스 예측의 중요도에 영향을 미칩니다.
`cls_pw`	`float`	`0.0`	역 클래스 빈도를 사용하여 클래스 불균형을 처리하기 위한 클래스 가중치 파워입니다. `0.0`은 클래스 가중치를 비활성화하고, `1.0`은 전체 역 빈도 가중치를 적용합니다. 0에서 1 사이의 값은 부분적인 가중치를 제공합니다.
`dfl`	`float`	`1.5`	박스 가장자리 거리를 회귀하는 경계 상자 위치 지정 항인 DFL(Distribution Focal Loss)의 가중치입니다.
`pose`	`float`	`12.0`	포즈 추정을 위해 학습된 모델의 포즈 손실 가중치로, 포즈 키포인트를 정확하게 예측하는 데 강조점을 둡니다.
`kobj`	`float`	`1.0`	포즈 추정 모델에서의 키포인트 오브젝트니스 손실 가중치로, 감지 신뢰도와 포즈 정확도 간의 균형을 맞춥니다.
`rle`	`float`	`1.0`	포즈 추정 모델에서의 잔차 로그 우도 추정 손실 가중치로, 키포인트 위치 지정의 정밀도에 영향을 미칩니다.
`angle`	`float`	`1.0`	obb 모델에서의 각도 손실 가중치로, 회전된 바운딩 박스 각도 예측의 정밀도에 영향을 미칩니다.
`nbs`	`int`	`64`	손실 정규화를 위한 명목 배치 크기입니다.
`overlap_mask`	`bool`	`True`	학습을 위해 객체 마스크를 단일 마스크로 병합할지 아니면 각 객체마다 별도로 유지할지 결정합니다. 겹치는 경우, 병합 시 더 작은 마스크가 더 큰 마스크 위에 덮어씌워집니다.
`mask_ratio`	`int`	`4`	세그멘테이션 마스크에 대한 다운샘플링 비율로, 학습 중 사용되는 마스크의 해상도에 영향을 미칩니다.
`dropout`	`float`	`0.0`	분류 작업에서 정규화를 위한 드롭아웃 비율로, 학습 중 유닛을 무작위로 생략하여 과적합을 방지합니다.
`val`	`bool`	`True`	학습 중 검증을 활성화하여 별도의 데이터셋에서 모델 성능을 주기적으로 평가할 수 있습니다.
`plots`	`bool`	`True`	학습 및 검증 메트릭과 예측 예시의 플롯을 생성하고 저장하여 모델 성능과 학습 진행 상황에 대한 시각적 통찰을 제공합니다.
`compile`	`bool` 또는 `str`	`False`	PyTorch 2.x `torch.compile` 그래프 컴파일을 `backend='inductor'`로 활성화합니다. `True` → `"default"`, `False` → 비활성화, 또는 `"default"`, `"reduce-overhead"`, `"max-autotune-no-cudagraphs"`와 같은 문자열 모드를 허용합니다. 지원되지 않는 경우 경고와 함께 eager 모드로 대체됩니다.
`max_det`	`int`	`300`	학습의 검증 단계에서 유지되는 최대 객체 수를 지정합니다.

배치 크기 설정에 대한 참고 사항

batch 인수는 세 가지 구성 옵션을 제공합니다:

고정 배치 크기: 정수(예: batch=16)로 배치당 이미지 수를 지정합니다.
자동 모드(GPU 메모리의 60%): CUDA 메모리 활용도를 약 60%로 자동 조정하려면 batch=-1을 사용합니다.
활용도 분율이 있는 자동 모드: 지정된 GPU 메모리 사용량을 기준으로 조정하려면 분율(예: batch=0.70)을 설정합니다.

학습 가이드

Link to this section예측 설정#

YOLO 모델의 예측 설정에는 추론 중 성능, 속도 및 정확도에 영향을 주는 하이퍼파라미터와 구성이 포함됩니다. 주요 설정에는 신뢰도 임계값, NMS(Non-Maximum Suppression) 임계값 및 클래스 수가 있습니다. 입력 데이터 크기, 형식 및 마스크와 같은 보조 기능도 예측에 영향을 줍니다. 최적의 성능을 위해서는 이러한 설정을 튜닝하는 것이 필수적입니다.

추론 인수:

인수	유형	기본값	설명
`source`	`str` 또는 `int` 또는 `None`	`None`	추론을 위한 데이터 소스를 지정합니다. 이미지 경로, 비디오 파일, 디렉토리, URL 또는 라이브 피드용 장치 ID일 수 있습니다. 생략하면 경고가 기록되고 모델은 내장 데모 자산(`ultralytics/assets` 또는 OBB용 데모 URL)으로 대체됩니다. 다양한 형식과 소스를 지원하여 다양한 유형의 입력 전반에 걸쳐 유연한 적용이 가능합니다.
`conf`	`float`	`0.25`	탐지를 위한 최소 신뢰도 임계값을 설정합니다. 이 임계값 미만의 신뢰도로 탐지된 객체는 무시됩니다. 이 값을 조정하면 오탐을 줄이는 데 도움이 될 수 있습니다.
`iou`	`float`	`0.7`	NMS(Non-Maximum Suppression)를 위한 IoU(Intersection Over Union) 임계값입니다. 낮은 값은 중복된 상자를 제거하여 탐지 결과를 줄이며, 중복을 줄이는 데 유용합니다.
`imgsz`	`int` 또는 `tuple`	`640`	레터박스 대상입니다. 정수는 정사각형 `N×N`을 제공하고, 튜플은 `(height, width)`를 제공합니다. `rect=True`인 경우, 최소 직사각형 패딩으로 인해 실제 텐서가 이 대상보다 작을 수 있습니다. 고정 크기를 사용하려면 `rect=False`를 사용하십시오. 고정 크기 대 최소 직사각형을 참조하십시오.
`rect`	`bool`	`True`	`True`이면 가능한 경우 최소 직사각형 패딩을 사용합니다(동일한 모양의 배치 및 지원되는 백엔드). `False`이면 항상 전체 `imgsz`로 패딩합니다. 고정 크기 대 최소 직사각형을 참조하십시오.
`quantize`	`int` 또는 `str`	`None`	추론 정밀도: `16`/`"fp16"`은 지원되는 GPU에서 FP16 추론을 활성화하며, `32`/`"fp32"`/설정 안 함은 FP32입니다. INT8/PTQ 양자화는 export 시 구성되며, 이후 내보낸 모델을 로드하여 사용합니다. 더 이상 사용되지 않는 `half` 플래그를 대체합니다.
`device`	`str`	`None`	추론을 위한 장치를 지정합니다(예: `cpu`, `cuda:0`, `0`, `npu` 또는 `npu:0`). 사용자가 CPU, 특정 GPU, Huawei Ascend NPU 또는 기타 컴퓨팅 장치 중에서 모델 실행을 선택할 수 있습니다.
`batch`	`int`	`1`	추론을 위한 배치 크기를 지정합니다(소스가 디렉토리, 비디오 파일 또는 `.txt` 파일인 경우에만 작동합니다). 더 큰 배치 크기는 더 높은 처리량을 제공하여 추론에 필요한 총 시간을 단축할 수 있습니다.
`max_det`	`int`	`300`	이미지당 허용되는 최대 탐지 수입니다. 단일 추론에서 모델이 탐지할 수 있는 객체의 총 수를 제한하여 밀집된 장면에서 과도한 출력을 방지합니다.
`vid_stride`	`int`	`1`	비디오 입력을 위한 프레임 스트라이드입니다. 비디오에서 프레임을 건너뛰어 시간적 해상도를 희생하는 대신 처리 속도를 높일 수 있습니다. 값 1은 모든 프레임을 처리하고, 더 높은 값은 프레임을 건너뜁니다.
`stream_buffer`	`bool`	`False`	비디오 스트림에 대해 들어오는 프레임을 대기열에 넣을지 여부를 결정합니다. `False`이면 이전 프레임이 삭제되어 새 프레임을 수용합니다(실시간 애플리케이션에 최적화됨). `True`이면 새 프레임을 버퍼에 대기시켜 프레임이 건너뛰지 않도록 보장하지만, 추론 FPS가 스트림 FPS보다 낮을 경우 지연 시간이 발생합니다.
`visualize`	`bool`	`False`	추론 중에 모델 특징 시각화를 활성화하여 모델이 "보고 있는" 것에 대한 통찰력을 제공합니다. 디버깅 및 모델 해석에 유용합니다.
`augment`	`bool`	`False`	예측을 위한 TTA(test-time augmentation)를 활성화하여 추론 속도를 희생하는 대신 탐지 견고성을 향상시킬 수 있습니다.
`agnostic_nms`	`bool`	`False`	클래스에 구애받지 않는 NMS(Non-Maximum Suppression)를 활성화하여 서로 다른 클래스의 중복 상자를 병합합니다. 클래스 중첩이 흔한 다중 클래스 탐지 시나리오에서 유용합니다. 엔드 투 엔드 모델(YOLO26, YOLOv10)의 경우, 이는 동일한 탐지가 여러 클래스 레이블(IoU=1.0 중복)과 함께 나타나는 것만 방지하며 개별 상자 간의 IoU 임계값 기반 억제는 수행하지 않습니다.
`classes`	`list[int]`	`None`	예측을 클래스 ID 세트로 필터링합니다. 지정된 클래스에 속하는 탐지만 반환됩니다. 다중 클래스 탐지 작업에서 관련 객체에 집중하는 데 유용합니다.
`retina_masks`	`bool`	`False`	고해상도 세그멘테이션 마스크를 반환합니다. 활성화되면 반환된 마스크(`masks.data`)가 원본 이미지 크기와 일치합니다. 비활성화되면 추론 중에 사용된 이미지 크기를 가집니다.
`embed`	`list[int]`	`None`	특징 벡터 또는 임베딩을 추출할 레이어를 지정합니다. 마지막에서 두 번째 레이어의 임베딩을 사용하려면 `model.embed(source)`를 사용하고, 특정 레이어를 선택하려면 `model.predict(source, embed=[layer])`를 사용하십시오. 클러스터링이나 유사도 검색과 같은 다운스트림 작업에 유용합니다.
`project`	`str`	`None`	`save`가 활성화된 경우 예측 출력이 저장되는 프로젝트 디렉토리의 이름입니다.
`name`	`str`	`None`	예측 실행의 이름입니다. `save`가 활성화된 경우 예측 출력이 저장되는 프로젝트 폴더 내의 하위 디렉토리를 만드는 데 사용됩니다.
`stream`	`bool`	`False`	모든 프레임을 한 번에 메모리에 로드하는 대신 Results 객체 생성기를 반환하여 긴 비디오나 수많은 이미지에 대해 메모리 효율적인 처리를 활성화합니다.
`verbose`	`bool`	`True`	터미널에 상세한 추론 로그를 표시할지 여부를 제어하여 예측 프로세스에 대한 실시간 피드백을 제공합니다.
`compile`	`bool` 또는 `str`	`False`	PyTorch 2.x `torch.compile` 그래프 컴파일을 `backend='inductor'`로 활성화합니다. `True` → `"default"`, `False` → 비활성화, 또는 `"default"`, `"reduce-overhead"`, `"max-autotune-no-cudagraphs"`와 같은 문자열 모드를 허용합니다. 지원되지 않는 경우 경고와 함께 eager 모드로 대체됩니다.
`end2end`	`bool`	`None`	NMS 없는 추론을 지원하는 YOLO 모델(YOLO26, YOLOv10)에서 엔드 투 엔드 모드를 재정의합니다. `False`로 설정하면 기존 NMS 파이프라인을 사용하여 예측을 실행할 수 있으며, 추가적으로 `iou` 인수를 사용할 수 있습니다. 자세한 내용은 엔드 투 엔드 탐지 가이드를 참조하십시오.

시각화 인수:

인수	유형	기본값	설명
`show`	`bool`	`False`	`True`일 경우, 주석이 달린 이미지나 비디오를 창에 표시합니다. 개발 또는 테스트 중 즉각적인 시각적 피드백을 확인하는 데 유용합니다.
`save`	`bool`	`False or True`	주석이 달린 이미지나 비디오를 파일로 저장하는 것을 활성화합니다. 문서화, 추가 분석 또는 결과 공유에 유용합니다. CLI 사용 시 기본값은 True이고 Python에서 사용 시 False입니다.
`save_frames`	`bool`	`False`	비디오를 처리할 때 개별 프레임을 이미지로 저장합니다. 특정 프레임을 추출하거나 상세한 프레임별 분석에 유용합니다.
`save_txt`	`bool`	`False`	`[class] [x_center] [y_center] [width] [height] [confidence]` 형식을 따라 탐지 결과를 텍스트 파일로 저장합니다. 다른 분석 도구와의 통합에 유용합니다.
`save_conf`	`bool`	`False`	저장된 텍스트 파일에 신뢰도 점수를 포함합니다. 후처리 및 분석에 사용할 수 있는 세부 정보를 향상시킵니다.
`save_crop`	`bool`	`False`	탐지된 이미지의 크롭된 이미지를 저장합니다. 데이터셋 증강, 분석 또는 특정 객체에 대한 집중 데이터셋을 만드는 데 유용합니다.
`show_labels`	`bool`	`True`	시각적 출력에서 각 탐지에 대한 레이블을 표시합니다. 탐지된 객체를 즉시 이해할 수 있도록 합니다.
`show_conf`	`bool`	`True`	각 탐지에 대한 신뢰도 점수를 레이블과 함께 표시합니다. 각 탐지에 대한 모델의 확신도를 파악할 수 있습니다.
`show_boxes`	`bool`	`True`	탐지된 객체 주위에 경계 상자를 그립니다. 이미지나 비디오 프레임에서 객체의 시각적 식별 및 위치 파악에 필수적입니다.
`line_width`	`int or None`	`None`	바운딩 박스의 선 굵기를 지정합니다. `None`일 경우, 선 굵기가 이미지 크기에 따라 자동으로 조정됩니다. 명확성을 위해 시각적 커스터마이징을 제공합니다.

예측 가이드

Link to this section검증 설정#

YOLO 모델의 검증 설정에는 검증 데이터셋에서의 성능을 평가하기 위한 하이퍼파라미터와 구성이 포함됩니다. 이러한 설정은 성능, 속도 및 정확도에 영향을 줍니다. 일반적인 설정에는 배치 크기, 검증 빈도 및 성능 지표가 있습니다. 검증 데이터셋의 크기와 구성, 그리고 특정 작업 또한 과정에 영향을 미칩니다.

인수	유형	기본값	설명
`data`	`str`	`None`	데이터셋 구성 파일(예: `coco8.yaml`)에 대한 경로를 지정합니다. 이 파일은 검증 데이터에 대한 경로를 포함해야 합니다.
`imgsz`	`int`	`640`	입력 이미지의 크기를 정의합니다. 모든 이미지는 처리 전에 이 치수로 크기가 조정됩니다. 더 큰 크기는 작은 객체에 대한 정확도를 향상시킬 수 있지만 계산 시간을 증가시킵니다.
`batch`	`int`	`16`	배치당 이미지 수를 설정합니다. 높은 값은 GPU 메모리를 더 효율적으로 사용하지만 더 많은 VRAM이 필요합니다. 사용 가능한 하드웨어 자원에 따라 조정하십시오.
`save_json`	`bool`	`False`	`True`이면 추가 분석, 다른 도구와의 통합 또는 COCO와 같은 평가 서버 제출을 위해 결과를 JSON 파일로 저장합니다.
`conf`	`float`	`0.001`	탐지를 위한 최소 신뢰도 임계값을 설정합니다. 낮은 값은 재현율(recall)을 증가시키지만 오탐지를 더 많이 유발할 수 있습니다. 검증 중에 정밀도-재현율 곡선을 계산하는 데 사용됩니다. 메모리 사용량을 줄이기 위해 OBB 검증의 기본값은 `0.01`입니다.
`iou`	`float`	`0.7`	Sets the Intersection Over Union threshold for Non-Maximum Suppression. Controls duplicate detection elimination.
`max_det`	`int`	`300`	이미지당 최대 탐지 수를 제한합니다. 밀집된 장면에서 과도한 탐지를 방지하고 계산 자원을 관리하는 데 유용합니다.
`quantize`	`int` 또는 `str`	`None`	검증 정밀도: `16`/`"fp16"`은 지원되는 GPU에서 FP16 검증을 활성화하며, `32`/`"fp32"`/설정 안 함은 FP32입니다. INT8/PTQ 양자화는 export 시 구성되며, 이후 내보낸 모델을 검증하여 사용합니다. 더 이상 사용되지 않는 `half` 플래그를 대체합니다.
`device`	`str`	`None`	검증을 위한 장치를 지정합니다(`cpu`, `cuda:0`, `npu`, `npu:0` 등). `None`인 경우, 가장 좋은 사용 가능한 장치를 자동으로 선택합니다. 쉼표로 구분하여 여러 CUDA 장치를 지정할 수 있습니다.
`dnn`	`bool`	`False`	`True`일 경우, ONNX 모델 추론에 OpenCV DNN 모듈을 사용하여 PyTorch 추론 방식의 대안을 제공합니다.
`plots`	`bool`	`True`	`True`로 설정하면 모델 성능을 시각적으로 평가하기 위해 예측값과 실제값(Ground Truth)의 비교 플롯, 혼동 행렬(Confusion Matrix), PR 곡선을 생성하고 저장합니다.
`classes`	`list[int]`	`None`	평가할 클래스 ID 목록을 지정합니다. 평가 과정에서 특정 클래스만 필터링하여 집중적으로 확인하려는 경우 유용합니다.
`rect`	`bool`	`True`	`True`일 경우, 배치 처리에 사각형 추론(Rectangular Inference)을 사용하여 패딩을 줄이고 이미지의 원래 가로세로비를 유지함으로써 처리 속도와 효율성을 높일 수 있습니다.
`split`	`str`	`'val'`	검증에 사용할 데이터셋 분할(`val`, `test` 또는 `train`)을 결정합니다. 성능 평가를 위해 데이터 세그먼트를 선택할 때 유연성을 제공합니다.
`project`	`str`	`None`	검증 출력 결과가 저장되는 프로젝트 디렉터리의 이름입니다. 서로 다른 실험이나 모델의 결과를 정리하는 데 도움이 됩니다.
`name`	`str`	`None`	검증 실행의 이름입니다. 프로젝트 폴더 내에 하위 디렉터리를 생성하는 데 사용되며, 검증 로그와 결과물이 이 곳에 저장됩니다.
`verbose`	`bool`	`True`	`True`일 경우, 검증 과정에서 클래스별 메트릭, 배치 진행 상황, 추가 디버깅 정보를 포함한 상세 정보를 표시합니다.
`save_txt`	`bool`	`False`	`True`일 경우, 이미지당 하나의 파일로 감지 결과를 텍스트 파일로 저장합니다. 이는 심층 분석, 맞춤형 후처리 또는 타 시스템과의 연동에 유용합니다.
`save_conf`	`bool`	`False`	`True`인 경우 `save_txt`가 활성화될 때 저장되는 텍스트 파일에 신뢰도 값을 포함하여 분석 및 필터링을 위한 더 상세한 출력을 제공합니다.
`workers`	`int`	`8`	데이터 로딩을 위한 워커 스레드 수입니다. 값을 높이면 데이터 전처리 속도가 빨라질 수 있지만 CPU 사용량이 증가할 수 있습니다. 0으로 설정하면 메인 스레드를 사용하며, 일부 환경에서는 더 안정적일 수 있습니다.
`augment`	`bool`	`False`	검증 중 TTA(Test-Time Augmentation)를 활성화합니다. 입력 데이터의 변형 버전에 대해 추론을 수행하므로 추론 속도는 다소 느려질 수 있으나 감지 정확도가 향상될 가능성이 있습니다.
`agnostic_nms`	`bool`	`False`	클래스 무관(Class-agnostic) Non-Maximum Suppression을 활성화하여 예측된 클래스와 상관없이 겹치는 박스를 병합합니다. 인스턴스 중심 작업에 유용합니다. 엔드 투 엔드 모델(YOLO26, YOLOv10)의 경우, 이 옵션은 동일한 감지가 여러 클래스 레이블로 나타나는 것을 방지할 뿐(IoU=1.0 중복), 개별 박스 간의 IoU 임계값 기반 억제는 수행하지 않습니다.
`single_cls`	`bool`	`False`	검증 중에 모든 클래스를 단일 클래스로 처리합니다. 이진 감지 작업의 모델 성능을 평가하거나 클래스 구분이 중요하지 않은 경우 유용합니다.
`visualize`	`bool`	`False`	각 이미지에 대한 Ground Truth, True Positive, False Positive 및 False Negative를 시각화합니다. 디버깅 및 모델 해석에 유용합니다.
`show_labels`	`bool`	`True`	`visualize=True`일 때 검증 시각화에 클래스 레이블을 표시합니다. 일치 항목과 오류를 더 명확하게 보려면 `False`로 설정하십시오.
`show_conf`	`bool`	`True`	`visualize=True`일 때 검증 시각화에 신뢰도 점수를 표시합니다. 일치 항목과 오류를 더 명확하게 보려면 `False`로 설정하십시오.
`compile`	`bool` 또는 `str`	`False`	PyTorch 2.x `torch.compile` 그래프 컴파일을 `backend='inductor'`로 활성화합니다. `True` → `"default"`, `False` → 비활성화, 또는 `"default"`, `"reduce-overhead"`, `"max-autotune-no-cudagraphs"`와 같은 문자열 모드를 허용합니다. 지원되지 않는 경우 경고와 함께 eager 모드로 대체됩니다.
`end2end`	`bool`	`None`	NMS-free 추론을 지원하는 YOLO 모델(YOLO26, YOLOv10)의 엔드 투 엔드 모드를 재정의합니다. 이를 `False`로 설정하면 기존 NMS 파이프라인을 사용하여 검증을 수행할 수 있으며, 추가로 `iou` 인수를 활용할 수 있습니다.

최적의 성능을 보장하고 과적합(overfitting)을 감지 및 방지하기 위해 신중한 튜닝과 실험이 필수적입니다.

검증 가이드

Link to this section내보내기(Export) 설정#

YOLO 모델 내보내기 설정에는 다양한 환경에서 사용하기 위해 모델을 저장하거나 내보내는 구성이 포함됩니다. 이러한 설정은 성능, 크기 및 호환성에 영향을 미칩니다. 주요 설정으로는 내보낼 파일 형식(예: ONNX, TensorFlow SavedModel), 대상 장치(예: CPU, GPU) 및 마스크와 같은 기능이 있습니다. 모델의 작업 유형과 대상 환경의 제약 사항도 내보내기 프로세스에 영향을 줍니다.

인수	유형	기본값	설명
`format`	`str`	`'torchscript'`	`'onnx'`, `'torchscript'`, `'engine'`(TensorRT) 등과 같이 내보낼 모델의 대상 형식입니다. 각 형식은 서로 다른 배포 환경과의 호환성을 가능하게 합니다.
`imgsz`	`int` 또는 `tuple`	`640`	모델 입력에 필요한 이미지 크기입니다. 정사각형 이미지의 경우 정수(예: 640×640의 경우 `640`)로 지정하거나, 특정 차원을 위해 튜플 `(height, width)`로 지정할 수 있습니다.
`keras`	`bool`	`False`	TensorFlow SavedModel 형식으로의 내보내기를 활성화하여 TensorFlow 서빙 및 API와의 호환성을 제공합니다.
`optimize`	`bool`	`False`	DEEPX에 대한 더 높은 컴파일러 최적화를 활성화하여 컴파일 시간은 늘리면서 추론 지연 시간은 줄입니다.
`quantize`	`int` 또는 `str`	`None`	양자화 정밀도: `16`(FP16, 모델 크기를 줄이고 지원되는 하드웨어에서 추론 속도를 높일 수 있음) 또는 `8`(INT8/PTQ, 정확도 손실을 최소화하면서 모델을 추가 압축하며 주로 엣지 디바이스용; 보정 `data`/`fraction` 필요); `32`/미설정은 FP32입니다. 혼합 가중치/활성화 정밀도를 지원하는 내보내기 형식은 `'w8a8'`/`'w16a16'`/`'w8a16'`/`'w8a32'` 표기법도 허용합니다. 더 이상 사용되지 않는 `half`/`int8` 플래그를 대체합니다(`half=True` → `16`, `int8=True` → `8`, 여전히 지원되지만 지원 중단 경고가 표시됨). 대상 형식에서 지원되는 정밀도만 허용됩니다(아래 참조).
`dynamic`	`bool`	`False`	TorchScript, ONNX, OpenVINO, TensorRT 및 CoreML 내보내기에 대해 동적 입력 크기를 허용하여, 다양한 이미지 차원을 처리하는 데 유연성을 높입니다.
`simplify`	`bool`	`True`	`onnxslim`을 사용하여 ONNX 내보내기를 위한 모델 그래프를 단순화하며, 추론 엔진과의 성능 및 호환성을 향상시킬 수 있습니다.
`opset`	`int`	`None`	서로 다른 ONNX 파서 및 런타임과의 호환성을 위해 ONNX opset 버전을 지정합니다. 설정하지 않으면 지원되는 최신 버전을 사용합니다.
`workspace`	`float` 또는 `None`	`None`	TensorRT 최적화를 위한 최대 작업 공간 크기(GiB 단위)를 설정하여 메모리 사용량과 성능 간의 균형을 맞춥니다. TensorRT가 장치 최대치까지 자동으로 할당하게 하려면 `None`을 사용하세요.
`nms`	`bool`	`False`	지원되는 경우 내보낸 모델에 NMS(비최대 억제)를 추가하여(내보내기 형식 참조) 탐지 후처리 효율성을 향상시킵니다. end2end 모델에서는 사용할 수 없습니다. CoreML의 경우 탐지 모델에 대해서만 지원됩니다.
`batch`	`int`	`1`	내보낸 모델의 배치 추론 크기 또는 `predict` 모드에서 모델이 동시에 처리할 최대 이미지 수를 지정합니다. Edge TPU 내보내기의 경우 이 값은 자동으로 1로 설정됩니다.
`device`	`str`	`None`	내보내기(export)를 위한 장치를 지정합니다. GPU(`device=0`), CPU(`device=cpu`), Apple 실리콘용 MPS(`device=mps`), Huawei Ascend NPU(`device=npu` 또는 `device=npu:0`), 또는 NVIDIA Jetson용 DLA(`device=dla:0` 또는 `device=dla:1`)가 있습니다. TensorRT 내보내기는 자동으로 GPU를 사용하지만, TensorRT 11.0은 DLA를 지원하지 않습니다.
`data`	`str`	`None`	INT8 양자화 보정에 필수적인 dataset 구성 파일 경로입니다. INT8이 활성화된 상태에서 지정하지 않으면 Ultralytics는 필요한 경우 작업별 보정 데이터셋을 선택하거나 모델 작업의 기본 데이터셋으로 대체합니다.
`fraction`	`float`	`1.0`	INT8 양자화 보정에 사용할 데이터셋의 비율을 지정합니다. 전체 데이터셋의 하위 집합으로 보정할 수 있게 하여 실험이나 리소스가 제한된 경우에 유용합니다. INT8을 활성화하고 지정하지 않으면 전체 데이터셋이 사용됩니다.
`end2end`	`bool`	`None`	NMS-free 추론을 지원하는 YOLO 모델(YOLO26, YOLOv10)의 엔드 투 엔드 모드를 재정의합니다. 이를 `False`로 설정하면 기존의 NMS 기반 후처리 파이프라인과 호환되도록 모델을 내보낼 수 있습니다. 자세한 내용은 엔드 투 엔드 감지 가이드를 참조하세요.

신중한 구성은 내보낸 모델이 사용 사례에 최적화되고 대상 환경에서 효과적으로 작동하도록 보장합니다.

내보내기 가이드

Link to this section솔루션 설정#

Ultralytics 솔루션 구성 설정은 객체 카운팅, 히트맵 생성, 운동 추적, 데이터 분석, 영역 추적, 대기열 관리, 영역 기반 카운팅과 같은 작업에 맞춰 모델을 커스터마이징할 수 있는 유연성을 제공합니다. 이러한 옵션을 통해 특정 요구 사항에 맞춰 정확하고 유용한 결과를 얻을 수 있도록 쉽게 조정할 수 있습니다.

인수	유형	기본값	설명
`model`	`str`	`None`	Ultralytics YOLO 모델 파일 경로입니다.
`region`	`list` 또는 `dict`	`None`	관심 영역을 정의하는 점으로, `(x, y)` 튜플 리스트이거나 다중 영역(`RegionCounter` 전용)에 대해 영역 이름과 점 리스트를 매핑하는 딕셔너리입니다. `None`일 경우, 영역이 필요한 솔루션은 미리 정의된 기본값으로 대체됩니다.
`show_in`	`bool`	`True`	비디오 스트림에 유입(in) 카운트를 표시할지 여부를 제어하는 플래그입니다.
`show_out`	`bool`	`True`	비디오 스트림에 유출(out) 카운트를 표시할지 여부를 제어하는 플래그입니다.
`analytics_type`	`str`	`'line'`	그래프 유형으로, `line`(선형), `bar`(막대), `area`(영역), 또는 `pie`(원형)를 지원합니다.
`colormap`	`int`	`cv2.COLORMAP_DEEPGREEN`	히트맵에 사용할 컬러맵입니다.
`json_file`	`str`	`None`	모든 주차 좌표 데이터가 포함된 JSON 파일 경로입니다.
`up_angle`	`float`	`145.0`	'up'(위) 자세에 대한 각도 임계값입니다.
`kpts`	`list[int]`	`'[6, 8, 10]'`	운동 모니터링에 사용되는 세 개의 키포인트 인덱스 목록입니다. 이 키포인트들은 푸시업, 풀업, 스쿼트, 복근 운동과 같은 동작을 위해 어깨, 팔꿈치, 손목 등 신체 관절이나 부위에 대응합니다.
`down_angle`	`int`	`90`	'down'(아래) 자세에 대한 각도 임계값입니다.
`blur_ratio`	`float`	`0.5`	블러 강도의 백분율을 조정하며, `0.1 - 1.0` 범위 내의 값을 가집니다.
`crop_dir`	`str`	`'cropped-detections'`	크롭된 탐지 결과를 저장하기 위한 디렉토리 이름입니다.
`records`	`int`	`5`	보안 경보 시스템에서 이메일을 발송하기 위해 필요한 총 탐지 횟수입니다.
`vision_point`	`tuple[int, int]`	`(20, 20)`	VisionEye 솔루션을 사용하여 시야가 객체를 추적하고 경로를 그릴 기준점입니다.
`source`	`str`	`None`	입력 소스(비디오, RTSP 등) 경로입니다. 솔루션 명령줄 인터페이스(CLI)에서만 사용 가능합니다.
`figsize`	`tuple[float, float]`	`(12.8, 7.2)`	히트맵이나 그래프와 같은 분석 차트의 피규어 크기입니다.
`fps`	`float`	`30.0`	속도 계산에 사용되는 초당 프레임 수입니다.
`max_hist`	`int`	`5`	속도/방향 계산을 위해 객체별로 추적할 최대 기록 포인트 수입니다.
`meter_per_pixel`	`float`	`0.05`	픽셀 거리를 실제 단위로 변환하는 데 사용되는 스케일링 계수입니다.
`max_speed`	`int`	`120`	시각적 오버레이에서 표시되는 최대 속도 제한(경고 등에 사용됨)입니다.
`data`	`str`	`'images'`	유사도 검색에 사용되는 이미지 디렉토리 경로입니다.
`imgsz`	`int`	`640`	모델 추론을 위한 입력 이미지 크기입니다.

솔루션 가이드

Link to this section증강(Augmentation) 설정#

데이터 증강 기법은 학습 데이터에 변동성을 도입하여 모델이 보지 못한 데이터에 대해 더 잘 일반화되도록 함으로써 YOLO 모델의 견고성과 성능을 향상시키는 데 필수적입니다. 다음 표는 각 증강 인수의 목적과 효과를 설명합니다:

인수	유형	기본값	지원되는 작업	범위	설명
`hsv_h`	`float`	`0.015`	`detect`, `segment`, `pose`, `obb`, `classify`	`0.0 - 1.0`	색상 휠의 일부만큼 이미지의 색조(Hue)를 조정하여 색상 변동성을 도입합니다. 모델이 다양한 조명 조건에서도 일반화할 수 있도록 돕습니다.
`hsv_s`	`float`	`0.7`	`detect`, `segment`, `pose`, `obb`, `classify`	`0.0 - 1.0`	이미지의 채도(Saturation)를 일정 비율만큼 변경하여 색상 강도에 영향을 줍니다. 다양한 환경 조건을 시뮬레이션하는 데 유용합니다.
`hsv_v`	`float`	`0.4`	`detect`, `segment`, `pose`, `obb`, `classify`	`0.0 - 1.0`	이미지의 명도(Value/Brightness)를 일정 비율만큼 수정하여 모델이 다양한 조명 환경에서 잘 작동하도록 돕습니다.
`degrees`	`float`	`0`	`detect`, `segment`, `pose`, `obb`	`0.0 - 180`	이미지를 지정된 각도 범위 내에서 무작위로 회전시켜, 다양한 방향에 있는 객체를 인식하는 모델의 능력을 향상합니다.
`translate`	`float`	`0.1`	`detect`, `segment`, `pose`, `obb`	`0.0 - 1.0`	이미지를 이미지 크기의 일부만큼 가로 및 세로로 이동시켜, 부분적으로 보이는 객체를 탐지하는 학습을 지원합니다.
`scale`	`float`	`0.5`	`detect`, `segment`, `pose`, `obb`, `classify`	`0 - 1`	게인(gain) 계수만큼 이미지의 크기를 조정하여, 카메라로부터 다양한 거리에 있는 객체를 시뮬레이션합니다.
`shear`	`float`	`0`	`detect`, `segment`, `pose`, `obb`	`-180 - +180`	지정된 각도만큼 이미지를 기울여, 다양한 각도에서 객체를 바라보는 효과를 모방합니다.
`perspective`	`float`	`0`	`detect`, `segment`, `pose`, `obb`	`0.0 - 0.001`	이미지에 무작위 원근 변환을 적용하여, 3D 공간 내의 객체를 이해하는 모델의 능력을 향상합니다.
`flipud`	`float`	`0`	`detect`, `segment`, `pose`, `obb`, `classify`	`0.0 - 1.0`	지정된 확률로 이미지를 상하로 뒤집어, 객체의 특성을 변경하지 않으면서 데이터 가변성을 증가시킵니다.
`fliplr`	`float`	`0.5`	`detect`, `segment`, `pose`, `obb`, `classify`	`0.0 - 1.0`	지정된 확률로 이미지를 좌우로 뒤집어, 대칭적인 객체를 학습하고 데이터셋의 다양성을 높이는 데 유용합니다.
`bgr`	`float`	`0`	`detect`, `segment`, `pose`, `obb`	`0.0 - 1.0`	지정된 확률로 이미지 채널을 RGB에서 BGR로 전환하며, 잘못된 채널 순서에 대한 견고성을 높이는 데 유용합니다.
`mosaic`	`float`	`1`	`detect`, `segment`, `pose`, `obb`	`0.0 - 1.0`	4개의 학습 이미지를 하나로 결합하여 다양한 장면 구성과 객체 상호작용을 시뮬레이션합니다. 복잡한 장면 이해에 매우 효과적입니다.
`mixup`	`float`	`0`	`detect`, `segment`, `pose`, `obb`	`0.0 - 1.0`	두 이미지와 해당 라벨을 혼합하여 합성 이미지를 생성합니다. 라벨 노이즈와 시각적 가변성을 도입하여 모델의 일반화 능력을 향상합니다.
`cutmix`	`float`	`0`	`detect`, `segment`, `pose`, `obb`	`0.0 - 1.0`	두 이미지의 일부를 결합하여 뚜렷한 영역을 유지하면서 부분적인 혼합을 생성합니다. 폐색 시나리오를 만들어 모델의 견고성을 향상합니다.
`copy_paste`	`float`	`0`	`segment`	`0.0 - 1.0`	이미지 전반에 걸쳐 객체를 복사하고 붙여넣어 객체 인스턴스를 늘립니다.
`copy_paste_mode`	`str`	`flip`	`segment`	-	사용할 `copy-paste` 전략을 지정합니다. 옵션에는 `'flip'`과 `'mixup'`이 있습니다.
`auto_augment`	`str`	`randaugment`	`classify`	-	사전 정의된 증강 정책(`'randaugment'`, `'autoaugment'`, 또는 `'augmix'`)을 적용하여 시각적 다양성을 통해 모델 성능을 향상합니다.
`erasing`	`float`	`0.4`	`classify`	`0.0 - 1.0`	학습 중에 이미지의 영역을 무작위로 지워 모델이 덜 명확한 특징에 집중하도록 유도합니다.
`augmentations`	`list`	`None`	`detect`, `segment`, `pose`, `obb`	-	고급 데이터 증강을 위한 사용자 지정 Albumentations 변환(Python API 전용)입니다. 특수 증강 요구 사항을 위해 변환 객체 목록을 허용합니다.

데이터셋 및 작업 요구 사항에 맞춰 이러한 설정을 조정하세요. 다양한 값을 실험하면 최고의 모델 성능을 위한 최적의 증강 전략을 찾는 데 도움이 됩니다.

증강 가이드

Link to this section로깅, 체크포인트 및 플롯 설정#

YOLO 모델을 학습할 때는 로깅, 체크포인트, 플롯팅 및 파일 관리가 중요합니다:

Logging: TensorBoard와 같은 라이브러리를 사용하거나 파일에 기록하여 모델의 진행 상황을 추적하고 문제를 진단합니다.
체크포인트: 모델을 정기적으로 저장하여 학습을 재개하거나 다른 구성으로 실험할 수 있습니다.
플롯팅: Matplotlib이나 TensorBoard와 같은 라이브러리를 사용하여 성능과 학습 진행 상황을 시각화합니다.
파일 관리: 체크포인트, 로그 파일, 플롯과 같이 학습 중에 생성된 파일을 정리하여 쉽게 접근하고 분석할 수 있도록 합니다.

이러한 측면을 효과적으로 관리하면 진행 상황을 추적하고 디버깅 및 최적화를 더 쉽게 할 수 있습니다.

인수	기본값	설명
`project`	`None`	학습 실행을 저장할 루트 디렉터리를 지정합니다. 지정하지 않으면 실행은 `runs/<task>` 아래에 저장됩니다. 각 실행은 별도의 하위 디렉터리에 저장됩니다.
`name`	`None`	실험 이름을 정의합니다. 지정하지 않으면 YOLO는 모드 이름을 사용하고 각 실행마다 번호를 증가(예: `train`, `train-2`)시켜 덮어쓰기를 방지합니다.
`exist_ok`	`False`	기존 실험 디렉터리를 덮어쓸지 여부를 결정합니다. `True`는 덮어쓰기를 허용하며, `False`는 방지합니다.
`plots`	`True`	학습 및 검증 플롯의 생성 및 저장을 제어합니다. `True`로 설정하면 손실 곡선, 정밀도-재현율 곡선, 샘플 예측과 같은 플롯을 생성하여 성능을 시각적으로 추적할 수 있습니다.
`save`	`True`	학습 체크포인트와 최종 모델 가중치 저장을 활성화합니다. `True`로 설정하면 모델 상태를 주기적으로 저장하여 학습을 재개하거나 모델을 배포할 수 있습니다.

Link to this section사용자 지정 구성 파일#

저장된 YAML을 로드하여 인라인으로 전달하지 않고 전체 인수 세트를 재사용할 수 있습니다. cfg 인수는 default.yaml의 값을 재정의하며, 추가로 전달된 인수는 여전히 우선순위를 갖습니다.

인수	기본값	설명
`cfg`	`None`	값이 `default.yaml` 항목을 대체하는 YAML 파일 경로입니다. CLI 예제는 기본 구성 파일 재정의를 참조하세요.

Link to this sectionFAQ#

Link to this section학습 중 YOLO 모델의 성능을 향상하려면 어떻게 해야 하나요?#

배치 크기, 학습률, 모멘텀, 가중치 감쇠와 같은 하이퍼파라미터를 튜닝하여 성능을 향상시키세요. 데이터 증강 설정을 조정하고, 적절한 옵티마이저를 선택하며, 조기 종료나 혼합 정밀도와 같은 기법을 사용하세요. 자세한 내용은 학습 가이드를 참조하세요.

Link to this sectionYOLO 모델의 정확도에 영향을 주는 주요 하이퍼파라미터는 무엇인가요?#

정확도에 영향을 주는 주요 하이퍼파라미터는 다음과 같습니다:

배치 크기 (batch): 크기가 클수록 학습은 안정될 수 있지만 더 많은 메모리가 필요합니다.
학습률 (lr0): 낮은 학습률은 미세한 조정을 가능하게 하지만 수렴 속도가 느려집니다.
모멘텀 (momentum): 그래디언트 벡터를 가속화하고 진동을 완화합니다.
이미지 크기 (imgsz): 큰 크기는 정확도를 향상시키지만 계산 부하를 증가시킵니다.

데이터셋과 하드웨어에 따라 이를 조정하세요. 자세한 내용은 학습 설정에서 확인하세요.

Link to this sectionYOLO 모델 학습을 위한 학습률은 어떻게 설정하나요?#

The learning rate (lr0) is crucial; start with 0.01 for SGD or 0.001 for Adam optimizer. Monitor metrics and adjust as needed. Use cosine learning rate schedulers (cos_lr) or warmup (warmup_epochs, warmup_momentum). Details are in the Train Guide.

Link to this sectionYOLO 모델의 기본 추론 설정은 무엇인가요?#

기본 설정은 다음과 같습니다:

신뢰도 임계값 (conf=0.25): 감지를 위한 최소 신뢰도.
IoU 임계값 (iou=0.7): Non-Maximum Suppression (NMS)를 위한 값.
이미지 크기 (imgsz=640): 입력 이미지 크기 조정.
장치 (device=None): CPU, GPU, Apple MPS 또는 Huawei Ascend NPU(npu)를 선택합니다.

전체 개요는 예측 설정 및 예측 가이드를 참조하세요.

Link to this sectionYOLO 모델 학습에 왜 혼합 정밀도를 사용하나요?#

혼합 정밀도 학습(amp=True)은 FP16과 FP32를 사용하여 메모리 사용량을 줄이고 학습 속도를 높입니다. 이는 최신 GPU에 유익하며, 정확도 손실을 크게 줄이면서 더 큰 모델과 빠른 연산을 가능하게 합니다. 자세한 내용은 학습 가이드에서 확인하세요.

기여자

GLglenn-jocher²⁹ RIRizwanMunawar⁵ RAraimbekovm³ LALaughing-q³ MAMatthewNoyce³ AMambitious-octopus² FCfcakyon² MImiles-deans-ultralytics¹ GIGiantAxeWhy¹ PDpderrenger¹ JKjk4e¹ PLplashchynski¹ BUBurhan-Q¹ AYAyushExel¹ TEtensorturtle¹

생성됨 2023년 11월 12일업데이트됨 3주 전