콘텐츠로 건너뛰기

YOLOv9 YOLO10: 객체 탐지 진화의 기술적 심층 분석

실시간 객체 탐지 분야의 기술 지형은 급속히 진화해 왔으며, 2024년에는 두 가지 중요한 아키텍처가 등장했습니다: YOLOv9YOLOv10이 등장했습니다. 두 모델 모두 정확도와 효율성의 한계를 뛰어넘는 것을 목표로 하지만, 이를 달성하는 방식은 근본적으로 다른 아키텍처 철학을 따릅니다. YOLOv9 네트워크 깊숙한 곳에서 정보 보존을 극대화하는 데 YOLOv9 반면, YOLOv10 비최대 억제(NMS)의 필요성을 제거함으로써 배포 파이프라인에 YOLOv10 .

이 가이드는 연구자와 엔지니어가 특정 컴퓨터 비전 애플리케이션에 적합한 도구를 선택할 수 있도록 포괄적인 기술 비교를 제공합니다.

YOLOv9: 프로그래밍 가능한 그래디언트 정보

2024년 2월, YOLOv4와 YOLOv7 개발팀인 왕젠야오(王建耀)와 마크 리아오홍위안(廖宏源)이 발표한 YOLOv9 딥 뉴럴 네트워크에 내재된 '정보 병목 현상' 문제를 YOLOv9 . 데이터가 연속적인 레이어를 통과할 때 입력 데이터가 종종 손실되어 모델의 특정 특징 학습 능력이 저하됩니다.

이를 해결하기 위해 YOLOv9 PGI(Programmable Gradient Information)GELAN(Generalized Efficient Layer Aggregation Network) 아키텍처를 YOLOv9 . PGI는 훈련 중 주요 분기가 핵심 정보를 유지하도록 보장하는 보조 감독 분기를 제공하며, GELAN은 더 나은 기울기 경로 계획을 위해 매개변수 활용도를 최적화합니다.

9에 대해 자세히 알아보기

YOLOv10: 실시간 종단 간 detect

2024년 5월 칭화대 연구진이 발표한 YOLOv10 YOLO 중대한 전환점을 YOLOv10 . 기존 YOLO 중첩된 바운딩 박스를 필터링하기 위해 NMS 단계에 의존했습니다. YOLOv10 훈련 과정에서 일관된 이중 할당 전략을 YOLOv10 . 즉, 풍부한 감독을 위한 일대다 할당과 추론을 위한 일대일 할당을 병행함으로써 모델이 본질적으로 NMS 작동할 수 있게 했습니다.

이러한 아키텍처 변경은 추론 지연 시간을 줄이고 배포 파이프라인을 단순화하여 CPU 소중한 에지 컴퓨팅 환경에서 특히 매력적입니다.

10에 대해 자세히 알아보기

성능 비교

이 두 아키텍처를 비교할 때, 우리는 순수 탐지 성능(mAP)과 추론 효율성(지연 시간 및 FLOPs) 간의 상충 관계를 살펴봅니다.

메트릭 분석

다음 표는 COCO 성능 지표를 보여줍니다. YOLOv9e는 복잡한 작업에서 우수한 정확도를 보이지만, NMS 제거된 덕분에 YOLOv10 일반적으로 더 낮은 지연 시간을 제공합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

주요 내용

  1. 지연 시간 대 정확도: YOLOv10n은 GPU 훨씬 빠르게 실행되면서(1.56ms 대 2.3ms) YOLOv9t(38.3%)보다 높은 mAP 39.5%)를 달성합니다. 이로 인해 v10 아키텍처는 소규모 배포에 매우 효율적입니다.
  2. 최상위 정밀도: 정확도 1% 포인트가 중요한 연구 시나리오에서 YOLOv9e는 55.6% mAP 기록하며 여전히 강력한 성능을 발휘합니다. 프로그래머블 그라디언트 정보를 활용해 다른 모델이 놓칠 수 있는 미세한 특징을 추출합니다.
  3. 효율성: YOLOv10 FLOPs 효율성에서 YOLOv10 . YOLOv10s는 YOLOv9s의 26.4G에 비해 단 21.6G FLOPs만 필요로 하여, 배터리 구동 장치에서 더 낮은 전력 소비로 이어집니다.

하드웨어 고려 사항

CPU( Intel 프로세서 등) 또는 특수화된 에지 하드웨어(라즈베리 파이, 제트슨)에 배포하는 경우, YOLOv10 NMS(네트워크 모듈러티) 없는 설계는 후처리 단계의 비결정적 처리 시간을 제거하므로 일반적으로 더 매끄러운 파이프라인을 구현합니다.

학습 및 생태계

Ultralytics 사용의 가장 큰 장점 중 하나는 통합된 생태계입니다. YOLOv9 YOLOv10 YOLOv9 , 훈련, 검증 및 내보내기 워크플로는 동일하게 유지됩니다. 이러한 일관성은 개발자의 학습 곡선을 획기적으로 줄여줍니다.

Ultralytics 이점

  • 사용 편의성: 단일 문자열을 변경하여 아키텍처를 전환할 수 있는 간단한 Python 제공합니다(예: yolov9c.pt 에서 yolov10m.pt)입니다.
  • 잘 관리된 생태계: Ultralytics 최신 버전과의 호환성을 보장하기 위해 자주 업데이트를 Ultralytics . PyTorch 버전 및 CUDA 호환성을 보장합니다.
  • 메모리 요구 사항: 메모리 부풀림 현상으로 고통받는 많은 트랜스포머 기반 모델과 달리, Ultralytics GPU 효율성을 위해 최적화되어 있습니다. 이를 통해 소비자 등급 하드웨어에서도 더 큰 배치 크기를 사용할 수 있습니다.

훈련 예시

사용자 정의 데이터셋으로 두 모델 중 하나를 훈련시키는 것은 간단합니다. 프레임워크가 데이터 증강, 캐싱 및 메트릭 로깅을 자동으로 처리합니다.

from ultralytics import YOLO

# Load a model (Swap "yolov10n.pt" for "yolov9c.pt" to switch architectures)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
model.val()

# Export to ONNX for deployment
model.export(format="onnx")

이상적인 사용 사례

9 선택해야 할 때

YOLOv9 높은 특징 충실도가 요구되는 시나리오에 선호되는 YOLOv9 . GELAN 아키텍처는 정보 손실에 강건하여 다음과 같은 경우에 이상적입니다:

  • 의료 영상: 특징을 놓치는 것이 치명적인 작은 종양이나 이상을 탐지합니다. 의료 분야 AI 가이드를 참조하세요.
  • 소형 물체 탐지: 항공 촬영 이미지나 원거리 감시와 같은 시나리오에서 물체가 극소수의 픽셀만을 차지하는 경우.
  • 연구 기준선: 2024년 초의 최첨단 아키텍처와 벤치마킹할 때.

10 선택해야 할 때

YOLOv10 속도와 배포 용이성을 위해 YOLOv10 . NMS 제거로 NMS 다음 분야에서 강력한 경쟁자로 NMS :

  • 엣지 컴퓨팅: 라즈베리 파이(Raspberry Pi )나 휴대폰과 같은 장치에서 실행되며, 후처리로 인한 CPU 병목 현상을 일으키는 경우에 활용됩니다.
  • 실시간 로봇공학: 자율 주행과 같이 일관되고 지연 시간이 짧은 피드백 루프가 필요한 응용 분야.
  • 복합 파이프라인: 검출기 출력이 추적 알고리즘으로 입력되는 시스템; NMS 제거된 출력은 하류 작업의 논리를 단순화합니다.

앞으로 바라보기: YOLO26의 힘

YOLOv9 YOLOv10 훌륭한 YOLOv10 , AI 분야는 빠르게 발전하고 YOLOv10 . 2026년에 시작되는 신규 프로젝트의 경우 YOLOv26을 평가해 볼 것을 적극 권장합니다.

2026년 1월 출시된 YOLO26은 YOLOv10 NMS 혁신을 기반으로 YOLOv10 , 다음과 같은 중요한 아키텍처 개선 사항을 도입합니다:

  1. 엔드투엔드 NMS 프리: v10과 마찬가지로 YOLO26은 기본적으로 엔드투엔드 방식이지만, 더 높은 정확도를 위해 탐지 헤드에 대한 추가 최적화가 이루어졌습니다.
  2. MuSGD 최적화기: SGD 뮤온(LLM 훈련에서 영감을 얻음)의 하이브리드인 이 최적화기는 컴퓨터 비전 분야에 대규모 언어 모델 훈련의 안정성을 도입하여 더 빠른 수렴을 보장합니다.
  3. DFL 제거: 분포 초점 손실(DFL)을 제거함으로써 YOLO26은 출력 그래프를 단순화하여 NPU 제약이 있는 장치에 배포하기 훨씬 용이하게 합니다.
  4. ProgLoss + STAL: 실시간 탐지기의 일반적인 약점인 소형 물체 인식 성능 향상을 위해 특별히 조정된 새로운 손실 함수.
  5. 성능: 에지 컴퓨팅에 특화하여 최적화된 YOLO26은 이전 세대에 비해 최대 43% 빠른 CPU 제공합니다.

YOLO26에 대해 더 알아보기

또한 YOLO26은 단순한 탐지기가 아닙니다. 자세 추정 (RLE 활용), 인스턴스 분할, 방향성 바운딩 박스(OBB) 작업에 특화된 개선 사항을 포함하여 Ultralytics 가장 다재다능한 도구로 자리매김했습니다.

결론

YOLOv9 YOLOv10 모두 컴퓨터 비전 분야에서 중대한 도약을 YOLOv10 . YOLOv9 정보 손실 없이 딥 네트워크의 효율성을 높일 수 있음을 YOLOv9 , YOLOv10 수십 년간 지속되어 온 NMS (네트워크 모드 선택)에 대한 의존성을 깨뜨릴 NMS 있음을 YOLOv10 .

현재 개발자에게 있어 선택은 주로 배포 제약 조건에 달려 있습니다. 까다로운 데이터에서 절대적인 최고 정확도가 필요하다면 YOLOv9e가 강력한 후보입니다. 지연 시간과 배포 간편성이 최우선이라면 YOLOv10 . 그러나 속도, 정확도, 미래 대비 기능의 최적 균형을 원한다면 YOLO26이 Ultralytics 사용자에게 현재 최첨단 추천 모델로 자리매김하고 있습니다.


댓글