콘텐츠로 건너뛰기

Ultralytics YOLOv8 YOLOv9: 현대 객체 탐지 기술에 대한 심층 분석

실시간 객체 탐지 기술의 지형도는 급속히 진화해 왔으며, 새로운 기술이 등장할 때마다 에지 디바이스와 클라우드 서버 모두에서 가능한 한계를 넓혀가고 있습니다. Ultralytics YOLOv8는 2023년 초 출시되어 다용도성과 사용 편의성 측면에서 업계 표준으로 자리매김했습니다. 1년 후 출시된 YOLOv9 는 딥러닝 정보 병목 현상을 해결하기 위해 프로그래머블 그라디언트 정보(PGI)를 중심으로 한 새로운 아키텍처 개념을 도입했습니다.

이 포괄적인 가이드는 두 거물급 제품을 비교하여, 각각의 아키텍처 혁신, 성능 지표 및 이상적인 배포 시나리오를 분석함으로써 컴퓨터 비전 프로젝트에 적합한 모델을 선택하는 데 도움을 드립니다.

요약: 어떤 모델을 선택해야 할까?

두 모델 모두 컴퓨터 비전 역사에서 중요한 이정표를 나타내지만, 현대 AI 환경에서는 약간 다른 요구를 충족시킵니다.

  • YOLOv8 Ultralytics YOLOv8 선택하십시오: 생산 환경에 바로 적용 가능한 생태계를 우선시하는 경우. YOLOv8 실제 적용을 위해 YOLOv8 다양한 작업(검출, 분할, 자세, OBB, 분류)을 즉시 지원합니다. Ultralytics 플랫폼과의 원활한 통합으로 Ultralytics 과의 원활한 통합으로 엔지니어링 팀의 훈련, 추적 및 배포 작업이 훨씬 용이해집니다.
  • YOLOv9 선택하십시오: COCO 같은 표준 벤치마크에서 mAP (평균 정밀도) 극대화에 전적으로 집중하는 연구원 또는 고급 개발자입니다. YOLOv9 CNN 아키텍처 효율성의 이론적 한계를 YOLOv9 우수한 매개변수 대 정확도 비율을 제공하지만, 종종 더 복잡한 훈련 설정이 필요합니다.
  • YOLO26(권장)을 선택하세요: 최첨단 정확도와 원활한 엔드투엔드 효율성이라는 두 마리 토끼를 모두 잡고 싶다면. 2026년 출시된 YOLO26 는 비최대 억제(NMS)를 완전히 제거하여 이전 세대 대비 최대 43% 빠른 CPU 제공하면서도 최상위 정확도를 유지합니다.

YOLO26으로 프로젝트의 미래 대비를 완성하세요

YOLOv8 YOLOv9 훌륭하지만, 새로 출시된 YOLO26 는 다음 단계의 도약을 상징합니다. 간소화된 배포를 위한 기본적인 NMS(Neighborhood Multi-Scale Detection) 프리 설계와 안정적인 훈련을 위한 혁신적인 MuSGD(Multi-Scale Gradient Descent) 최적화기를 특징으로 합니다. 신규 프로젝트에는 YOLO26을 권장합니다.

기술 사양 및 저작권

이러한 모델들의 계보를 이해하는 것은 그들의 아키텍처적 결정에 대한 맥락을 제공한다.

Ultralytics YOLOv8

저자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
소속:Ultralytics
출시일: 2023년 1월 10일
라이선스: AGPL-3.0 엔터프라이즈 버전 제공)
링크:GitHub, 문서

8에 대해 자세히 알아보기

9

저자: 왕천야오(Chien-Yao Wang) 및 마크 리아오홍위안(Hong-Yuan Mark Liao)
소속기관: 대만 중앙연구원 정보과학연구원
공개일: 2024년 2월 21일
라이선스: GPL-3.0
링크:Arxiv, GitHub

9에 대해 자세히 알아보기

성능 벤치마크

객체 탐지 모델을 평가할 때 속도(추론 지연 시간)와 정확도(mAP) 간의 균형은 가장 중요합니다. 아래 표는 COCO 데이터셋에서 주요 지표를 비교합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

분석: YOLOv9 인상적인 효율성을YOLOv9 , 종종 mAP 적은 mAP 더 높은 mAP 달성합니다(YOLOv9t 대 YOLOv8n 참조). 그러나 Ultralytics YOLOv8 표준 하드웨어 구성에서 우수한 추론 속도를 유지하며, 다양한 플랫폼(예: TensorRTOpenVINO과 같은 다양한 플랫폼 전반에 걸쳐 지연 시간을 최적화하는 성숙한 내보내기 파이프라인의

아키텍처 혁신

YOLOv8: 통합 프레임워크

YOLOv8 최첨단 앵커 프리 아키텍처를 YOLOv8 . 주요 특징은 다음과 같습니다:

  • 앵커 프리 탐지: 박스 예측 개수를 줄여 비최대 억제(NMS) 속도를 높입니다.
  • 모자이크 증강: 가림 현상에 대한 내성을 향상시키는 강화된 훈련 기법.
  • C2f 모듈: 두 개의 컨볼루션으로 구성된 크로스 스테이지 부분 병목 구조로, 기울기 흐름을 개선하여 기존의 C3 모듈을 대체합니다.
  • 분리형 헤드: 분류 및 회귀 작업을 분리하여 정확도를 향상시킵니다.

YOLOv8 진정한 강점은 통합적인 설계에 YOLOv8 . 단순한 탐지 모델이 아닌, 통합된 API를 통해 인스턴스 분할, 자세 추정, 방향성 바운딩 박스(OBB) 탐지가 가능한 프레임워크입니다.

YOLOv9: 정보 병목 현상 해결

YOLOv9 데이터가 딥 네트워크를 통과할 때 발생하는 정보 손실 문제를 해결하는 데 YOLOv9 .

  • 프로그래머블 그라디언트 정보(PGI): 심층 레이어에 대한 그라디언트 정보가 보존되도록 보장하는 보조 감독 프레임워크로, 네트워크 가중치 업데이트를 위한 신뢰할 수 있는 그라디언트를 생성합니다.
  • GELAN(일반화된 효율적 레이어 집계 네트워크): 매개변수 효율성과 계산 비용을 최적화하는 새로운 아키텍처입니다. CSPNet과 ELAN의 장점을 결합하여 정보 흐름을 극대화하는 동시에 FLOPs를 최소화합니다.

이론적으로는 진보되었지만, PGI 구현은 훈련 루프에 복잡성을 가중시켜 간소화된 방식에 비해 맞춤화를 더욱 어렵게 만들 수 있다. yolo train Ultralytics 에서 발견된 명령어.

에코시스템 및 사용 편의성

개발자들에게 이 구분이 가장 중요한 지점이 바로 여기입니다.

Ultralytics YOLOv8 거대하고 활발한 생태계의 혜택을 누린다. ultralytics Python 사용하면 설치부터 훈련까지 단 몇 분 만에 진행할 수 있습니다. 이 패키지는 데이터셋 관리를 위한 네이티브 지원을 포함하며, 이를 통해 Ultralytics Platform팀이 데이터 세트를 시각화하고 track 손쉽게 track 수 있도록 지원합니다.

from ultralytics import YOLO

# Load a model (YOLOv8 or the newer YOLO26)
model = YOLO("yolov8n.pt")

# Train on a custom dataset with one line
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for deployment
model.export(format="onnx")

YOLOv9는 강력하지만, 종종 보다 전통적인 연구 저장소 접근 방식을 요구합니다. 사용자는 특정 GitHub 저장소를 복제하고 복잡한 구성 파일을 탐색해야 할 수 있습니다. Ultralytics 통합되어 있기는 하지만, YOLOv8 핵심 개발 경험은 상업적 배포를 위해 더욱 세밀하게 다듬어져 YOLOv8 .

교육 효율성 및 메모리

Ultralytics YOLO 주요 장점은 메모리 효율성입니다. YOLOv8 새로운 YOLO26 는 트랜스포머 기반 아키텍처나 기존 YOLO 비해 훈련 중 CUDA 사용량을 줄이도록 최적화되었습니다.

  • 더 빠른 수렴: Ultralytics 고품질의 사전 훈련된 가중치를 Ultralytics 신속한 전이 학습을 가능하게 하며, 종종 더 적은 에포크 수로도 사용 가능한 결과를 달성합니다.
  • 저사양 훈련: 효율적인 아키텍처로 소비자용 GPU에서도 훈련이 가능해져 학생과 스타트업도 고급 AI를 쉽게 활용할 수 있게 되었습니다.

실제 응용 분야

스마트 시티 교통 관리

YOLOv8 여기서 뛰어난 성능을 발휘하는 이유는 객체 추적 기능으로 두각을 나타냅니다. BoT-SORT나 ByteTrack 같은 추적기와 탐지 기능을 결합하면 도시에서 차량 흐름을 모니터링하고 실시간으로 detect 수 있습니다. YOLOv8n 낮은 지연 시간 YOLOv8n 단일 에지 서버에서 여러 비디오 스트림을 처리할 수 YOLOv8n .

농업용 로봇공학

작물이나 잡초를 감지하는 데 있어 YOLOv8 분할 기능은 매우 YOLOv8 . 그러나 아주 작은 해충이나 질병의 초기 징후를 식별하는 데는 최신 버전의 YOLOv8에 포함된 ProgLoss + STAL 기능이 더 효과적입니다. YOLO26의 ProgLoss + STAL 기능이 의 ProgLoss + STAL 기능이 우수한 소형 물체 인식 성능을 제공하여 현대 농업 기술 분야에서 선호되는 선택입니다.

산업 품질 관리

제조 라인은 극도로 높은 정밀도를 요구합니다. YOLOv9의 GELAN 아키텍처는 우수한 특징 보존성을 제공하여 복잡한 텍스처에서 미세한 결함을 감지하는 데 유리합니다. 반면 고속 조립 라인의 경우, YOLO26의 엔드투엔드 NMS 프리 설계는 검사가 병목 현상이 되지 않도록 보장하며, 기존 방식보다 더 빠르게 물품을 처리합니다.

결론

YOLOv8 YOLOv9 모두 탁월한 YOLOv9 . YOLOv9 이론적 효율성의 한계를 뛰어넘어, 더 적은 매개변수로도 인상적인 정확도를 제공합니다. 학술 연구나 mAP 1% 포인트가 mAP 시나리오에 탁월한 선택입니다.

그러나 대다수의 개발자와 기업에게는 Ultralytics YOLOv8 (그리고 후속 모델인 YOLO26)이 여전히 더 나은 선택입니다. 비교할 수 없는 사용 편의성, 탄탄한 문서화, 다양한 작업 지원은 AI 개발의 마찰을 줄여줍니다. Ultralytics 파이프라인을 통해 다양한 하드웨어에 원활하게 배포할 수 있는 능력은 모델이 벤치마크 테이블뿐만 아니라 현실 세계에서도 가치를 창출하도록 보장합니다.

미래를 받아들일 준비가 된 분들께, 저희는 강력히 권합니다 YOLO26를 살펴보시길 강력히 권합니다. DFL 제거, MuSGD 최적화기, 그리고 네이티브 NMS 아키텍처를 갖춘 이 제품은 2026년을 위한 효율성과 성능의 정점을 보여줍니다.

비교 요약

기능Ultralytics YOLOv89Ultralytics (신규)
집중사용성 및 다용도성매개변수 효율성종단 간 속도 및 정확도
아키텍처앵커 프리, C2fPGI + GELANNMS, MuSGD
태스크탐지, 분할, 자세 추정, OBB, 분류탐지 (주요)모든 작업 지원
사용 편의성⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
NMS아니요 (네이티브 종단 간)

추가 자료


댓글