콘텐츠로 건너뛰기

YOLOv9 YOLOv8: 아키텍처, 성능 및 응용 분야

객체 탐지 모델의 진화는 계속해서 가속화되며, 개발자들에게 컴퓨터 비전 작업을 위한 점점 더 정교한 도구를 제공하고 있습니다. 이 분야에서 가장 중요한 두 가지 기여는 YOLOv9(아카데미아 시니카 연구진 개발)과 YOLOv8 입니다. Ultralytics가 개발한 모델입니다. 두 모델 모두 최신 기술을 발전시켰지만, 서로 다른 아키텍처 전략을 채택하고 서로 다른 배포 요구 사항을 충족시킵니다.

이 가이드는 YOLOv8 심층적인 기술적 비교를 제공하며, 두 모델의 아키텍처, 성능 지표 및 훈련 방법론을 분석하여 여러분의 애플리케이션에 적합한 도구를 선택하는 데 도움을 드립니다.

모델 개요

기술적 사양을 살펴보기 전에, 이 두 강력한 아키텍처의 기원과 주요 설계 철학을 이해하는 것이 필수적입니다.

YOLOv9: 프로그래밍 가능한 그래디언트 정보

2024년 2월 중앙연구원 정보과학연구소의 왕젠야오(王建耀)와 리아오홍위안(廖宏源)이 발표한 YOLOv9 딥러닝 네트워크의 정보 손실 문제를 해결하는 데 YOLOv9 . 저자들은 두 가지 핵심 혁신 기술인 프로그래머블 그라디언트 정보(PGI)일반화된 효율적 레이어 집계 네트워크(GELAN)를 소개한다.

  • PGI: 데이터가 깊은 레이어를 통과할 때 손실되는 '정보 병목 현상' 문제를 해결합니다. 보조 감독을 제공하여 주 분기가 핵심 특징 정보를 유지하도록 보장합니다.
  • GELAN: 경량 아키텍처로, CSPNet과 ELAN의 장점을 결합하여 매개변수 효율성을 최적화하고 기울기 경로 계획을 극대화합니다.

9에 대해 자세히 알아보기

YOLOv8: 사용성과 속도의 표준

2023년 Ultralytics 출시된 YOLOv8 실시간 객체 탐지의 업계 표준으로 YOLOv8 자리매김했습니다. 이 모델은 앵커 프리 탐지 헤드와 속도와 정확도를 위해 설계된 새로운 백본을 도입했습니다. 단순한 성능 지표를 넘어, YOLOv8 탐지, 분할, 분류, 자세 추정 작업을 위한 통합 프레임워크를 제공함으로써 개발자 경험을 YOLOv8 .

  • 앵커 프리 설계: 박스 예측 개수를 줄여 비최대 억제(NMS) 속도를 높입니다.
  • 모자이크 증강: 다양한 배경에 대한 강건성을 향상시키는 고급 훈련 루틴.
  • 생태계 통합: 배포, 내보내기 및 추적 도구를 원활하게 통합합니다.

8에 대해 자세히 알아보기

성능 비교

생산용 모델을 선택할 때 추론 속도와 탐지 정확도(mAP) 간의 균형은 가장 중요한 요소입니다. 아래 표는 객체 탐지의 표준 벤치마크인 COCO 성능을 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

주요 내용

  • 정확도: YOLOv9 유사한 모델 규모에서 더 높은 mAP 달성합니다. GELAN 아키텍처는 복잡한 특징을 효과적으로 포착하여, 정확도의 1% 포인트가 중요한 학술 연구에 적합한 강력한 후보입니다.
  • 속도: YOLOv8 특히 GPU (TensorRT)에서 우수한 추론 속도를 YOLOv8 . 최적화된 C2f 모듈과 앵커 프리 헤드는 더 빠른 처리를 가능하게 하며, 이는 비디오 스트림에서 실시간 추론에 매우 중요합니다.
  • 효율성: 일부 구성에서 YOLOv9 매개변수 YOLOv9 , Ultralytics 일반적으로 훈련 중 더 낮은 메모리 사용량을 보입니다. 이러한 효율성 덕분에 개발자는 더 복잡한 연구용 아키텍처에 비해 적은 CUDA 가진 소비자용 YOLOv8 훈련시킬 수 있습니다.

교육 및 사용 편의성

사용자 경험은 종종 프로젝트가 개념에서 배포로 얼마나 빠르게 진행되는지를 좌우합니다. 여기서 생태계 지원의 차이가 뚜렷이 드러납니다.

Ultralytics 이점

Ultralytics ( YOLOv8 최신 YOLO26 포함)은 통합된 Python 기반으로 구축됩니다. 이를 통해 일관된 API가 보장되어 개발자가 단 한 줄의 코드로 모델 버전이나 작업을 전환할 수 있습니다.

Ultralytics 특징은 다음과 같습니다:

  • 자동화된 MLOps: 통합 지원 CometMLflow 통합 지원으로 실험 추적 가능.
  • 간편한 내보내기: 원클릭으로 다음과 같은 형식으로 내보내기 ONNX, OpenVINO, CoreML 등의 형식으로 원클릭 내보내기를 CoreML 모바일 및 엣지 CoreML 배포할 수 있습니다.
  • 포괄적인 문서: 하이퍼파라미터 튜닝 부터 데이터 증강까지 모든 것을 다루는 방대한 가이드 라이브러리.
from ultralytics import YOLO

# Load a model (YOLOv8 or YOLOv9)
model = YOLO("yolov8n.pt")  # Switch to 'yolov9c.pt' instantly

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export for deployment
model.export(format="onnx")

YOLOv9

편의를 위해 Ultralytics 내에서 YOLOv9 , 원래 구현은 별도의 스크립트와 구성 파일에 의존합니다. 기존 코드베이스에서 마이그레이션하는 사용자는 Ultralytics 복잡한 폴더 구조 관리나 수동으로 가중치를 다운로드할 필요 없이 워크플로를 크게 간소화한다는 점을 발견할 수 있습니다.

간소화된 워크플로

YOLOv9 를 YOLOv9 ultralytics 패키지는 모든 생태계 혜택에 대한 접근 권한을 부여하며, 여기에는 다음이 포함됩니다: 허브 통합 및 Explorer 독립형 저장소에서는 사용할 수 없는 API입니다.

실제 사용 사례

적합한 모델 선택은 애플리케이션의 구체적인 제약 조건에 크게 좌우됩니다.

YOLOv9의 이상적인 시나리오

  • 의료 영상: 뇌종양 탐지나 X선 분석과 같은 작업에서 프로그래머블 그라디언트 정보(PGI)는 그렇지 않으면 손실될 수 있는 중요한 텍스처 세부 정보를 보존하여 높은 진단 정확도를 보장합니다.
  • 소형 물체 탐지: GELAN 아키텍처는 특징 보존에 탁월하여, YOLOv9 고해상도 항공 이미지나 드론 영상에서 소형 물체를 탐지하는 데 YOLOv9 .
  • 학술적 벤치마킹: 최첨단 연구 결과를 발표하려는 연구자들은 더 큰 YOLOv9 모델이 제공하는 높은 mAP 혜택을 볼 수 있습니다.

YOLOv8 이상적인 시나리오

  • 소매 분석: 매장 내 자동 결제 시스템이나 히트맵 분석과 같은 애플리케이션에서 YOLOv8 고가의 하드웨어 없이도 여러 카메라 영상을 동시에 처리할 수 있는 충분한 속도를 YOLOv8 .
  • 임베디드 시스템: 모델의 호환성 TFLite 및 Edge TPU 라즈베리 파이(Raspberry Pi)나 NVIDIA )과 같은 장치에서 실행하기에 완벽합니다.
  • 로봇공학: 지연 시간이 탐색 및 장애물 회피에 결정적인 역동적인 환경에서, YOLOv8 빠른 추론은 로봇이 실시간으로 반응할 수 있도록 YOLOv8 .

미래: YOLO26

YOLOv9 YOLOv8 훌륭한 YOLOv8 불구하고, 해당 분야는 계속해서 발전해 왔습니다. 최첨단을 추구하는 개발자들은 YOLO26을 고려해 볼 필요가 있습니다. 2026년 1월에 출시된 이 모델은 효율성과 성능 면에서 상당한 도약을 이루었습니다.

YOLO26은 다음과 같은 획기적인 기능을 도입합니다:

  • 엔드투엔드 NMS: 비최대 억제(NMS)를 제거함으로써 YOLOv2는 배포를 단순화하고 지연 시간을 크게 줄입니다. 이는 YOLOv10.
  • MuSGD 최적화기: SGD 뮤온을 결합한 하이브리드 최적화기로, 대규모 언어 모델(LLM)에서 확인된 훈련 안정성 향상을 컴퓨터 비전 분야에 적용합니다.
  • 향상된 다용도성: 방향성 바운딩 박스(OBB)자세 추정을 위한 특화된 개선 사항으로 복잡한 비전 작업에 가장 다용도로 활용 가능한 도구입니다.
  • 에지 최적화: 이전 세대 대비 최대 43% 빠른 CPU 성능으로, 에지 컴퓨팅 및 모바일 애플리케이션을 위해 특별히 설계되었습니다.

새로운 프로젝트의 경우, AI 효율성 분야의 최신 발전을 활용하고 있는지 확인하기 위해 YOLOv8 YOLOv9 함께 YOLO26을 평가하는 YOLOv9 매우 YOLOv9 .

YOLO26에 대해 더 알아보기

결론

YOLOv9 YOLOv8 모두 뚜렷한 장점을 YOLOv8 . YOLOv9 고급 기울기 정보 관리를 통해 정확도를 극대화하는 강력한 아키텍처를 YOLOv9 반면, YOLOv8 속도, 사용 편의성, 생태계 지원 측면에서 타의 추종을 불허하는 균형을 YOLOv8 .

개발자들이 방대한 문서와 커뮤니티 지원을 바탕으로 원활한 경험을 추구한다면, Ultralytics ( YOLOv8 신규 YOLO26 포함)은 여전히 최고의 선택입니다. 단일 프레임워크 내에서 탐지, 분할, 분류 간 손쉬운 전환이 가능해 팀이 복잡한 AI 솔루션을 더 빠르고 안정적으로 구축할 수 있습니다.

컴퓨터 비전 모델을 주석 처리하고, 훈련시키고, 배포하는 가장 간단한 방법인 Ultralytics 통해 모든 모델을 살펴보고 오늘 바로 훈련을 시작하세요.


댓글