콘텐츠로 건너뛰기

YOLOv9 YOLOv6.0: 아키텍처 혁신과 성능 분석

실시간 객체 탐지 분야의 지형도는 연구자들이 정확도와 효율성의 한계를 끊임없이 넓혀가며 급속히 변화하고 있습니다. 이러한 진화 과정에서 두 가지 중요한 이정표는 YOLOv9와 2023년 메이투안(美团)이 출시한 견고한 모델 YOLOv6.0입니다. 두 모델 모두 산업적 과제를 해결하고자 하지만, 고성능을 달성하기 위해 근본적으로 다른 아키텍처 접근법을 취하고 있습니다.

건축 철학

이 두 모델의 핵심적인 차이는 신경망 전반에 걸쳐 정보 흐름과 특징 추출을 관리하는 방식에 있습니다.

YOLOv9: 손실된 정보 복구

YOLOv9 딥 러닝의 근본적인 문제인 데이터가 깊은 레이어를 통과할 때 발생하는 정보 손실을 해결합니다. 저자인 Chien-Yao Wang과 Hong-Yuan Mark Liao는 프로그래머블 그라디언트 정보(PGI)를 도입했습니다. PGI는 보조 감독 분기를 제공하여 중요한 의미 정보를 보존함으로써 추론 비용을 추가하지 않고도 모델이 더 강력한 특징을 학습할 수 있도록 합니다.

또한 YOLOv9 GELAN(Generalized Efficient Layer Aggregation Network) 아키텍처를 YOLOv9 . GELAN은 CSPNet과 ELAN의 장점을 결합하여 매개변수 활용도를 최적화함으로써, 이전 세대에 비해 적은 FLOPs로 우수한 정확도를 달성합니다.

9에 대해 자세히 알아보기

YOLOv6.0: 산업용 최적화

미투안 비전 팀이 개발한 YOLOv6.YOLOv6 실용적인 산업 현장에의 적용에 중점을 둡니다. "완전한 재장전(A Full-Scale Reloading)"이라 명명된 이 버전은 앵커 기반 및 앵커 프리 탐지기의 장점을 결합해 훈련 안정성을 높인 앵커 보조 훈련(AAT)을 도입했습니다. 또한 양방향 연결(BiC)을 활용한 개선된 넥(neck) 설계를 통해 특징 융합 성능을 향상시켰습니다.

YOLOv6 RepVGG 스타일의 재매개변수화를 대량으로 활용하는 것으로 잘 YOLOv6 , 이를 통해 복잡한 훈련 구조를 더 단순하고 빠른 추론 블록으로 압축할 수 있습니다.

6에 대해 자세히 알아보기

성능 비교

성능 비교 시, YOLOv9 유사하거나 더 낮은 계산 비용으로 더 높은 평균 정밀도(mAP)를 보여줍니다. GELAN 아키텍처는 YOLOv9 이미지를 높은 효율성으로 처리할 YOLOv9 하여, 높은 정밀도가 요구되는 작업에 탁월한 선택지입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

YOLOv6. YOLOv6 하드웨어 친화적인 백본 설계 덕분에 TensorRT 경쟁력 있는 TensorRT 보여주지만,YOLOv9 매개변수당 더 높은 정확도를 달성합니다. 예를 들어, YOLOv9m은 YOLOv6.YOLOv6 정확도(51.4% 대 50.0%)에서 우위를 보이며, 훨씬 적은 매개변수(2000만 대 3490만)를 사용합니다.

에코시스템 및 사용 편의성

개발자에게 가장 중요한 요소 중 하나는 모델을 둘러싼 생태계입니다. 바로 이 점에서 Ultralytics 라이브러리가 뚜렷한 우위를 제공합니다.

Ultralytics 이점

YOLOv9 Ultralytics 완전히 YOLOv9 , 머신 러닝 운영(MLOps) 라이프사이클 전체를 간소화하는 통합 API를 제공합니다.

  • 간편한 훈련: 사용자 정의 데이터로 YOLOv9 단 몇 줄의 Python 코드로 훈련시킬 수 있습니다.
  • 메모리 효율성: Ultralytics 훈련 중 GPU 사용량을 줄이도록 최적화되어, 다른 저장소에서 흔히 발생하는 메모리 부족(OOM) 오류를 방지합니다.
  • 다용도성: 이 생태계는 다음과 같은 형식으로의 손쉬운 내보내기를 지원합니다 ONNX, OpenVINO, TensorRT.

간소화된 워크플로

Ultralytics 사용하면 독립형 연구 저장소를 구성하는 것에 비해 상당한 엔지니어링 시간을 Ultralytics 있습니다.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on a custom dataset with default augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

반면, YOLOv6 활용하는 경우 YOLOv6 특정 메이투안 저장소를 복제하고, 전용 환경을 구축하며, 구성 파일과 데이터 증강 파이프라인을 수동으로 관리해야 합니다.

실제 응용 분야

이러한 모델들 사이에서 선택하는 것은 종종 배포 환경의 특정 제약 조건에 따라 달라집니다.

고정밀 시나리오 (YOLOv9)

YOLOv9 의미 정보 보존 능력은 사소한 세부 사항이 중요한 까다로운 탐지 작업에 이상적입니다.

  • 의료 영상: 종양 탐지와 같은 작업에서 PGI 아키텍처는 딥 네트워크 계층에서 손실될 수 있는 희미한 특징들을 보존하는 데 도움을 줍니다.
  • 항공 감시: 드론 영상에서 차량이나 사람과 같은 소형 물체를 탐지하기 위해, YOLOv9 향상된 특징 보존 기능이 재현율을 개선합니다.

산업 자동화 (YOLOv6.0)

YOLOv6 하드웨어가 고정되고 처리량이 최우선인 산업용 애플리케이션을 위해 명시적으로 YOLOv6 .

  • 제조 라인: 배터리 제조와 같이 통제된 환경에서 카메라가 컨베이어 벨트 위의 부품을 검사하는 경우, YOLOv6 TensorRT 매우 효과적일 YOLOv6 있습니다.

앞으로 바라보기: YOLO26의 힘

YOLOv9 YOLOv6. YOLOv6 우수한 모델이지만, 해당 분야는 계속 발전해 왔습니다. 최신 YOLO26 는 속도, 정확도, 사용 편의성의 궁극적인 균형을 추구하는 개발자들에게 현재 최첨단 기술을 대표합니다.

YOLO26은 여러 획기적인 기능을 도입합니다:

  • 엔드투엔드 NMS 프리: 비최대 억제(NMS)를 제거함으로써 YOLO26은 배포 파이프라인을 간소화하고 지연 시간 변동성을 줄입니다.
  • MuSGD 최적화기: SGD 과 뮤온의 하이브리드인 이 최적화기는 대규모 언어 모델(LLM) 훈련에서 영감을 받은 안정성 개선을 제공합니다.
  • 향상된 효율성: 분포 초점 손실(DFL) 제거 및 기타 최적화를 통해 YOLO26은 CPU 속도를 최대 43%까지 향상시켜 라즈베리 파이와 같은 에지 디바이스에 완벽하게 적합합니다.
  • 작업 다용도성: 탐지 기능을 넘어, YOLO26은 잔차 로그 가능도 추정법을 활용한 자세 추정분할을 위한 특화된 개선 사항을 제공합니다.

YOLO26에 대해 더 알아보기

결론

둘 다 YOLOv9YOLOv6.0 모두 인상적인 성능을 제공합니다. YOLOv6. YOLOv6 특정 TensorRT 산업 워크플로우에서 여전히 강력한 경쟁자입니다. 그러나 대부분의 연구자와 개발자에게는 YOLOv9 가 우수한 매개변수 효율성과 정확도를 제공합니다. 또한 Ultralytics 일원으로서 장기적인 지원, 사전 훈련된 가중치에 대한 손쉬운 접근, YOLO26과 같은 최신 아키텍처로의 원활한 업그레이드 경로를 보장합니다.

참고문헌

  1. YOLOv9: 왕, C.-Y., & 랴오, H.-Y. M. (2024). "YOLOv9: 프로그래밍 가능한 기울기 정보를 활용한 원하는 학습 내용 학습." arXiv:2402.13616.
  2. YOLOv6 .0: Li, C., 외. (2023). "YOLOv6 .0: A Full-Scale Reloading." arXiv:2301.05586.
  3. Ultralytics :ultralytics

댓글