콘텐츠로 건너뛰기

YOLOX와 YOLOv9: 기술 비교

객체 감지에 적합한 아키텍처를 선택하는 것은 컴퓨터 비전 프로젝트의 속도, 정확성 및 배포 가능성에 영향을 미치는 중요한 결정입니다. 이 분석에서는 2021년에 출시된 앵커가 없는 핵심 모델인 YOLOX와YOLOv9와 2024년에 도입된 프로그래밍 가능한 그라데이션 정보(PGI)를 활용하는 최첨단 아키텍처를 비교합니다.

YOLOX가 앵커 없는 탐지로 패러다임을 전환했다면, YOLOv9 딥 네트워크에 정보를 유지하는 새로운 메커니즘을 도입하여 우수한 성능 지표를 제공합니다. 이 가이드에서는 아키텍처, 벤치마크, 이상적인 사용 사례를 세분화하여 필요에 가장 적합한 모델을 선택할 수 있도록 도와드립니다.

욜록스: 닻을 내리지 않는 선구자

YOLOX는 감지 헤드를 단순화하고 사전 정의된 앵커 박스에 대한 의존도를 제거하여 연구 커뮤니티와 산업 애플리케이션 간의 격차를 해소하기 위해 출시되었습니다.

저자 저자: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, Jian Sun
조직:Megvii
날짜: 2021-07-18
아카이브:arXiv:2107.08430
깃허브:Megvii-BaseDetection/YOLOX
문서:YOLOX 문서

아키텍처 하이라이트

욜록스는 분류와 회귀 작업을 분리하는 디커플링 헤드 아키텍처를 도입했습니다. 이러한 분리를 통해 모델이 더 빠르게 수렴하고 더 나은 정확도를 달성할 수 있습니다. 또한 최적의 앵커 박스 크기를 결정하기 위해 클러스터링 분석이 필요 없는 앵커 프리 메커니즘을 채택하여 다양한 물체 모양에 대해 모델을 더욱 강력하게 만들었습니다. 또한 YOLOX는 라벨 할당을 위해 SimOTA를 활용하여 프로세스를 최적의 전송 문제로 처리하여 훈련 안정성을 향상시킵니다.

강점과 약점

  • 장점: 앵커가 없는 설계로 하이퍼파라미터 튜닝 프로세스가 간소화됩니다. 디커플링 헤드는 일반적으로 같은 시대의 커플링 헤드에 비해 로컬라이제이션 작업에서 더 높은 정밀도를 제공합니다.
  • 약점: 2021년 모델로서 최신 아키텍처에서 볼 수 있는 최신 최적화 기능이 부족합니다. 고급 데이터 증강 및 레이어 집계 기술을 사용하는 모델에 비해 최고 성능에 도달하려면 더 많은 학습 데이터가 필요할 수 있습니다.

YOLOv9: 프로그래밍 가능한 그라데이션 정보

YOLOv9 심층 신경망에 내재된 '정보 병목 현상' 문제를 해결하는 중요한 도약을 의미합니다.

저자들: 저자: 왕치엔야오, 홍위안 마크 리아오
조직:중국학술원 정보과학연구소
날짜: 2024-02-21
아카이브:arXiv:2402.13616
깃허브:왕킨유/yolov9
문서:Ultralytics YOLOv9 문서

아키텍처 하이라이트

YOLOv9 프로그래밍 가능한 그라디언트 정보(PGI)일반화된 효율적인 레이어 집계 네트워크(GELAN)를 도입했습니다. PGI는 데이터가 딥 레이어를 통과할 때 중요한 입력 정보가 손실되는 것을 방지하여 모델 업데이트를 위한 안정적인 그라데이션 생성을 보장합니다. GELAN은 매개변수 활용을 최적화하여 모델이 가벼우면서도 정확할 수 있도록 합니다. 이러한 혁신 덕분에 YOLOv9 효율성과 평균 정밀도(mAP) 모두에서 이전 모델보다 훨씬 뛰어난 성능을 발휘할 수 있습니다.

강점과 약점

  • 강점: 파라미터 대비 정확도가 뛰어나 실시간 애플리케이션에 매우 효율적입니다. 이 아키텍처는 이전 반복보다 정보 흐름을 더 잘 보존하여 작은 물체를 더 잘 감지할 수 있습니다.
  • 약점: 최신 아키텍처이기 때문에 기존 모델에 비해 업데이트된 CUDA 드라이버와 하드웨어 지원이 필요할 수 있습니다.

YOLOv9 대해 자세히 알아보기

성능 비교

다음 표는 COCO 데이터 세트에서 YOLOX와 YOLOv9 성능을 비교한 것입니다. YOLOv9 더 적은 수의 매개변수로 더 높은 mAP 점수를 지속적으로 보여줌으로써 GELAN 아키텍처의 효율성을 강조합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

분석: YOLOv9 성능 밀도가 크게 업그레이드되었습니다. 예를 들어, YOLOv9c는 25.3M개의 파라미터만으로 53.0%의 mAP 달성하는 반면, YOLOX-L은 49.7%라는 낮은 점수를 달성하기 위해 54.2M개의 파라미터가 필요합니다. 이는 이 정확도 계층에 대한 파라미터 사용량 측면에서 YOLOv9 약 2배 더 효율적이라는 것을 의미합니다.

효율성의 중요성

엣지 디바이스에 배포할 때 FLOP과 파라미터를 살펴보는 것은 mAP 중요합니다. YOLOv9 GELAN 아키텍처는 컴퓨팅 오버헤드를 크게 줄여 모바일 배포에서 디바이스 작동을 더 시원하게 하고 배터리 수명을 연장합니다.

Ultralytics 이점

YOLOX는 강력한 독립형 리포지토리이지만, Ultralytics 에코시스템 내에서 YOLOv9 활용하면 개발자와 연구자에게 뚜렷한 이점을 제공합니다.

사용 편의성 및 통합

Ultralytics 프레임워크는 모델 상호 작용을 통합합니다. 간단하고 직관적인 Python API를 사용하여 YOLOv9 훈련, 검증 및 배포할 수 있습니다. 이는 환경 변수와 데이터 세트 경로를 수동으로 구성해야 하는 YOLOX 코드베이스와는 대조적입니다.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Train the model on a custom dataset with a single line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

잘 관리된 에코시스템

Ultralytics 모델은 지속적인 업데이트, 버그 수정 및 커뮤니티 지원의 이점을 누릴 수 있습니다. 팀에서 복잡한 내보내기 스크립트를 작성하지 않고도 데이터 세트를 관리하고, 실험을 track , 다양한 형식ONNX, TensorRT, CoreML)으로 모델을 배포할 수 있는 원활한 MLOps를 위해 Ultralytics HUB와의 통합이 가능합니다.

성능 균형 및 메모리 효율성

Ultralytics YOLO 모델은 속도와 정확도 사이의 실질적인 균형을 위해 설계되었습니다. 또한, 일반적으로 구형 아키텍처나 무거운 트랜스포머 기반 모델에 비해 훈련 중 메모리 요구량이 더 낮습니다. 이러한 효율성 덕분에 클라우드 컴퓨팅 비용이 절감되고 소비자용 GPU에서도 트레이닝을 이용할 수 있습니다.

다용도성

YOLOX는 주로 오브젝트 감지기이지만, Ultralytics 프레임워크는 지원되는 모델의 기능을 확장합니다. 사용자는 유사한 구문과 워크플로우를 사용해 인스턴스 세분화, 포즈 추정, 방향성 경계 상자(OBB) 감지와 같은 작업 간에 쉽게 전환할 수 있으며, 독립형 리서치 저장소에는 종종 부족한 다용도성을 제공합니다.

이상적인 사용 사례

YOLOv9 선택해야 할 때

  • 자율주행 시스템: YOLOv9 높은 정확도는 원거리의 작은 장애물을 감지하는 것이 안전에 중요한 자율 주행 차량에 이상적입니다.
  • 실시간 분석: 리테일 또는 트래픽 관리의 경우, YOLOv9c는 높은 프레임 속도와 정밀한 감지라는 장점을 제공합니다.
  • 엣지 AI: GELAN의 아키텍처 효율성으로 인해 YOLOv9t 및 YOLOv9s는 NVIDIA Jetson 또는 Raspberry Pi와 같은 장치에 배포하기에 완벽합니다.

욜록스를 선택해야 할 때

  • 레거시 통합: 기존 프로덕션 파이프라인이 이미 특정 YOLOX 앵커 프리 헤드 포맷을 중심으로 크게 설계된 경우.
  • 학술 연구: 초기 앵커 프리 디텍터에서 분리된 헤드의 동작을 구체적으로 조사하는 연구자들은 YOLOX가 비교에 유용한 기준이 될 수 있습니다.

결론

두 아키텍처 모두 컴퓨터 비전 역사에서 그 자리를 차지했습니다. 욜록스는 2021년에 앵커 기반의 현상 유지에 성공적으로 도전했습니다. 하지만 YOLOv9 은 그라디언트 흐름 최적화 및 레이어 집계 분야에서 수년간의 발전을 통합한 최신 표준입니다.

대부분의 신규 개발에는 YOLOv9 권장합니다. 파라미터당 뛰어난 성능과 함께 사용 편의성, 교육 효율성, 강력한 배포 옵션이 결합되어 있어 개념에서 생산까지 더 빠른 경로를 보장합니다.

다음과 같은 에코시스템의 다른 최신 옵션을 살펴보세요. YOLO11YOLOv8와 같은 다른 최신 옵션을 살펴보고 특정 애플리케이션 제약 조건에 가장 적합한 옵션을 찾아보세요.


댓글