콘텐츠로 건너뛰기

YOLOv9 YOLOX: 현대 객체 탐지 기술에 대한 심층 분석

컴퓨터 비전 분야는 실시간 객체 탐지 아키텍처의 급속한 진화를 목격해 왔습니다. 본 가이드는 YOLOv9YOLOX 간의 포괄적인 비교를 제공하며, 두 모델의 아키텍처 혁신, 성능 지표 및 훈련 방법론을 분석합니다. 제조업용 AI 스마트 애플리케이션을 구축하든 예측 모델링을 탐구하든, 이러한 모델을 이해하면 향후 배포를 위한 정보에 기반한 의사 결정을 내리는 데 도움이 될 것입니다.

아키텍처 혁신

YOLOv9: 프로그래밍 가능한 그래디언트 정보

YOLOv9 딥 뉴럴 네트워크에 내재된 정보 병목 현상 문제를 해결함으로써 패러다임 전환을 YOLOv9 . 핵심 혁신으로는 프로그래머블 그라디언트 정보(PGI)와 일반화된 효율적 레이어 집계 네트워크(GELAN)가 있다.

  • 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
  • Organization: Institute of Information Science, Academia Sinica, Taiwan
  • 날짜: 2024년 2월 21일
  • Arxiv:2402.13616
  • GitHub:WongKinYiu/yolov9

피드포워드 과정에서 핵심 특징 데이터를 보존함으로써 YOLOv9 역전파 시 가중치 업데이트에 사용되는 기울기가 정확성을 유지하도록 YOLOv9 . 이 아키텍처는 특징 추출에 탁월하여 항공 촬영 이미지나 상세한 의료 스캔과 같은 복잡한 환경에서 작은 물체를 탐지하는 데 매우 뛰어난 성능을 발휘합니다.

9에 대해 자세히 알아보기

YOLOX: 연구와 산업을 잇는 가교 역할

2021년 중반 출시된 YOLOX는 YOLO 앵커 프리 설계로 전환시켰습니다. 분류와 위치 추정 작업을 분리하는 디커플링된 헤드를 도입했으며, SimOTA 레이블 할당 전략을 활용해 훈련 수렴성을 개선했습니다.

YOLOX는 당시로서는 획기적이었으며, 우수한 평균 정밀도(mAP)를 달성하고 앵커 박스 하이퍼파라미터 튜닝을 제거했지만, 그 기반 아키텍처는 이후 매개변수 수와 특징 보존 사이의 균형을 더 잘 맞춘 현대적 네트워크들에 의해 추월당했다.

YOLOX에 대해 자세히 알아보세요

앵커 없는 진화

YOLOX와 최신 Ultralytics 모두 앵커 프리 설계를 채택하여 하이퍼파라미터 튜닝의 복잡성을 줄이고 다양한 데이터셋에 걸친 일반화 성능을 향상시킵니다.

성능 분석

COCO 이들 모델을 비교해 보면 YOLOv9 발전이 뚜렷이 YOLOv9 . YOLOv9 정확도와 FLOPs 사이에서 YOLOv9 더 나은 절충점을 달성합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

YOLOX가 극한의 에지 케이스를 위한 YOLOX-Nano 같은 경량 변형을 제공하는 반면, YOLOv9 순수 정확도 측면에서 유사한 크기의 YOLOX 모델들을 꾸준히 능가합니다. 예를 들어, YOLOv9m은 매개변수가 절반 미만임에도(2000만 vs 5420만) YOLOXl의 49.7%에 mAP 51.4%의 mAP 달성합니다.

Ultralytics 이점

모델 선택은 단순한 아키텍처 이론 이상의 의미를 지닙니다. 모델을 둘러싼 생태계가 개발 속도와 배포 성공을 좌우합니다. Ultralytics YOLOv9 활용하면 비교할 수 없는 사용 편의성과 강력한 커뮤니티 지원을 누릴 수 있습니다.

기존의 오래된 원본 연구 저장소와 달리, Ultralytics 복잡한 파이프라인을 단순화하는 통합된 Python 제공합니다. 훈련에는 다른 많은 대안보다 훨씬 적은 GPU 필요하여 놀라운 훈련 효율성을 제공합니다.

from ultralytics import YOLO

# Initialize the YOLOv9c model
model = YOLO("yolov9c.pt")

# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export the optimized model to TensorRT format
model.export(format="engine")

객체 탐지, 인스턴스 분할, 자세 추정 등 다양한 작업을 내장 지원하므로 전체 코드베이스를 변경하지 않고도 컴퓨터 비전 솔루션을 신속하게 전환할 수 있습니다.

원활한 내보내기

엣지 배포를 고려 중이신가요? Ultralytics 훈련된 모델을 다음과 같은 고도로 최적화된 형식으로 간편하게 내보낼 수 Ultralytics . ONNX, TensorRT, OpenVINO 같은 OpenVINO 단일 명령어로 쉽게 내보낼 수 있습니다.

실제 응용 분야

이러한 모델들의 특화된 강점은 각각의 실제 적용 분야에 맞춤화됩니다:

고속 소매 분석

실시간 제품 인식이 필요한 현대 소매 환경을 위해, YOLOv9 이 탁월한 성능을 발휘합니다. 복잡한 특징 세부사항을 유지하는 능력 덕분에, 복잡한 진열대에서 시각적으로 유사한 제품들을 구분해야 하는 소매 AI 적용 분야에 완벽하게 적합합니다.

레거시 에지 배포

엄격한 하드웨어 제약이 적용되거나 최신 집계 블록 처리에 어려움을 겪는 특수 NPU 환경에서는 YOLOX-Nano가 가끔 유용하게 활용될 수 있습니다. 극도로 자원이 제한된 마이크로컨트롤러의 경우, 순수하고 간소화된 컨볼루션 패턴이 선호되는 경우가 있습니다.

자율 로봇 공학

로봇 내비게이션에서 작은 물체를 놓치는 것은 치명적일 수 있습니다. YOLOv9 내 GELAN 아키텍처는 작고 먼 장애물의 특징이 네트워크의 깊은 계층에서 손실되지 않도록 YOLOv9 , 자동차 애플리케이션의 AI와 같은 중요한 안전 환경에서 기존 모델보다 우수한 성능을 발휘합니다.

사용 사례 및 권장 사항

YOLOv9 YOLOX 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

9 선택해야 할 때

YOLOv9 다음과 같은 경우에 강력한 YOLOv9 :

  • 정보 병목 연구: 프로그래머블 그라디언트 정보(PGI) 및 일반화된 효율적 레이어 집계 네트워크(GELAN) 아키텍처를 연구하는 학술 프로젝트.
  • 경사 흐름 최적화 연구: 훈련 과정에서 심층 신경망 레이어에서 발생하는 정보 손실을 이해하고 완화하는 데 초점을 맞춘 연구.
  • 고정밀도 탐지 벤치마킹: YOLOv9 강력한 COCO 성능이 아키텍처 비교를 위한 기준점으로 필요한 시나리오들.

욜록스를 선택해야 할 때

YOLOX는 다음에 권장됩니다:

  • 앵커 프리 탐지 연구: 새로운 탐지 헤드나 손실 함수를 실험하기 위한 기준으로 YOLOX의 깔끔한 앵커 프리 아키텍처를 활용한 학술 연구.
  • 초경량 에지 디바이스: 마이크로컨트롤러 또는 레거시 모바일 하드웨어에 배포할 때 YOLOX-Nano 변형의 극히 작은 메모리 사용량(0.91M 매개변수)이 핵심적인 요소입니다.
  • SimOTA 라벨 할당 연구: 최적 수송 기반 라벨 할당 전략과 훈련 수렴에 미치는 영향을 조사하는 연구 프로젝트들.

Ultralytics YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

미래: YOLO26의 등장

YOLOv9 인상적인 YOLOv9 , 생산 환경의 요구는 끊임없이 한계를 넓혀가고 YOLOv9 . 새로 출시된 YOLO26 는 현대 비전 AI의 결정적 기준을 제시합니다.

YOLO26은 엔드투엔드 NMS( NMSFree) 설계를 통해 배포 파이프라인을 완전히 혁신합니다. 후처리 단계에서 복잡한 비최대 억제(Non-Maximum Suppression)의 필요성을 제거함으로써, 훨씬 낮은 추론 지연 시간을 제공합니다.

또한 YOLO26은 LLM 훈련에서 차용한 혁신을 적용하여 놀라울 정도로 안정적이고 빠른 수렴을 제공하는 SGD Muon의 하이브리드인 획기적인 MuSGD 최적화기를 통합합니다. 분포 초점 손실(DFL)을 제거함으로써 YOLO26은 이전 버전 대비 최대 43% 빠른 CPU 달성하여 엣지 디바이스 및 기업 배포에 절대적으로 최상의 선택이 됩니다. ProgLoss와 STAL을 통한 소형 객체 인식 성능의 현저한 개선으로 YOLO26은 YOLOX와 YOLOv9 모두 효과적으로 대체합니다.

현대 아키텍처를 탐구하는 엔지니어들에게는 다음도 확인해 보길 권합니다 YOLO11RT-DETR 을 살펴보시길 권합니다. Ultralytics 최신 모델의 탁월한 성능을 활용하여 프로젝트의 미래 대비를 확실히 하십시오.


댓글