YOLOX 대 YOLOv9: 앵커 프리 설계와 프로그래머블 그라디언트 비교
컴퓨터 비전 분야는 계산 효율성과 높은 정밀도를 조화시키는 지속적인 아키텍처 혁신을 통해 발전해왔다. 실시간 객체 탐지 모델을 평가할 때, 메그비(Megvii)의 YOLOX와 중앙연구원(Academia Sinica)의 YOLOv9 비교하면 딥러닝 개발에 있어 두 가지 상이한 철학이 YOLOv9 . 하나는 간소화된 앵커 프리(anchor-free) 패러다임을 개척한 반면, 다른 하나는 정보 보존을 극대화하기 위해 고급 기울기 라우팅 기법을 도입했다.
이 기술 가이드는 아키텍처의 미묘한 차이, 성능 벤치마크, 이상적인 사용 사례를 탐구하는 동시에, Ultralytics 및 새로 출시된 YOLO26 모델과 같은 현대적 솔루션이 생산 환경에 즉시 적용 가능한 배포를 위한 우수한 대안을 제공하는 방식을 보여줍니다.
YOLOX: 앵커 프리 패러다임의 개척자
2021년 중반 출시된 YOLOX는 학술 연구와 산업적 적용 간의 격차를 해소하는 데 있어 중대한 진전을 이루었습니다. 사전 정의된 앵커 박스의 필요성을 제거함으로써, 맞춤형 데이터셋에 필요한 휴리스틱 튜닝을 획기적으로 단순화했습니다.
- 작성자: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, Jian Sun
- 조직조직: Megvii
- 출시일: 2021년 7월 18일
- 참고문헌:아카이브 논문
- 소스 코드:YOLOX GitHub 저장소
- 문서:YOLOX 공식 문서
아키텍처 혁신
YOLOX는 표준 탐지 파이프라인에 몇 가지 핵심 변경 사항을 도입했습니다. 분류 작업과 회귀 작업을 분리하는 디커플링된 헤드를 구현하여 객체 식별과 경계 위치 파악 간의 충돌을 크게 줄였습니다. 또한 YOLOX는 훈련 중 양성 샘플을 동적으로 할당하는 고급 레이블 할당 전략인 SimOTA를 채택하여 표준 벤치마크 데이터셋에서 더 빠른 수렴과 전반적인 성능 향상을 이끌어냈습니다.
장점과 한계
YOLOX의 주요 강점은 단순화된 설계에 있습니다. 앵커 프리 메커니즘 덕분에 개발자는 특정 데이터에 최적화된 앵커 크기를 찾기 위해 클러스터링 알고리즘을 실행하는 데 드는 시간을 줄일 수 있습니다. 그러나 셀프 어텐션이나 그라디언트 패스 같은 최신 기술 발전 없이 기본적으로 구축된 오래된 아키텍처인 만큼, 최신 네트워크의 매개변수 효율성을 따라잡기 어렵습니다. 또한 인스턴스 분할이나 자세 추정 같은 고급 작업을 통합된 API 내에서 기본적으로 지원하지 않습니다.
YOLOv9: 기울기 정보 극대화
2024년으로 빠르게 넘어가면, YOLOv9 심층 컨볼루션 신경망에 내재된 정보 병목 현상 문제를 해결하기 위한 매우 이론적인 접근법을 YOLOv9 .
- 저자: Chien-Yao Wang 및 Hong-Yuan Mark Liao
- 조직:정보 과학 연구소, 아카데미아 시니카
- 출시일: 2024년 2월 21일
- 참고문헌:아카이브 논문
- 소스 코드:YOLOv9 저장소
- 문서:Ultralytics YOLOv9
아키텍처 혁신
YOLOv9 핵심 특징은 프로그래머블 그라디언트 정보(PGI)로, 이는 중요한 의미론적 데이터가 네트워크의 여러 계층을 통과하는 과정에서 손실되지 않도록 보장합니다. 일반화된 효율적 계층 집계 네트워크(GELAN)와 결합된 YOLOv9 탁월한 매개변수 대 정확도 비율을 YOLOv9 . 이를 통해 모델은 가중치 업데이트를 위한 정확한 그라디언트를 유지할 수 있어, 경량화된 변형에서도 매우 효과적입니다.
장점과 한계
YOLOv9 모델 정확도의 이론적 한계를 뛰어넘는 데 YOLOv9 . COCO 데이터셋에서 놀라운 mAP 기록하여 연구자들의 선호 모델로 자리매김했습니다. 그러나 효율성에도 불구하고, YOLOv9 후처리 단계에서 전통적인 비최대 억제(NMS)에 의존합니다. 이로 인해 추론 과정에서 지연 시간 급증이 발생합니다. 에지 디바이스에 AI를 배포하는 데 주력하는 엔지니어들에게 NMS 관리는 배포 파이프라인에 불필요한 복잡성을 가중시킵니다.
후처리 병목 현상
YOLOX 및 YOLOv9 같은 기존 모델은 중복 경계 상자를 걸러내기 위해 비최대 억제(NMS) YOLOv9 . 이 단계는 본질적으로 순차적이며 CPU에서 병목 현상을 자주 유발하여, 최신 Ultralytics 발견되는 네이티브 종단 간 아키텍처의 필요성을 부각시킵니다.
성능 비교
이러한 아키텍처의 순수 계산 성능 지표를 비교해 보면, YOLOv9 보다 현대적인 기준 모델을 YOLOv9 반면 YOLOX는 기존 환경에 적합한 경량 옵션으로 남아 있음을 알 수 있습니다. 아래는 두 모델의 표준 버전에 대한 상세한 분석입니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv9 유사한 매개변수 수에서 우수한 정확도를 YOLOv9 , 속도, 정확도, 사용 편의성의 궁극적인 균형을 추구하는 개발자들은 Ultralytics 최신 발전을 고려해야 합니다.
Ultralytics : YOLO26을 만나보세요
YOLOX 및 YOLOv9 같은 기존 모델을 평가하는 YOLOv9 유용한 맥락을 YOLOv9 , 현재 최첨단 기술은 Ultralytics 의해 정의됩니다. 2026년 초에 출시된 YOLO26은 현대 기업 환경을 위해 탐지 파이프라인을 근본적으로 재설계했습니다.
타의 추종을 불허하는 건축적 혁신
YOLO26은 선행 모델들의 후처리 병목 현상을 완전히 해결하는 네이티브 엔드투엔드 NMS 설계로 모든 하드웨어에 걸쳐 더 간편한 배포를 보장합니다. 또한 분포 초점 손실(DFL)을 제거하고 확률적 경사 하강법과 뮤온의 하이브리드인 새로운 MuSGD 최적화기를통합함으로써 YOLO26은 전례 없는 훈련 안정성을 달성합니다.
라즈베리 파이와 같은 제한된 환경에 배포하는 개발자를 위해 YOLO26은 최대 43% 빠른 CPU 제공합니다. 또한 ProgLoss + STAL 손실 함수를 도입하여 항공 이미지와 드론 분석에 중요한 소형 물체 인식 성능을 획기적으로 개선했습니다.
간소화된 개발 생태계
독립형 연구 저장소와 달리 Ultralytics 비교할 수 없는 개발자 경험을 제공합니다. Ultralytics Python 활용하면 엔지니어들은 반복적인 코드 작업을 획기적으로 줄일 수 있습니다. 또한 메모리 요구 사항이 극도로 최적화되어 있어, 주의 기반 아키텍처에 비해 적은 GPU 강력한 모델을 훈련할 수 있습니다.
from ultralytics import YOLO
# Load the highly optimized, NMS-free YOLO26 small model
model = YOLO("yolo26s.pt")
# Train on a custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Easily export to optimized deployment formats
model.export(format="engine", half=True) # Exports to TensorRT
탐지 기능을 넘어, YOLO26은 동일한 프레임워크 내에서 다양한 작업을 원활하게 지원합니다. 위성 이미징을 위한 정밀한 방향성 경계 상자(OBB) 가 필요하든, 의료 영상 애플리케이션을 위한 세밀한 픽셀 마스크가 필요하든, 워크플로는 동일하게 유지됩니다. 이전 세대 워크플로에 투자한 팀의 경우, Ultralytics YOLO11 도 이용 가능하며 완벽하게 지원됩니다.
이상적인 사용 사례 및 배포 전략
적합한 아키텍처 선택은 전적으로 대상 배포 환경과 프로젝트 요구사항에 달려 있습니다.
엣지 컴퓨팅과 로봇공학
저전력 장치의 경우, 복잡한 후처리가 필요한 모델에 의존하면 성능이 크게 저하될 수 있습니다. YOLOX-Nano는 매우 소형이지만, 안전이 중요한 작업에는 정확도가 종종 부족합니다. YOLO26이 확실한 선택입니다. DFL(Deep Fine-Tuning)과 NMS Normalized Mean NMS 가 필요 NMS 순수 CPU 원활하게 NMS , 자율 로봇이나 스마트 주차 관리에 이상적입니다.
학술적 벤치마킹
만약 유일한 목표가 경사 흐름 분석과 심층 신경망 병목 현상 연구라면, YOLOv9 탁월한 연구 대상이다. 이 모델의 PGI 프레임워크는 심층 신경망 계층 간 특징 보존 방식을 흥미롭게 보여줌으로써, 컨볼루션 이론을 탐구하는 대학 연구자들에게 가치 있는 도구가 된다.
기업용 비디오 분석
보안 경보 시스템이나 교통 모니터링과 같은 대규모 영상 처리 작업에서는 속도와 다양한 내보내기 기능이 가장 중요합니다. Ultralytics 제공하는 기본 내보내기 도구를 통해 팀은 YOLO26을 직접 TensorRT 또는 OpenVINO 로 단일 명령어로 컴파일할 수 있어 시장 출시 시간을 획기적으로 단축합니다.
Ultralytics 생태계의 포괄적인 기능을 활용함으로써 머신러닝 팀은 원시 연구 코드베이스의 복잡성을 우회하고 확장 가능한 실제 AI 애플리케이션 구축에 직접 집중할 수 있습니다.