콘텐츠로 건너뛰기

YOLOX 대 EfficientDet: 객체 탐지 아키텍처의 기술적 비교

객체 탐지를 위한 최적의 아키텍처 선택은 컴퓨터 비전 시스템의 지연 시간, 정확도 및 확장성에 영향을 미치는 중대한 결정입니다. 본 비교는 메그비(Megvii)의 고성능 앵커 프리 탐지기인 YOLOX와 효율성에 중점을 둔 Google 확장 가능한 아키텍처인 EfficientDet 간의 기술적 차이점을 심층적으로 분석합니다.

두 모델 모두 컴퓨터 비전 분야의 지형을 형성해 왔지만, 현대 애플리케이션은 점점 더 간소화된 배포와 에지 네이티브 성능을 제공하는 솔루션을 요구하고 있습니다. 또한 최신 기술인 YOLO26 가 이러한 유산을 바탕으로 어떻게 우수한 결과를 제공하는지 살펴보겠습니다.

성능 지표 및 벤치마크

다음 표는 COCO 다양한 모델 스케일의 성능을 비교합니다. 주요 지표로는 평균 정밀도(mAP) 와 추론 지연 시간이 포함되며, 이는 속도와 정확도 간의 상충 관계를 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
064034.610.23.923.92.54
164040.513.57.316.66.1
264043.017.710.928.111.0
364047.528.019.5912.024.9
464049.742.833.5520.755.2
564051.572.567.8633.7130.0
664052.692.889.2951.9226.0
764053.7122.0128.0751.9325.0

욜록스: 닻이 없는 진화

YOLOX는 앵커 프리 메커니즘을 채택하고 탐지 헤드를 분리함으로써 YOLO 중대한 변화를 보여줍니다. 이 설계는 훈련 과정을 단순화하고 다양한 데이터셋에서 성능을 향상시킵니다.

저자: 정거, 류송타오, 왕펑, 리제밍, 쑨젠
소속: 메그비
날짜: 2021-07-18
아카이브: https://arxiv.org/abs/2107.08430
깃허브: https://github.com/Megvii-BaseDetection/YOLOX

주요 아키텍처 기능

  • 분리된 헤드: 분류와 위치 추정에 결합된 헤드를 사용했던 기존 YOLO 달리, YOLOX는 이 두 작업을 분리합니다. 이로 인해 수렴 속도가 빨라지고 정확도가 향상됩니다.
  • 앵커 프리 설계: 앵커 박스를 제거함으로써 YOLOX는 수동 앵커 조정의 필요성을 없애고, 다양한 물체 형태에 대해 모델의 견고성을 높입니다.
  • SimOTA 레이블 할당: YOLOX는 지상 진실 객체를 예측 결과에 동적으로 매칭하여 손실 함수를 효과적으로 균형 잡는 고급 레이블 할당 전략인 SimOTA를 도입합니다.

강점과 약점

YOLOX는 속도와 정확도의 균형이 요구되는 시나리오, 특히 기존 앵커 기반 문제(불균형 등)가 문제가 되었던 상황에서 탁월한 성능을 발휘합니다. 그러나 방대한 데이터 증강 파이프라인에 의존하는 특성상 사용자 정의 데이터셋에 대한 훈련 설정이 복잡해질 수 있습니다.

EfficientDet: 확장 가능한 효율성

EfficientDet은 백본, 특징 네트워크, 박스/클래스 예측 네트워크의 해상도, 깊이, 너비를 균일하게 확장하는 복합 확장 방식을 통해 효율성 최적화에 중점을 둡니다.

저자: Mingxing Tan, Ruoming Pang, Quoc V. Le
소속: Google
날짜: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: google

주요 아키텍처 기능

  • EfficientNet 백본: FLOPs 및 매개변수 효율성에 최적화된 EfficientNet을 활용합니다.
  • BiFPN(양방향 피처 피라미드 네트워크): 가중치 기반 피처 융합 레이어로, 쉽고 빠르게 다중 스케일 피처 융합을 가능하게 합니다.
  • 복합 확장: 깊이나 너비를 개별적으로 증가시키는 대신 네트워크의 모든 차원을 동시에 확장하는 독특한 방법.

강점과 약점

EfficientDet은 모바일 앱과 같이 모델 크기(저장 공간)가 주요 제약 조건인 애플리케이션에 매우 효과적입니다. 높은 mAP 달성하지만, BiFPN과 깊이별 분리형 컨볼루션의 복잡성으로 인해 GPU에서의 추론 속도가 종종 YOLO 뒤처집니다. 이러한 컨볼루션은 하드웨어에서 표준 컨볼루션보다 최적화가 덜 이루어지는 경우가 있습니다.

Ultralytics의 강점: YOLO26의 등장

YOLOX와 EfficientDet가 2019-2021년에 중추적인 역할을 했지만, 이 분야는 빠르게 발전해 왔습니다. 2026년 1월 Ultralytics에서 출시한 YOLO26는 2026년 Ultralytics 최신 비전 AI 기술로, 획기적인 혁신을 통해 이전 세대의 한계를 극복했습니다.

YOLO26에 대해 더 알아보기

사용 편의성 및 에코시스템

Ultralytics 선택하는 개발자는 통합된 "초보자부터 전문가까지" 생태계의 Ultralytics . YOLOX나 EfficientDet의 분산된 연구 저장소와 달리, Ultralytics 통해 모델을 원활하게 훈련, 검증 및 배포할 수 있습니다. 이 생태계는 자동 주석 기능 및 ONNX , OpenVINO.

차세대 성능 기능

YOLO26은 현대적 배포에 탁월한 성능을 제공하는 여러 아키텍처적 혁신을 도입합니다:

  1. 엔드투엔드 NMS 설계: YOLO26은 기본적으로 엔드투엔드 방식으로, 비최대 억제(NMS) 후처리 과정이 필요하지 않습니다. 이는 지연 시간 변동성을 줄이고 배포 파이프라인을 단순화하는 개념으로, 최초로 도입된 것은 YOLOv10 에서 처음 제시되고 여기서 완성된 개념입니다.

  2. MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련에서 영감을 받아, MuSGD 최적화기는 SGD 안정성과 뮤온의 모멘텀 특성을 결합합니다. 이를 통해 훈련 중 더 빠른 수렴성과 더 견고한 최종 가중치를 얻을 수 있습니다.

  3. 에지 우선 효율성: 분포 초점 손실(DFL)을 제거함으로써 YOLO26은 출력층 구조를 단순화합니다. 이러한 변경과 아키텍처 최적화가 결합되어 이전 세대에 비해 최대 43% 빠른 CPU 성능을 제공하며, 이는 에지 하드웨어에서 EfficientDet보다 현저히 빠른 속도를 의미합니다.

  4. ProgLoss + STAL: 새로운 손실 함수인 ProgLoss와 STAL은 기존 앵커 프리 모델의 일반적인 약점인 소형 객체 탐지에서 현저한 개선을 제공합니다. 이는 항공 영상 및 로봇 공학 분야의 응용에 매우 중요합니다.

훈련 팁

YOLO26의 MuSGD 최적화기는 더 공격적인 학습률을 허용합니다. 사용자 정의 데이터셋으로 훈련할 때는 성능 극대화를 위해 Ultralytics 튜닝 가이드 활용을 고려하십시오.

다용성과 기억력

YOLOX와 EfficientDet가 주로 탐지기에 초점을 맞춘 반면, YOLO26은 다중 작업의 핵심 엔진입니다. 기본적으로 다음을 지원합니다:

또한 Ultralytics 메모리 효율성을 위해 최적화되어 있습니다. YOLO26 모델 훈련에는 일반적으로 CUDA 기반 대안(예: RT-DETR와 같은 트랜스포머 기반 대안보다 적은 CUDA 메모리를 필요로 하여, 소비자용 GPU에서 더 큰 배치 크기를 허용합니다.

코드 예시: YOLO26 훈련

Ultralytics Python 를 사용하면 YOLO26으로의 전환이 손쉽게 이루어집니다.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26n model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset
# The MuSGD optimizer and ProgLoss are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
# NMS-free output is generated natively
results = model("https://ultralytics.com/images/bus.jpg")

결론

YOLOX는 앵커 프리 연구의 강력한 기준을 제시하고 EfficientDet는 확장 효율성에 대한 연구를 제공하지만, YOLO26은 2026년 이후를 위한 실용적인 선택으로 두각을 나타냅니다. NMS 프리 추론, 우수한 CPU , 그리고 Ultralytics 강력한 지원이 결합된 이 모델은 실시간 추론의 한계를 넘어서려는 개발자들에게 이상적인 후보입니다.

업그레이드를 준비 중인 분들을 위해, 저희 문서에서 YOLO26의 모든 기능을 살펴보거나 다음과 같은 다른 최신 옵션을 인용해 보세요. YOLO11 과 같은 다른 최신 옵션을 인용해 보세요.


댓글