콘텐츠로 건너뛰기

EfficientDet과 YOLOX: 종합적인 기술 비교

올바른 객체 감지 아키텍처를 선택하는 것은 컴퓨터 비전 개발에서 중요한 결정입니다. 이러한 환경을 형성한 대표적인 두 가지 모델은 최적의 확장성을 위해 Google 개발한 EfficientDet과 Megvii의 고성능 앵커 프리 디텍터인 YOLOX입니다. EfficientDet은 복합 스케일링을 사용하여 엄격한 계산 예산 내에서 정확도를 극대화하는 데 중점을 두는 반면, YOLOX는 추론 속도와 간소화된 훈련 파이프라인에 우선순위를 둡니다.

이 가이드에서는 아키텍처, 성능 지표, 이상적인 배포 시나리오에 대한 자세한 분석을 제공하여 프로젝트에 가장 적합한 것을 선택하는 데 도움을 줍니다. 또한 다음과 같은 최신 대안이 어떻게 도움이 되는지 살펴봅니다. Ultralytics YOLO11 과 같은 최신 대안이 이러한 이전 버전의 강점을 사용자 친화적인 통합 프레임워크에 어떻게 통합하는지 살펴봅니다.

EfficientDet: 확장 가능한 효율성

물체 감지 모델을 효율적으로 확장하는 문제를 해결하기 위해 EfficientDet이 도입되었습니다. 임의로 크기를 조정하던 이전 아키텍처와 달리, EfficientDet은 해상도, 깊이, 폭을 균일하게 조정하는 원칙적인 복합 스케일링 방식을 채택하고 있습니다.

아키텍처 및 주요 기능

EfficientDet의 핵심 혁신은 양방향 특징 피라미드 네트워크(BiFPN)에 있습니다. 기존의 FPN은 서로 다른 스케일의 특징을 구분 없이 합산하지만, BiFPN은 학습 가능한 가중치를 도입하여 융합 과정에서 가장 중요한 특징을 강조합니다. 이를 EfficientNet 백본과 결합하면 훨씬 적은 수의 파라미터와 FLOP(초당 부동 소수점 연산)으로 최첨단 정확도를 달성할 수 있습니다.

  • 복합 스케일링: 간단한 복합 계수를 사용하여 네트워크 너비, 깊이, 이미지 해상도를 동시에 조정합니다.
  • BiFPN: 쉽고 빠른 멀티스케일 기능 융합을 지원합니다.
  • 효율성: 리소스 사용량을 최소화하는 동시에 mAP (평균 평균 정밀도)를 극대화하도록 최적화되었습니다.

모델 메타데이터

EfficientDet에 대해 자세히 알아보세요.

욜록스: 닻이 없는 진화

YOLO 시리즈는 앵커가 없는 디자인으로의 전환을 의미합니다. 사전 정의된 앵커 박스가 필요 없는 YOLOX는 훈련 프로세스를 간소화하고 다양한 데이터 세트에서 일반화를 개선합니다.

아키텍처 및 주요 기능

YOLOX는 탐지 헤드를 분리하여 분류와 회귀 작업을 서로 다른 분기로 분리합니다. 이러한 "분리형 헤드" 설계는 일반적으로 더 빠른 수렴과 더 나은 성능으로 이어집니다. 또한, 양성 샘플을 동적으로 할당하는 고급 라벨 할당 전략인 SimOTA를 통합하여 학습 시간을 단축하고 정확도를 향상시킵니다.

  • 앵커 프리: 수동 앵커 박스 튜닝이 필요 없으므로 설계 복잡성이 줄어듭니다.
  • 분리된 헤드: 분류 작업과 로컬라이제이션 작업을 분리하여 성능을 개선합니다.
  • 고급 증강: 강력한 훈련을 위해 모자이크 및 MixUp 증강 기능을 활용합니다.

모델 메타데이터

YOLOX에 대해 자세히 알아보세요

성능 및 벤치마크 비교

이 두 모델 간의 장단점은 뚜렷합니다. EfficientDet은 파라미터 효율성을 위해 설계되었기 때문에 모델 크기(스토리지)가 주요 제약 조건인 CPU 애플리케이션이나 시나리오에서 강력한 경쟁자입니다. 반대로 YOLOX는 GPU 지연 시간에 최적화되어 하드웨어 친화적인 연산을 활용하여 NVIDIA T4 또는 V100과 같은 장치에서 빠른 추론 속도를 제공합니다.

아래 표는 COCO 데이터 세트에서 이러한 차이점을 강조하고 있습니다. 비슷한 정확도를 가진 EfficientDet 변형에 비해 YOLOX 모델이 일반적으로 GPU 하드웨어에서 더 빠른 추론 속도를 제공하는 것을 확인할 수 있습니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

주요 내용

  • 지연 시간 대 처리량: YOLOX-s는 더 많은 파라미터를 사용했음에도 불구하고 T4 TensorRT 2.56ms라는 놀라운 속도를 달성하여 EfficientDet-d0(3.92ms)보다 훨씬 빠릅니다. 이는 GPU에서 실시간 추론에 대한 YOLOX의 뛰어난 최적화를 보여줍니다.
  • 모델 크기: EfficientDet-d0은 390만 개의 컴팩트한 파라미터 수를 자랑하며 스토리지가 극도로 제한된 엣지 디바이스에서도 높은 경쟁력을 유지합니다.
  • 스케일링: EfficientDet-d7은 53.7의 높은 mAP 도달하지만 지연 시간(128ms)이 높기 때문에 더 가벼운 모델에 비해 라이브 비디오 스트림에 적합하지 않습니다.

Ultralytics 이점

EfficientDet과 YOLOX가 중요한 기술을 개척하는 동안 컴퓨터 비전 분야는 빠르게 발전하고 있습니다. Ultralytics YOLO11 은 이전 세대에서 얻은 최고의 아키텍처 교훈을 통합된 고성능 패키지로 통합한 최첨단 제품입니다.

개발자와 연구자에게 Ultralytics 레거시 모델에 비해 강력한 이점을 제공합니다:

  • 사용 편의성: Ultralytics Python API는 단순성을 위해 설계되었습니다. 단 몇 줄의 코드만으로 모델을 로드하고, 이미지에서 예측하고, 결과를 시각화할 수 있어 AI 솔루션의 진입 장벽을 낮춥니다.
  • 포괄적인 에코시스템: 독립형 리포지토리와 달리, Ultralytics 모델은 강력한 에코시스템의 지원을 받습니다. 여기에는 다음과 같은 MLOps 도구와의 원활한 통합이 포함됩니다. Weights & BiasesClearML과 같은 MLOps 도구와의 원활한 통합은 물론 활발한 커뮤니티 지원도 포함됩니다.
  • 성능 균형: Ultralytics YOLO 모델은 속도와 정확도 사이에서 최적의 절충점을 제공하도록 설계되었습니다. 지연 시간에서 YOLOX보다 성능이 뛰어나면서도 EfficientDet의 매개변수 효율성과 일치하는 경우가 많습니다.
  • 메모리 요구 사항: Ultralytics 모델은 많은 트랜스포머 기반 또는 구형 CNN 아키텍처에 비해 훈련 중 CUDA 메모리 사용량이 적도록 최적화되어 있으므로 표준 하드웨어에서 더 큰 배치를 훈련할 수 있습니다.
  • 다용도성: 단일 Ultralytics 프레임워크가 객체 감지, 인스턴스 세분화, 포즈 추정, 분류OBB(오리엔티드 바운딩 박스)를 지원합니다. 이러한 다용도성 덕분에 작업마다 다른 코드베이스를 학습할 필요가 없습니다.

간단한 추론 예제

복잡한 레거시 파이프라인과 비교하여 Ultralytics YOLO11 추론을 실행하는 것이 얼마나 쉬운지 알아보세요:

from ultralytics import YOLO

# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")

# Run inference on a local image
results = model("bus.jpg")

# Display the results
results[0].show()

결론 이상적인 사용 사례

특정 제약 조건에 따라 EfficientDet, YOLOX, Ultralytics YOLO 중에서 선택하는 것이 좋습니다.

  • 초소형 임베디드 마이크로컨트롤러와 같이 저장 공간과 FLOPs가 절대적인 병목 현상을 일으키는 하드웨어에 애플리케이션을 배포하는 경우 EfficientDet을 선택하세요. 원칙적인 확장을 통해 모델 크기를 세밀하게 제어할 수 있습니다.
  • GPU에 배포하고 원시 속도가 필요한 경우 YOLOX를 선택하세요. 이 아키텍처는 앵커 기반 방법의 일부 운영 오버헤드를 방지하므로 지원되는 하드웨어에서 실시간 비디오 분석에 매우 효과적입니다.
  • 최고의 성능을 원한다면 Ultralytics YOLO11 선택하세요. 이 제품은 YOLOX의 속도와 최신 아키텍처 설계의 효율성을 결합합니다. 또한 에코시스템, 문서화 및 멀티태스크 지원으로 개발 시간을 획기적으로 단축하여 신속한 프로토타이핑과 확장 가능한 프로덕션 배포 모두에 탁월한 선택이 될 수 있습니다.

기타 모델 비교

주요 컴퓨터 비전 모델 간의 기술적 차이점에 대해 자세히 알아보세요:


댓글