콘텐츠로 건너뛰기

YOLOX 대 PP-YOLOE+: 포괄적인 기술 비교

강력한 컴퓨터 비전 파이프라인을 설계할 때 적절한 객체 탐지 모델을 선택하는 것은 매우 중요한 결정입니다. 실시간 객체 탐지기의 경쟁 구도는 매우 치열하며, 수많은 아키텍처가 추론 속도와 탐지 정확도 사이의 궁극적인 균형을 제공하기 위해 노력하고 있습니다. 본 기술 비교에서는 두 가지 주요 모델인 YOLOX와 PP-YOLOE+를 평가할 것입니다. 아키텍처 설계, 훈련 방법론 및 성능 지표를 검토함으로써 개발자와 연구자에게 배포 환경에 적합한 도구를 선택하는 데 필요한 통찰력을 제공하고자 합니다.

건축적 혁신과 디자인

두 모델 모두 초기 YOLO 과정에서 발생한 특정 문제점을 해결하기 위해 설계되었으나, 속도와 정확도 간의 상충 관계를 해결하는 데 있어 근본적으로 다른 접근 방식을 취합니다.

YOLOX: 연구와 산업을 잇는 가교 역할

메그비(Megvii)의 정거(Zheng Ge), 송타오 리우(Songtao Liu), 펑 왕(Feng Wang), 제밍 리(Zeming Li), 지안 쑨(Jian Sun)이 개발한 YOLOX는 2021년 7월 18일에 공개되었습니다. 앵커 프리(anchor-free) 설계를 완전히 도입함으로써 YOLO 중요한 전환점을 마련했습니다. 공식 Arxiv 논문에서 기초 연구를 살펴볼 수 있으며, 원본 소스 코드는 YOLOX GitHub 저장소에서 확인할 수 있습니다.

YOLOX는 분리된 헤드를 통합하여 분류와 회귀 작업을 분리함으로써 훈련 중 수렴 속도를 크게 향상시킵니다. 또한 SimOTA와 같은 고급 레이블 할당 전략을 도입하여 양성 샘플을 동적으로 할당합니다. 이는 특히 계산 자원이 엄격히 제한된 엣지 AI 환경에서 모델의 효율성을 극대화합니다.

YOLOX에 대해 자세히 알아보세요

PP-YOLOE+: 고성능 산업용 감지

2022년 4월 2일 바이두의 PaddlePaddle 소개한 PP-YOLOE+는YOLO 고도로 최적화된 진화형 모델입니다. Arxiv에 게재된 논문에서 상세히 설명된 바와 같이, PP-YOLOE+는 바이두 생태계에 깊이 통합되어 있으며 PaddlePaddle 필요합니다. 모델 구성은 PaddleDetection GitHub 저장소에서 확인할 수 있습니다.

PP-YOLOE+는 강력한 CSPRepResNet 백본을 기반으로 하며, 효율적인 작업 정렬 헤드(ET-head)와 작업 정렬 학습(TAL)을 활용합니다. 이 아키텍처는 COCO 뛰어난 평균 정밀도(mAP)를 달성하여, 최소한의 종속성보다 정확도를 우선시하는 산업용 결함 검출 및 서버 측 중량급 처리 분야에서 탁월한 선택지입니다.

PP-YOLOE+에 대해 자세히 알아보세요.

성능 벤치마크

이러한 모델들이 다양한 규모에서 어떻게 수행되는지 이해하는 것은 배포에 필수적입니다. 아래 표는 주요 지표를 요약하여 제시합니다. mAP 및 TensorRT로 내보낼 때의 추론 속도 등 주요 지표를 요약합니다. TensorRT로 내보낼 때의 주요 지표와 추론 속도를 요약합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

배포 고려 사항

PP-YOLOE+x가 가장 높은 절대 정확도를 달성하는 반면, YOLOX는 저전력 마이크로컨트롤러 및 구형 모바일 하드웨어에 매우 적합한 초경량 변형 모델(Nano 및 Tiny)을 제공합니다.

사용 사례 및 권장 사항

YOLOX와 PP-YOLOE+ 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

욜록스를 선택해야 할 때

YOLOX는 다음과 같은 경우에 탁월한 선택입니다:

  • 앵커 프리 탐지 연구: 새로운 탐지 헤드나 손실 함수를 실험하기 위한 기준으로 YOLOX의 깔끔한 앵커 프리 아키텍처를 활용한 학술 연구.
  • 초경량 에지 디바이스: 마이크로컨트롤러 또는 레거시 모바일 하드웨어에 배포할 때 YOLOX-Nano 변형의 극히 작은 메모리 사용량(0.91M 매개변수)이 핵심적인 요소입니다.
  • SimOTA 라벨 할당 연구: 최적 수송 기반 라벨 할당 전략과 훈련 수렴에 미치는 영향을 조사하는 연구 프로젝트들.

PP-YOLOE+를 선택해야 하는 경우

PP-YOLOE+는 다음에 권장됩니다:

  • PaddlePaddle 통합: 기존 인프라가 바이두의 PaddlePaddle 프레임워크 및 툴링을 기반으로 구축된 조직.
  • 패들 라이트 에지 배포: 패들 라이트 또는 패들 추론 엔진 전용으로 고도로 최적화된 추론 커널을 갖춘 하드웨어에 배포합니다.
  • 고정밀 서버 측 탐지: 프레임워크 의존성이 문제가 되지 않는 강력한 GPU 최대 탐지 정확도를 우선시하는 시나리오.

Ultralytics YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

Ultralytics : YOLO26 소개

YOLOX와 PP-YOLOE+ 모두 뚜렷한 장점을 제공하지만, AI의 급속한 진화는 최첨단 정확도와 비교할 수 없는 사용 편의성을 결합한 도구를 요구합니다. 바로 여기에 Ultralytics 모델, 특히 최근 출시된 Ultralytics 기존 연구 저장소를 능가하는 지점입니다.

2026년 1월 출시된 YOLO26은 현대적 객체 탐지 및 그 이상의 영역에서 새로운 기준을 제시하며, 경쟁 프레임워크가 따라올 수 없는 개발자 경험을 제공합니다.

개발자들이 YOLO26을 선택하는 이유

  1. 엔드투엔드 NMS 설계: YOLOv10에서 개척된 개념을 기반으로 구축된 YOLOv26은 본질적으로 엔드투엔드입니다. 비최대 억제(NMS) 후처리 과정을 완전히 제거함으로써 높은 일관성의 지연 시간을 보장하고, 에지 환경을 위한 내보내기 파이프라인을 획기적으로 단순화합니다.
  2. 차세대 최적화: MuSGD 최적화기(Moonshot AI의 Kimi K2와 같은 LLM 방법론에서 영감을 받은 SGD 하이브리드)로 훈련 안정성이 혁신적으로 개선되었습니다. 이는 더 빠른 수렴을 보장합니다. 또한 YOLO26은 ProgLoss + STAL을 활용하여 소형 물체 인식 능력을 획기적으로 향상시켰으며, 이는 항공 영상 및 로봇 공학 관련 응용 분야에서 핵심적인 기능입니다.
  3. 탁월한 하드웨어 효율성: 분포 초점 손실(DFL)을 제거함으로써 YOLO26은 메모리 요구 사항을 획기적으로 낮춥니다. 최대 43% 빠른 CPU 자랑하며, 전용 GPU가 없는 장치에 대한 확실한 선택지입니다. GPU 가속 기능이 없는 디바이스에 최적의 선택입니다.
  4. 극도의 다용도성: 탐지에만 집중하는 PP-YOLOE+와 달리, YOLO26은 다양한 작업에 걸쳐 통합적인 지원을 제공합니다. 인스턴스 분할을 위한 특수한 의미적 분할 손실, 정확한 자세 추정을 위한 잔차 로그 가능도 추정(RLE), 방향성 바운딩 박스(OBB)를 위한 고급 각도 손실 메커니즘을 통합합니다.

YOLO26에 대해 더 알아보기

원활한 생태계 통합

Ultralytics 복잡한 프레임워크 설치로 인한 번거로움을 Ultralytics . 통합된 Python 또는 직관적인 Ultralytics 사용하면 몇 줄의 코드만으로 모델을 훈련, 검증 및 내보낼 수 있습니다.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset with minimal CUDA memory overhead
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Effortlessly run inference
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX natively, fully benefiting from the NMS-free architecture
model.export(format="onnx")

Ultralytics 내에서 다른 강력한 아키텍처를 평가 중인 사용자를 위해, YOLO11 는 기존 배포 환경에서 여전히 매우 신뢰할 수 있는 선택지이며, 트랜스포머 기반의 RT-DETR 는 어텐션 기반 솔루션을 찾는 사용자에게 탁월한 기능을 제공합니다.

요약

YOLOX와 PP-YOLOE+ 사이의 선택은 주로 주요 프레임워크 제약 조건에 따라 결정됩니다. 즉, PyTorch 유연성을 선호하는지, 아니면 PaddlePaddle 깊은 통합을 선호하는지에 달려 있습니다. 그러나 AI 인프라의 미래 대비를 원하는 조직에게는 Ultralytics 훨씬 우수한 대안을 제공합니다. 혁신적인 NMS( NMS Multi-Scale) 프리 설계, 경량 메모리 사용량, 포괄적인 작업 범용성을 갖춘 YOLO26은 팀이 전례 없는 용이성으로 더 빠르고, 더 스마트하며, 더 효율적인 컴퓨터 비전 애플리케이션을 구축할 수 있도록 지원합니다.


댓글