콘텐츠로 건너뛰기

YOLOX 대 PP-YOLOE+: 기술 비교

최적의 객체 감지 모델을 선택하는 것은 정확도, 속도 및 계산 비용의 균형을 맞추는 중요한 결정입니다. 이 페이지에서는 컴퓨터 비전 분야에 크게 기여한 두 가지 영향력 있는 앵커 프리 모델인 YOLOXPP-YOLOE+ 간의 자세한 기술 비교를 제공합니다. 프로젝트에 대한 정보에 입각한 선택을 할 수 있도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 자세히 살펴보겠습니다.

YOLOX: 고성능 앵커 프리(Anchor-Free) 감지

2021년 Megvii에서 소개한 YOLOX는 YOLO 시리즈의 설계를 단순화하면서 최첨단 결과를 달성하는 것을 목표로 하는 고성능 앵커 프리(anchor-free) 객체 감지 모델입니다. 간소화되면서도 강력한 아키텍처를 제공함으로써 학술 연구와 산업 응용 간의 간극을 해소하도록 설계되었습니다.

기술 세부 사항:

아키텍처 및 주요 기능

YOLOX는 기존 앵커 기반 방법에서 벗어나 YOLO 제품군에 몇 가지 주요 혁신을 도입했습니다.

  • Anchor-Free Design: 사전 정의된 앵커 박스를 제거함으로써 YOLOX는 감지 파이프라인을 간소화하고 튜닝해야 하는 하이퍼파라미터의 수를 줄이며 다양한 객체 크기와 종횡비에 걸쳐 일반화(generalization)를 향상시킬 수 있습니다.
  • Decoupled Head: 결합된 헤드를 사용했던 이전 YOLO 모델과 달리 YOLOX는 분류 및 위치 추정 작업에 대해 별도의 헤드를 사용합니다. 이러한 분리는 더 빠른 수렴과 향상된 정확도로 이어질 수 있습니다.
  • 고급 훈련 전략: YOLOX는 훈련 중 동적 레이블 할당을 위해 SimOTA(Simplified Optimal Transport Assignment)와 같은 고급 기술을 통합합니다. 또한 모델의 견고성을 향상시키기 위해 MixUp과 같은 강력한 데이터 증강 방법도 활용합니다.

강점과 약점

강점:

  • 높은 정확도: YOLOX는 특히 YOLOX-x와 같은 더 큰 변형에서 강력한 mAP 점수를 달성하여 정확도가 중요한 작업에 경쟁력 있는 선택입니다.
  • Anchor-Free 단순성: 앵커 프리 방식은 앵커 박스 구성 및 튜닝과 관련된 복잡성을 줄입니다.
  • 확립된 모델: 2021년부터 사용할 수 있는 모델로서 많은 커뮤니티 리소스와 배포 예제를 사용할 수 있습니다.

약점:

  • 추론 속도: 효율적이지만, 특히 더 작은 모델 변형에서 추론 속도가 최신 고도로 최적화된 모델보다 빠를 수 있습니다.
  • External Ecosystem: YOLOX는 Ultralytics 생태계에 기본적으로 통합되어 있지 않으므로 Ultralytics HUB와 같은 도구를 사용한 배포 및 통합에 추가적인 노력이 필요할 수 있습니다.
  • Task Versatility: 주로 객체 탐지에 중점을 두며 최신의 더 다재다능한 프레임워크에서 볼 수 있는 인스턴스 분할 또는 포즈 추정과 같은 다른 비전 작업에 대한 기본 지원이 부족합니다.

사용 사례

YOLOX는 다음을 포함한 다양한 애플리케이션에 적합합니다.

  • 일반 객체 감지: 보안 시스템에서와 같이 정확도와 속도 간의 균형이 잘 맞는 시나리오에 적합합니다.
  • 연구 기준: 앵커 프리(anchor-free) 감지 방법 및 고급 훈련 기술을 탐색하는 연구자들에게 훌륭한 기준 역할을 합니다.
  • 산업 애플리케이션: 높은 감지 정확도가 중요한 품질 관리와 같은 작업에 배포할 수 있습니다.

YOLOX에 대해 자세히 알아보세요

PP-YOLOE+: Baidu의 앵커 프리(Anchor-Free) 우수성

PP-YOLOE+는 PP-YOLOE의 향상된 버전으로, Baidu에서 개발되어 PaddlePaddle 프레임워크의 일부로 2022년 4월에 출시되었습니다. 이는 산업 응용 분야에 특히 중점을 두고 높은 정확도와 효율성을 위해 설계된 앵커 프리(anchor-free) 단일 단계 감지기입니다.

기술 세부 사항:

아키텍처 및 주요 기능

PP-YOLOE+는 성능 한계를 뛰어넘기 위해 설계된 몇 가지 주목할 만한 기능을 통해 앵커 프리 패러다임을 기반으로 합니다.

  • Anchor-Free Design: YOLOX와 마찬가지로 사전 정의된 앵커 박스를 피하여 감지 파이프라인을 간소화합니다. 용어집에서 앵커 프리(anchor-free) 감지기에 대해 자세히 알아볼 수 있습니다.
  • 효율적인 구성 요소: 아키텍처는 ResNet 백본과 효과적인 다중 스케일 특징 융합을 위한 PAN(Path Aggregation Network) neck을 활용합니다.
  • Task Alignment Learning (TAL): 주요 혁신은 분류 및 지역화 작업을 더 효과적으로 정렬하여 탐지 정확도를 크게 향상시키는 특수 손실 함수인 TAL의 사용입니다.

강점과 약점

강점:

  • 탁월한 정확도: PP-YOLOE+ 모델, 특히 더 큰 변형은 COCO와 같은 표준 벤치마크에서 최첨단 정확도를 제공합니다.
  • 높은 효율성: 이 모델은 효율적으로 설계되어 정확도, 파라미터 수 및 FLOPs 간의 균형을 잘 이룹니다.
  • PaddlePaddle 생태계: PaddlePaddle 딥 러닝 프레임워크 내에서 잘 통합되고 최적화되었습니다.

약점:

  • 프레임워크 종속성: PaddlePaddle 프레임워크에 대한 주요 최적화는 PyTorch와 같은 다른 생태계에서 작업하는 개발자에게 장벽이 될 수 있습니다.
  • 커뮤니티 지원: Baidu의 지원을 받지만, 커뮤니티 지원 및 리소스 가용성은 전 세계적으로 더 널리 채택된 모델에 비해 적을 수 있습니다.

사용 사례

PP-YOLOE+는 다음과 같은 까다로운 애플리케이션에 탁월한 선택입니다.

  • 산업 품질 검사: 높은 정확도는 생산 라인의 결함 감지에 매우 유용합니다.
  • 스마트 리테일: 재고 관리 및 고객 분석과 같이 높은 정밀도를 요구하는 작업에 유용합니다.
  • Edge Computing: 더 작은 변형의 효율적인 아키텍처 덕분에 모바일 및 임베디드 장치에 배포할 수 있습니다.

PP-YOLOE+에 대해 자세히 알아보세요.

정면 대결 비교: YOLOX vs. PP-YOLOE+

YOLOX와 PP-YOLOE+는 모두 강력한 앵커 프리 검출기이지만, 성능과 효율성에서 주요 차이점을 보입니다. 아래 표는 COCO 데이터 세트를 기반으로 자세한 비교를 제공합니다.

모델 크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59

데이터에서 다음과 같은 몇 가지 결론을 도출할 수 있습니다.

  • 정확도 (mAP): PP-YOLOE+는 모든 유사한 모델 크기에서 YOLOX보다 지속적으로 뛰어난 성능을 보입니다. 가장 큰 모델인 PP-YOLOE+x는 놀라운 54.7% mAP를 달성하여 YOLOX-x의 51.1%보다 훨씬 높습니다.
  • 효율성 (파라미터 & FLOPs): PP-YOLOE+ 모델은 일반적으로 더 효율적입니다. 예를 들어 PP-YOLOE+l은 YOLOX-x보다 높은 mAP를 달성하면서도 파라미터와 FLOPs를 거의 절반만 사용하여 뛰어난 아키텍처 설계를 보여줍니다.
  • 추론 속도: 이 모델들은 속도 면에서 매우 경쟁력이 있습니다. 더 작은 YOLOX 모델이 약간의 우위를 보이지만, 더 큰 PP-YOLOE+ 모델이 더 빨라서 고성능 배포에 더 나은 확장성을 나타냅니다.

결론: 어떤 모델을 선택해야 할까요?

YOLOX와 PP-YOLOE+는 모두 객체 탐지 분야에서 강력한 경쟁자입니다. YOLOX는 잘 확립되고 신뢰할 수 있는 모델이므로 많은 프로젝트에 훌륭한 출발점이 됩니다. 그러나 최고 수준의 정확도와 효율성을 요구하는 애플리케이션의 경우 PP-YOLOE+가 PaddlePaddle 생태계 내에서 작업하는 데 익숙하다면 분명한 이점을 보여줍니다.

보다 총체적이고 사용자 친화적인 솔루션을 찾는 개발자 및 연구자에게는 Ultralytics YOLO 모델을 살펴보는 것이 좋습니다. YOLOv8 및 최신 YOLO11과 같은 모델은 성능, 다재다능함, 사용 편의성의 강력한 조합을 제공합니다.

Ultralytics 모델이 돋보이는 이유는 다음과 같습니다.

  • 사용 편의성: 간소화된 Python API, 광범위한 문서 및 다양한 튜토리얼을 통해 빠르고 쉽게 시작할 수 있습니다.
  • 잘 관리되는 에코시스템: 활발한 개발, GitHub의 강력한 커뮤니티 지원, 엔드 투 엔드 프로젝트 관리를 위한 Ultralytics HUB와 같은 통합 도구를 통해 이점을 얻으세요.
  • 성능 균형: Ultralytics 모델은 속도와 정확성 사이에서 뛰어난 균형을 제공하도록 설계되어 실시간 에지 배포와 고정밀 클라우드 솔루션 모두에 적합합니다.
  • 다재다능함: 감지에만 집중된 모델과 달리 Ultralytics YOLO 모델은 인스턴스 분할, 자세 추정 및 분류를 포함하여 여러 작업을 즉시 지원합니다.
  • 학습 효율성: 효율적인 학습 프로세스, 더 낮은 메모리 요구 사항 및 즉시 사용 가능한 사전 학습된 가중치를 통해 사용자 정의 모델을 더 빠르게 개발할 수 있습니다.

Ultralytics 모델이 다른 모델과 어떻게 비교되는지 보려면 YOLO11 vs. YOLOX 또는 PP-YOLOE+ vs. YOLOv10과 같은 다른 비교 페이지가 도움이 될 수 있습니다.



📅 1년 전에 생성됨 ✏️ 1개월 전에 업데이트됨

댓글