Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ 대 YOLOX#

컴퓨터 비전 분야는 객체 탐지 모델의 빠른 진화에 의해 크게 변화해 왔습니다. 이 여정에서 주목할 만한 이정표 중 하나는 실시간 성능과 정확성의 경계를 넓힌 PP-YOLOE+와 YOLOX라는 두 가지 아키텍처입니다. 차세대 시각 인식 시스템을 구축하는 연구자와 개발자에게는 이러한 모델의 아키텍처적 차이, 성능 상의 절충안, 그리고 이상적인 배포 시나리오를 이해하는 것이 중요합니다.

Link to this section모델 계보 및 세부 정보#

기술적 아키텍처를 자세히 살펴보기 전에, 두 모델의 기원을 맥락적으로 이해하는 것이 도움이 됩니다. 각 모델은 지원 조직의 강력한 영향력을 바탕으로 객체 탐지의 특정 병목 현상을 해결하기 위해 개발되었습니다.

PP-YOLOE+ 세부 정보:

PP-YOLOE+에 대해 더 알아보기

YOLOX 세부 사항:

YOLOX에 대해 더 알아보기

Link to this section아키텍처 혁신#

이 두 탐지기 간의 핵심적인 차이점은 특징 추출과 바운딩 박스 예측에 접근하는 방식에 있습니다.

YOLOX는 YOLO 제품군을 앵커 프리(anchor-free) 설계로 성공적으로 적용하며 2021년에 큰 반향을 일으켰습니다. 앵커 박스를 제거함으로써 YOLOX는 설계 파라미터와 커스텀 데이터셋에 필요한 경험적 튜닝의 수를 크게 줄였습니다. 또한, 분류 작업과 위치 지정 작업을 별도의 신경망 경로로 분리하는 디커플링 헤드(decoupled head)를 도입했습니다. 이러한 분리는 객체 분류와 공간 좌표 회귀 사이의 본질적인 충돌을 해결하여 학습 중 수렴 속도를 높였습니다.

Baidu에서 개발한 **PP-YOLOE+**는 PaddlePaddle 생태계에 최적화되어 있습니다. 이 모델은 이전 버전인 PP-YOLOv2를 기반으로 하며, 동적 레이블 할당 전략(TAL)과 CSPRepResNet이라는 새로운 백본을 도입했습니다. 이 백본은 구조적 재파라미터화(structural re-parameterization)를 활용하여 학습 중에는 복잡한 멀티 브랜치 아키텍처의 이점을 누리고, 추론 시에는 빠르고 단순한 단일 경로 네트워크로 변환됩니다.

구조적 재파라미터화

구조적 재파라미터화를 통해 모델은 학습 시 다수의 병렬 브랜치를 사용하여 그래디언트 흐름을 개선하고, 배포 시에는 이를 수학적으로 단일 합성곱 층으로 병합하여 정확도를 희생하지 않으면서도 추론 속도를 높일 수 있습니다.

Link to this section성능 및 지표 비교#

두 모델을 직접 비교하면 성능 스펙트럼에서 서로 조금씩 다른 목적을 수행한다는 점이 분명해집니다. 일반적으로 PP-YOLOE+는 더 높은 절대 정확도를 달성하는 반면, YOLOX는 매우 제한적인 하드웨어에 적합한 초경량 변형 모델을 제공하는 데 탁월합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

참고: 관련 열 세그먼트에서 가장 우수한 성능을 보인 값은 굵게 표시되었습니다.

YOLOX는 디스크 공간이나 CUDA 메모리를 거의 차지하지 않는 나노(nano) 및 타이니(tiny) 변형 모델을 제공하는 반면, PP-YOLOE+는 서버급 하드웨어로 매우 잘 확장되어 Baidu 생태계 내의 무거운 산업용 애플리케이션에 강력한 선택지가 됩니다.

Link to this section실제 활용 사례#

이 프레임워크들 중에서 선택하는 것은 대개 통합 요구 사항과 하드웨어 타겟에 따라 결정됩니다.

Link to this sectionYOLOX가 뛰어난 분야#

앵커 프리 특성과 극한의 엣지 변형 모델을 사용할 수 있다는 점 때문에 YOLOX는 로봇 공학 및 마이크로컨트롤러 배포 분야에서 인기가 많습니다. 단순한 후처리 파이프라인 덕분에 TensorRTNCNN과 같은 맞춤형 NPU 하드웨어 형식으로 쉽게 이식할 수 있습니다.

Link to this sectionPP-YOLOE+가 뛰어난 점#

Baidu의 기술 스택을 사용하는 아시아 제조 허브와 깊게 통합된 조직의 경우, PP-YOLOE+는 사전 최적화된 배포 경로를 제공합니다. 이 모델은 엄격한 실시간 제약 조건 내에서 약간 더 무거운 모델 가중치를 허용하는 강력한 서버 랙에서 실행되는 고정밀 품질 검사 시나리오에서 빛을 발합니다.

Link to this section활용 사례 및 권장 사항#

PP-YOLOE+와 YOLOX 중 선택하는 것은 구체적인 프로젝트 요구 사항, 배포 제약 조건, 생태계 선호도에 따라 달라집니다.

Link to this sectionPP-YOLOE+를 선택해야 하는 경우#

PP-YOLOE+는 다음과 같은 경우 강력한 선택지입니다:

  • PaddlePaddle 생태계 통합: Baidu의 PaddlePaddle 프레임워크 및 도구로 구축된 기존 인프라를 보유한 조직.
  • Paddle Lite 엣지 배포: Paddle Lite 또는 Paddle 추론 엔진에 최적화된 추론 커널을 사용하는 하드웨어에 배포하는 경우.
  • 고정밀 서버 측 탐지: 프레임워크 종속성이 문제가 되지 않는 강력한 GPU 서버에서 최대 탐지 정확도를 우선시하는 시나리오.

Link to this sectionYOLOX를 선택해야 할 때#

YOLOX는 다음 경우에 권장됩니다:

  • 앵커 프리 탐지 연구: YOLOX의 깔끔하고 앵커 프리인 아키텍처를 새로운 탐지 헤드나 손실 함수 실험의 기본 모델로 사용하는 학술 연구.
  • 초경량 에지 장치: YOLOX-Nano 변형의 매우 작은 풋프린트(0.91M 파라미터)가 필수적인 마이크로컨트롤러나 레거시 모바일 하드웨어에 배포하는 경우.
  • SimOTA 라벨 할당 연구: 최적 운송 기반의 라벨 할당 전략과 그것이 학습 수렴에 미치는 영향을 조사하는 연구 프로젝트.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this sectionUltralytics의 강점: YOLO26의 등장#

PP-YOLOE+와 YOLOX가 훌륭한 연구 이정표를 제시했지만, 현대의 배포 환경은 더 우수한 효율성을 갖춘 응집력 있고 개발자 친화적인 경험을 요구합니다. 바로 여기서 Ultralytics YOLO26이 현대적 시각 AI의 표준을 완전히 재정의합니다.

고립된 연구 저장소에서 프로덕션 수준의 시스템으로 전환하려는 팀을 위해 Ultralytics는 강력하고 잘 관리되는 생태계를 제공합니다. 모델을 학습하기 위해 복잡한 환경을 구성할 필요 없이 통합된 Python API에 액세스하는 것만으로 충분합니다.

Ultralytics YOLO26의 주요 장점은 다음과 같습니다:

  • 종단간 NMS-Free 설계: 중복된 바운딩 박스를 필터링하기 위해 NMS(Non-Maximum Suppression)를 필요로 하는 PP-YOLOE+ 및 YOLOX와 달리, YOLO26은 기본적으로 종단간(end-to-end) 방식을 지원합니다. 이는 지연 시간 병목 현상을 제거하고 배포 로직을 획기적으로 단순화합니다.
  • 최대 43% 더 빠른 CPU 추론: DFL(Distribution Focal Loss)을 전략적으로 제거함으로써 YOLO26은 CPU 하드웨어에서 타의 추종을 불허하는 추론 속도를 달성하여 엣지 컴퓨팅 및 저전력 장치에 훨씬 더 우수합니다.
  • MuSGD 옵티마이저: Moonshot AI의 Kimi K2에서 영감을 받은 이 하이브리드 옵티마이저는 LLM 학습 안정성을 컴퓨터 비전에 도입하여 학습 단계 중 훨씬 빠른 수렴을 보장하고 메모리 요구 사항을 최소화합니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 드론 운영 및 고해상도 항공 이미지에서 중요한 기능인 소형 객체 인식 성능을 크게 향상시킵니다.
  • 다재다능함: PP-YOLOE+와 YOLOX가 순수하게 탐지에만 집중하는 반면, YOLO26은 동일한 직관적인 문법을 사용하여 인스턴스 세그멘테이션, 자세 추정, 방향성 바운딩 박스(OBB)를 원활하게 처리합니다.

YOLO26에 대해 자세히 알아보기

Link to this sectionUltralytics를 통한 간소화된 학습#

Ultralytics 모델의 메모리 효율성과 학습 속도는 타의 추종을 불허하며, 엄청난 CUDA 메모리 오버헤드가 필요한 트랜스포머 기반 대안들을 완전히 압도합니다. 단 몇 줄의 코드만으로 YOLO26의 성능을 활용할 수 있습니다:

from ultralytics import YOLO

# Load the highly efficient, end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with built-in auto-batching and MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export seamlessly to ONNX or TensorRT
model.export(format="engine")
Ultralytics 플랫폼 살펴보기

노코드(no-code) 솔루션을 찾는 팀을 위해 Ultralytics 플랫폼은 클라우드 기반 학습, 통합 데이터셋 주석, 모든 YOLO 모델에 대한 원클릭 배포 기능을 제공합니다.

Link to this section결론#

PP-YOLOE+와 YOLOX는 각각 높은 정확도와 가벼운 앵커 프리 설계를 제공하며 컴퓨터 비전 역사에서 확실한 위치를 차지했습니다. 하지만 농업 분야 AI, 스마트 시티, 리테일의 미래를 구축하는 조직에게는 지속적인 유지 관리, 사용 편의성, 그리고 기본 제공되는 NMS-Free 아키텍처를 갖춘 Ultralytics YOLO26이 의심할 여지 없는 최선의 선택입니다.

특정 벤치마크를 위해 다른 아키텍처를 탐색 중이라면, 포괄적인 Ultralytics 문서를 통해 이전 버전인 YOLO11이나 RT-DETR과 같은 트랜스포머 기반 옵션을 비교해보는 것도 가치가 있을 것입니다. 통합된 Ultralytics 생태계로 마이그레이션하면 엣지나 클라우드 배포 환경 어디에서나 최첨단 결과를 얻으면서 귀중한 시간과 자원을 절약할 수 있습니다.

댓글