Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX 대 RTDETRv2#

컴퓨터 비전 애플리케이션을 위한 최적의 아키텍처를 선택하려면 정확도, 추론 속도, 배포 가능성 사이의 신중한 균형이 필요합니다. 본 종합 기술 분석에서는 앵커 프리(anchor-free) CNN 아키텍처로서 큰 성공을 거둔 YOLOX와 최첨단 실시간 검출 트랜스포머인 RTDETRv2의 근본적인 차이점을 살펴봅니다.

두 모델 모두 객체 검출 분야에 상당한 기여를 했지만, 프로덕션 환경용 애플리케이션을 구축하는 개발자들은 종종 Ultralytics YOLO26과 같은 최신 대안이 더 뛰어난 학습 효율성, 낮은 메모리 요구 사항, 그리고 더 견고한 배포 생태계를 제공한다는 점을 발견하게 됩니다.

Link to this sectionYOLOX: 연구와 산업 간의 격차 해소#

YOLOX는 YOLO 시리즈의 매우 인기 있는 앵커 프리 적응형 모델로 등장했으며, 출시 당시 인상적인 성능 향상을 제공하는 단순화된 설계를 도입했습니다.

  • 저자: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li 및 Jian Sun
  • 조직: Megvii
  • 날짜: 2021년 7월 18일
  • 링크: Arxiv, GitHub, Docs

Link to this section아키텍처 혁신#

YOLOX는 YOLO 제품군을 앵커 프리 패러다임으로 전환하며, 디커플링 헤드(decoupled head)와 고급 SimOTA 레이블 할당 전략을 통합했습니다. 앵커 박스를 제거함으로써 해당 아키텍처는 설계 파라미터 수를 크게 줄였고 다양한 벤치마크 데이터셋 전반에서 일반화 성능을 향상시켰습니다. YOLOX-Nano 및 YOLOX-Tiny와 같은 경량화 버전은 엣지 디바이스에서의 비전 AI 애플리케이션 배포를 위한 인기 있는 선택지가 되었습니다.

레거시 고려 사항

YOLOX가 주목할 만한 발전을 가져왔지만, 무거운 데이터 증강 파이프라인과 기존 NMS와 같은 구형 후처리 루틴에 대한 의존도는 네이티브 엔드 투 엔드 모델에 비해 더 높은 지연 시간을 초래할 수 있습니다.

YOLOX에 대해 더 알아보기

Link to this sectionRTDETRv2: 실시간 비전 트랜스포머의 발전#

이전 모델의 기반을 바탕으로 구축된 RTDETRv2는 비전 트랜스포머(ViT)의 성능을 활용하여 실시간 추론 속도를 희생하지 않으면서도 매우 경쟁력 있는 정확도를 달성합니다.

  • 저자: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang 및 Yi Liu
  • 조직: Baidu
  • 날짜: 2024-07-24
  • 링크: Arxiv, GitHub

Link to this section아키텍처 혁신#

RTDETRv2는 NMS(Non-Maximum Suppression)를 네이티브 방식으로 우회하는 트랜스포머 기반 아키텍처를 활용하여 검출 파이프라인을 근본적으로 재구상합니다. 이는 하이브리드 인코더와 IoU 기반 쿼리 선택을 통해 달성되며, 객체 쿼리 초기화를 개선합니다. 이 모델은 다중 스케일 특징을 효과적으로 처리하여 야간 교통 영상 검출과 같은 복잡한 환경에서 복잡한 세부 정보를 포착할 수 있게 합니다.

그러나 트랜스포머는 본질적으로 리소스 집약적입니다. RTDETRv2 학습에는 일반적으로 CNN 기반 대안보다 훨씬 더 많은 GPU 메모리와 컴퓨팅 주기가 필요하며, 이는 엄격한 예산 제약 내에서 운영되는 팀이나 잦은 모델 튜닝이 필요한 팀에게는 걸림돌이 될 수 있습니다.

RTDETR에 대해 더 알아보기

Link to this section성능 비교표#

이러한 아키텍처를 객관적으로 평가하기 위해 COCO 데이터셋에서의 성능을 검토합니다. 아래 표는 정확도(mAP), 파라미터 수, 계산 복잡성 간의 트레이드오프를 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

RTDETRv2가 인상적인 정확도를 달성하는 반면, YOLOX는 특히 Nano 및 Tiny 변형 모델에서 경량 파라미터 프로필의 강점을 유지합니다.

Link to this section활용 사례 및 권장 사항#

YOLOX와 RT-DETR 중 선택은 귀하의 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

Link to this sectionYOLOX를 선택해야 할 때#

YOLOX는 다음과 같은 경우에 강력한 선택입니다:

  • 앵커 프리 탐지 연구: YOLOX의 깔끔하고 앵커 프리인 아키텍처를 새로운 탐지 헤드나 손실 함수 실험의 기본 모델로 사용하는 학술 연구.
  • 초경량 에지 장치: YOLOX-Nano 변형의 매우 작은 풋프린트(0.91M 파라미터)가 필수적인 마이크로컨트롤러나 레거시 모바일 하드웨어에 배포하는 경우.
  • SimOTA 라벨 할당 연구: 최적 운송 기반의 라벨 할당 전략과 그것이 학습 수렴에 미치는 영향을 조사하는 연구 프로젝트.

Link to this sectionRT-DETR을 선택해야 할 때#

RT-DETR 권장 대상:

  • Transformer 기반 탐지 연구: NMS 없이 엔드 투 엔드 객체 탐지를 위해 어텐션 메커니즘과 Transformer 아키텍처를 탐구하는 프로젝트.
  • 유연한 지연 시간을 가진 고정밀 시나리오: 탐지 정확도가 최우선이며, 약간 높은 추론 지연 시간이 허용되는 애플리케이션.
  • 대형 객체 탐지: Transformer의 글로벌 어텐션 메커니즘이 자연스러운 이점을 제공하는, 주로 중대형 객체가 있는 장면.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this sectionUltralytics의 강점: YOLO26#

YOLOX와 RTDETRv2 모두 고유한 강점을 가지고 있지만, 새로 출시된 Ultralytics YOLO26은 속도, 정확도, 배포 용이성 사이의 역사적인 트레이드오프를 해결하며 비전 AI의 최첨단 기술을 재정의합니다.

Link to this section1. 엔드 투 엔드 NMS 프리 아키텍처#

트랜스포머 모델에서 영감을 얻으면서도 CNN의 효율성을 유지하는 YOLO26은 네이티브 엔드 투 엔드 NMS 프리 설계가 특징입니다. 후처리 단계로서의 NMS를 제거함으로써 YOLO26은 배포 파이프라인을 획기적으로 단순화하여, 복잡한 임계값 튜닝 오버헤드 없이 다양한 엣지 디바이스에서 일관된 추론 지연 시간을 보장합니다.

Link to this section2. 최대 43% 더 빠른 CPU 추론#

고성능 GPU에 크게 의존하는 RTDETRv2와 같은 트랜스포머 아키텍처와 달리, YOLO26은 엣지 컴퓨팅 환경에 최적화되어 있습니다. DFL(Distribution Focal Loss)을 제거함으로써 YOLO26은 모델 내보내기를 간소화하고 CPU 추론 속도를 최대 43% 향상시켜, Raspberry Pi와 같은 하드웨어나 표준 모바일 디바이스 통합에 이상적인 선택입니다.

Link to this section3. MuSGD를 통한 학습 효율성#

트랜스포머 모델 학습은 종종 과도한 CUDA 메모리 소모와 긴 학습 시간을 초래합니다. YOLO26은 확률적 경사 하강법(SGD)과 LLM에서 영감을 받은 Muon 옵티마이저의 하이브리드인 새로운 MuSGD 옵티마이저를 도입했습니다. 이러한 혁신은 매우 안정적인 학습과 더 빠른 수렴을 제공하여 RTDETRv2 대비 하드웨어 요구 사항을 크게 낮춥니다.

Link to this section4. 타의 추종을 불허하는 생태계 및 범용성#

Ultralytics 생태계는 직관적이고 간소화된 개발자 경험을 제공합니다. 방대한 문서, 활발한 커뮤니티 지원, 클라우드 기반 Ultralytics Platform을 통해 전체 AI 수명 주기를 관리하는 것이 그 어느 때보다 쉬워졌습니다. 또한 YOLO26은 범용성이 매우 뛰어납니다. RTDETRv2가 객체 검출에 집중하는 반면, YOLO26은 인스턴스 분할, 포즈 추정, 이미지 분류, 지향성 바운딩 박스(OBB) 작업을 네이티브로 원활하게 지원합니다. 새로운 ProgLoss + STAL 손실 함수로 강화된 YOLO26은 항공 이미지산업용 결함 검출에 필수적인 소형 객체 인식 능력도 탁월합니다.

기타 지원 모델

Ultralytics 프레임워크는 이전 세대인 YOLO11YOLOv8도 지원하여 사용자가 레거시 파이프라인을 쉽게 벤치마킹하고 전환할 수 있도록 합니다.

Link to this sectionUltralytics와의 원활한 통합#

모델 배포는 복잡하고 파편화된 코드베이스와 씨름할 필요가 없어야 합니다. Ultralytics Python API를 사용하면 몇 줄의 코드만으로 최첨단 모델을 로드, 학습 및 내보낼 수 있습니다.

from ultralytics import YOLO

# Load the latest YOLO26 nano model for optimal edge performance
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with minimal memory overhead
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export seamlessly to ONNX or TensorRT for deployment
model.export(format="onnx", optimize=True)

Ultralytics를 활용함으로써 연구용 저장소와 관련된 복잡한 환경 구성을 우회하여 시장 출시 시간을 앞당길 수 있습니다.

Link to this section결론#

YOLOX와 RTDETRv2는 실시간 객체 검출 발전 과정에서 중요한 이정표를 세웠습니다. YOLOX는 매우 효율적인 앵커 프리 CNN의 타당성을 증명했고, RTDETRv2는 트랜스포머를 실시간 제약 조건에 성공적으로 적용했습니다.

하지만 스마트 소매 분석부터 임베디드 로봇 공학에 이르는 현대적인 애플리케이션에는 Ultralytics YOLO26이 결정적인 솔루션을 제공합니다. NMS 프리 추론과 타의 추종을 불허하는 CPU 속도, 감소된 메모리 풋프린트, 그리고 Ultralytics Platform의 강력한 지원을 결합한 YOLO26은 개발자가 차세대 신뢰성 높은 고성능 컴퓨터 비전 시스템을 구축할 수 있도록 지원합니다.

댓글