Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 대 YOLOX#

컴퓨터 비전 분야는 지난 몇 년간 급격한 발전을 이루었으며, 실시간 객체 탐지 모델은 점점 더 정교해지고 있습니다. 프로덕션 환경이나 학술 연구를 위한 아키텍처를 선택할 때, 개발자들은 종종 기존의 이정표와 최신 혁신 사이의 절충안을 고민합니다. 이 종합 비교에서는 Ultralytics YOLO11과 Megvii의 YOLOX 간의 차이점을 살펴보고, 이들의 아키텍처, 성능 지표 및 이상적인 배포 시나리오에 대한 심층적인 통찰력을 제공합니다.

Link to this section아키텍처 개요#

두 모델 모두 객체 탐지 분야에서 중요한 도약을 의미하지만, 서로 다른 설계 철학에서 출발하여 서로 다른 개발자 경험을 지향합니다.

Link to this sectionYOLO11: 다재다능한 멀티 태스크 엔진#

2024년 9월 Ultralytics의 Glenn Jocher와 Jing Qiu가 발표한 YOLO11은 높은 정확도와 극도의 효율성 사이의 균형을 맞춘 통합 프레임워크로 설계되었습니다.

YOLO11은 표준 경계 상자를 넘어 인스턴스 분할, 이미지 분류, 자세 추정회전 경계 상자(OBB) 탐지를 기본적으로 지원합니다. 개선된 아키텍처는 복잡한 공간 계층 구조 전반에 걸쳐 특징 유지력을 최적화합니다.

YOLO11에 대해 더 알아보기

Link to this sectionYOLOX: 앵커 프리(Anchor-Free)의 선구자#

Megvii의 연구원들이 개발한 YOLOX는 2021년 순수 앵커 프리 접근 방식을 통해 연구와 산업 응용 프로그램 사이의 간극을 좁히며 큰 주목을 받았습니다.

YOLOX는 디커플드 헤드(decoupled head)와 앵커 프리 패러다임을 도입하여 설계 파라미터 수를 대폭 줄였으며, 출시 당시 학술 벤치마크에서 성능을 크게 향상시켰습니다.

YOLOX에 대해 더 알아보기

알고 계셨나요?

YOLOX가 대중화한 앵커 프리 설계는 이후 많은 아키텍처에 영감을 주었습니다. Ultralytics는 YOLOv8 및 YOLO11과 같은 후속 버전에서 이러한 앵커 프리 개념을 통합하고 대폭 개선하여 우수한 정확도와 배포 유연성을 제공합니다.

Link to this section성능 및 지표#

탐지 모델을 평가할 때 파라미터의 균형, 연산 비용(FLOPs) 및 평균 정밀도(mAP)를 검토하는 것은 실제 모델 배포에 매우 중요합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

표에서 볼 수 있듯이, YOLO11xYOLOXx보다 절대적인 정확도(54.7 mAP 대 51.1 mAP) 면에서 훨씬 뛰어나며, 파라미터 수는 대략 절반(56.9M 대 99.1M) 수준입니다. 이러한 효율성은 학습 및 추론 시 메모리 요구 사항을 낮추며, 이는 프로덕션 환경에서 엄청난 이점이 됩니다.

Link to this section생태계 및 개발자 경험#

Link to this sectionUltralytics의 장점#

YOLO11과 YOLOX의 가장 큰 차이점 중 하나는 사용성입니다. YOLOX는 주로 연구용 코드베이스로 작동하며, 복잡한 환경 구성, C++ 연산자의 수동 컴파일, 사용자 지정 데이터셋 학습을 시작하기 위한 장황한 명령줄 인수가 필요합니다.

이와 극명하게 대조적으로, YOLO11은 Ultralytics Python 패키지에 완전히 통합되어 효율적이고 원활한 워크플로우를 제공합니다. Ultralytics 플랫폼은 데이터 주석, 실험 추적 및 클라우드 기반 학습을 위한 광범위한 도구를 제공하여 상용구 코드를 추상화함으로써 엔지니어가 모델 성능에 집중할 수 있도록 합니다.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

또한 Ultralytics 모델을 TensorRT, CoreML 또는 OpenVINO와 같은 형식으로 내보내는 데는 단 하나의 명령만 필요하지만, 기존 저장소는 종종 복잡한 타사 도구나 수동 그래프 수정 작업을 요구합니다.

Link to this section실제 활용 사례#

Link to this sectionYOLOX를 고려해야 할 때#

YOLOX는 개발자가 이미 특정 디커플드 헤드 텐서 출력을 중심으로 고도로 사용자 정의된 C++ 추론 파이프라인을 구축한 전문화된 레거시 배포 환경에서 여전히 유효한 옵션입니다. 또한 2021년 최첨단 아키텍처를 대상으로 비교 연구를 수행하는 연구원들은 여전히 YOLOX를 벤치마크 데이터셋 기준으로 활용할 것입니다.

Link to this sectionYOLO11의 강점#

거의 모든 현대 프로덕션 시나리오에서 YOLO11은 훨씬 뛰어난 경험을 제공합니다:

  • 스마트 시티 및 리테일: 뛰어난 속도 대 정확도 비율 덕분에 YOLO11은 혼잡한 장면을 손쉽게 처리하며, 대규모 GPU 클러스터 없이도 자동화된 리테일 분석 및 교통 관리 시스템을 구동합니다.
  • Edge Computing: The high memory efficiency and robust export options make YOLO11 perfect for edge AI deployments on devices like Raspberry Pi or NVIDIA Jetson platforms.
  • 복잡한 파이프라인: 프로젝트가 객체 탐지와 자세 키포인트(예: 스포츠 분석) 또는 정밀한 인스턴스 분할(예: 의료 영상)을 결합해야 하는 경우, YOLO11은 단일 통합 API를 통해 모든 작업을 기본적으로 처리합니다.

Link to this section활용 사례 및 권장 사항#

YOLO11과 YOLOX 중 무엇을 선택할지는 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

Link to this sectionYOLO11을 선택해야 할 때#

YOLO11은 다음에 강력히 추천합니다:

  • 프로덕션 엣지 배포: 신뢰성과 활발한 유지 관리가 가장 중요한 Raspberry Pi 또는 NVIDIA Jetson과 같은 디바이스에서의 상업용 애플리케이션.
  • 다중 작업 비전 애플리케이션: 단일 통합 프레임워크 내에서 detection, segmentation, pose estimationOBB가 필요한 프로젝트.
  • 신속한 프로토타이핑 및 배포: 간소화된 Ultralytics Python API를 사용하여 데이터 수집에서 프로덕션 단계까지 빠르게 이동해야 하는 팀.

Link to this sectionYOLOX를 선택해야 할 때#

YOLOX는 다음 경우에 권장됩니다:

  • 앵커 프리 탐지 연구: YOLOX의 깔끔하고 앵커 프리인 아키텍처를 새로운 탐지 헤드나 손실 함수 실험의 기본 모델로 사용하는 학술 연구.
  • 초경량 에지 장치: YOLOX-Nano 변형의 매우 작은 풋프린트(0.91M 파라미터)가 필수적인 마이크로컨트롤러나 레거시 모바일 하드웨어에 배포하는 경우.
  • SimOTA 라벨 할당 연구: 최적 운송 기반의 라벨 할당 전략과 그것이 학습 수렴에 미치는 영향을 조사하는 연구 프로젝트.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this section미래를 바라보며: YOLO26의 힘#

YOLO11은 탁월한 선택이지만 AI 환경은 지속적으로 가속화되고 있습니다. 최고의 효율성과 안정성을 추구하는 팀에게는 2026년 1월에 출시된 **YOLO26**을 새로운 컴퓨터 비전 프로젝트를 위한 궁극적인 권장 사항으로 제안합니다.

YOLO26은 종단간(End-to-End) NMS-Free 설계를 구현함으로써 엄청난 도약을 이루었습니다. 비최대 억제(NMS) 후처리를 제거하여 대기 시간의 변동성을 완전히 없애고 배포 논리를 획기적으로 단순화했으며, 이는 YOLOv10에서 처음 개척된 개념입니다.

또한 YOLO26은 DFL 제거(Distribution Focal Loss) 기능을 갖추어 아키텍처를 최적화함으로써 최대 43% 더 빠른 CPU 추론을 달성하여 저전력 및 엣지 장치를 위한 최고의 챔피언이 되었습니다. 또한 SGD와 Muon을 결합하여 수렴을 가속화하는 LLM 기반 하이브리드 최적화 도구인 MuSGD Optimizer를 통해 학습 안정성이 대폭 강화되었습니다. ProgLoss + STAL과 같은 고급 손실 함수와 결합된 YOLO26은 드론 영상 및 IoT 엣지 센서와 같은 도전적인 환경에서 작은 객체를 탐지하는 데 탁월합니다.

추가 탐색

객체 탐지 아키텍처에 대한 지식을 넓히고 싶으신가요? YOLO-World의 개방형 어휘 기능을 탐색하거나 Ultralytics 생태계에 문서화된 트랜스포머 기반 RT-DETR 모델을 살펴보시기 바랍니다.

결론적으로, YOLOX가 2021년에 중요한 아키텍처 개념을 도입했지만, YOLO11의 포괄적인 툴셋, 메모리 효율성 및 최첨단 성능, 그리고 무엇보다 YOLO26의 혁신적인 아키텍처는 오늘날 연구원과 기업 개발자들에게 Ultralytics 생태계를 확실한 선택지로 만들어 줍니다.

댓글