Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX 대 YOLOv7#

실시간 객체 탐지의 발전은 지속적인 아키텍처 혁신에 의해 주도되었습니다. 이 과정에서의 두 가지 중요한 이정표가 바로 YOLOXYOLOv7입니다. 1년 간격으로 출시된 두 모델은 모두 표준 객체 탐지 패러다임에 새로운 접근 방식을 도입하여 속도와 정확도 간의 균형을 크게 향상시켰습니다.

이 페이지는 YOLOX와 YOLOv7에 대한 심층적인 기술 분석을 제공하며, 개발자가 컴퓨터 비전 배포를 위해 적절한 도구를 선택할 수 있도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 비교합니다.

Link to this sectionYOLOX: 앵커 프리(Anchor-Free) 탐지의 선구자#

2021년 7월 Megvii 연구원들이 발표한 YOLOX는 기존의 앵커 기반 설계에서 벗어난 주요한 전환점을 제시했습니다. 학술 연구와 산업적 응용 간의 간극을 메움으로써, YOLOX는 탐지 헤드를 단순화하고 전반적인 성능을 향상시켰습니다.

주요 모델 세부 정보:

Link to this section아키텍처 혁신#

YOLOX는 앵커 프리(anchor-free) 접근 방식을 도입하여 커스텀 데이터셋에 필요한 설계 매개변수와 휴리스틱 튜닝의 수를 획기적으로 줄였습니다. 이 모델은 분류 및 회귀 작업을 분리하는 디커플드 헤드(decoupled head)를 구현하여 수렴 속도와 정확도를 향상시켰습니다. 또한, YOLOX는 모델의 견고성을 높이기 위해 MixUp 및 Mosaic과 같은 고급 데이터 증강 전략을 활용했습니다.

YOLOX에 대해 더 알아보기

앵커 프리(Anchor-Free)의 이점

앵커 박스를 제거함으로써 YOLOX는 학습 중 예측값과 정답 간의 IoU(Intersection over Union)를 계산하는 데 따르는 계산 오버헤드를 줄였으며, 결과적으로 CUDA 메모리 요구 사항이 낮아지고 학습 시간이 단축되었습니다.

Link to this sectionYOLOv7: Trainable Bag-of-Freebies#

2022년 7월 대만 중앙연구원 정보과학연구소 연구원들이 발표한 YOLOv7은 실시간 객체 탐지의 한계를 더욱 넓혔습니다. 이 모델은 "학습 가능한 백 오브 프리비스(trainable bag-of-freebies)"라는 개념을 도입하여 출시 당시 MS COCO 데이터셋에서 새로운 최고 성능을 기록했습니다.

주요 모델 세부 정보:

Link to this section아키텍처 혁신#

YOLOv7의 아키텍처는 E-ELAN(Extended Efficient Layer Aggregation Network)을 중심으로 구축되었으며, 이를 통해 모델은 그래디언트 경로를 저하시키지 않으면서 더 다양한 특징을 지속적으로 학습할 수 있습니다. 또한, YOLOv7은 모델 재매개변수화(re-parameterization) 기술을 활용하여 복잡한 다중 분기 학습 네트워크를 추론 중에 더 빠른 단일 경로 네트워크로 단순화할 수 있게 했습니다.

YOLOv7에 대해 더 알아보기

Link to this section성능 비교#

실제 애플리케이션에 이러한 모델을 평가할 때, 다양한 규모에서의 성능을 이해하는 것이 중요합니다. 아래 표는 YOLOX와 YOLOv7의 다양한 크기에 대한 표준 지표를 비교합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Link to this section분석#

  • 정확도: YOLOv7은 일반적으로 동급 YOLOX 모델보다 더 높은 mAP를 달성합니다. 예를 들어, YOLOv7x는 53.1 mAP를 달성하는 반면, YOLOXx는 51.1 mAP를 기록합니다.
  • 속도: 두 모델 모두 TensorRT를 사용하여 GPU 실행에 최적화되어 있지만, YOLOv7의 E-ELAN 아키텍처는 하이엔드 애플리케이션에서 약간 더 나은 처리량을 제공합니다. 반면 YOLOX는 소형 엣지 장치에서 뛰어난 지연 시간을 유지합니다.
  • 범용성: YOLOv7은 인스턴스 분할포즈 추정을 위한 가중치를 기본적으로 제공함으로써 바운딩 박스를 넘어 그 범위를 확장했으며, 결과적으로 기본 YOLOX 저장소보다 더 범용적입니다.

Link to this section실제 활용 사례#

이 모델들 사이에서 선택하는 것은 종종 사용자의 구체적인 배포 환경에 달려 있습니다.

Link to this section엣지 컴퓨팅 및 IoT#

Raspberry Pi 또는 구형 모바일 프로세서와 같은 제약이 있는 엣지 장치에는 YOLOX-NanoYOLOX-Tiny가 매우 매력적입니다. 이 모델들은 매개변수 수가 적고 앵커 프리(anchor-free) 특성을 갖추고 있어 기본 모션 추적이나 스마트 초인종 애플리케이션과 같은 저전력 환경에서 쉽게 배포할 수 있습니다.

Link to this section고성능 비디오 분석#

산업용 결함 탐지나 밀집된 교통 모니터링에서 고해상도 피드를 처리해야 할 경우, YOLOv7이 더 우수합니다. 강력한 특징 집계 기능을 통해 객체가 부분적으로 가려져 있거나 규모가 크게 변하더라도 높은 정확도를 유지할 수 있습니다.

Link to this section활용 사례 및 권장 사항#

YOLOX와 YOLOv7 중 하나를 선택하는 것은 특정 프로젝트의 요구 사항, 배포 제약 조건 및 에코시스템 선호도에 따라 달라집니다.

Link to this sectionYOLOX를 선택해야 할 때#

YOLOX는 다음과 같은 경우에 강력한 선택입니다:

  • 앵커 프리 탐지 연구: YOLOX의 깔끔하고 앵커 프리인 아키텍처를 새로운 탐지 헤드나 손실 함수 실험의 기본 모델로 사용하는 학술 연구.
  • 초경량 에지 장치: YOLOX-Nano 변형의 매우 작은 풋프린트(0.91M 파라미터)가 필수적인 마이크로컨트롤러나 레거시 모바일 하드웨어에 배포하는 경우.
  • SimOTA 라벨 할당 연구: 최적 운송 기반의 라벨 할당 전략과 그것이 학습 수렴에 미치는 영향을 조사하는 연구 프로젝트.

Link to this sectionYOLOv7을 선택해야 하는 경우#

YOLOv7은 다음 상황에 권장됩니다:

  • 학술 벤치마킹: 2022년 시대의 최첨단 결과를 재현하거나 E-ELAN 및 학습 가능한 bag-of-freebies 기술의 효과를 연구할 때.
  • 재매개변수화 연구: 계획된 재매개변수화 컨볼루션 및 복합 모델 스케일링 전략을 조사할 때.
  • 기존 사용자 정의 파이프라인: 쉽게 리팩토링할 수 없는 YOLOv7의 특정 아키텍처를 중심으로 구축된 고도로 사용자 정의된 파이프라인을 가진 프로젝트.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this sectionUltralytics의 장점#

YOLOX와 YOLOv7 모두 강력한 연구 구현물이지만, 연구용 저장소에서 확장 가능한 프로덕션 환경으로 전환하는 것은 어려울 수 있습니다. 이때 Ultralytics 플랫폼이 빛을 발합니다.

Ultralytics 모델은 통합 Python API를 제공하여 모델 학습, 검증 및 배포를 간소화된 표준 작업으로 처리합니다. 이를 통해 기존의 복잡한 타사 종속성이나 구형 아키텍처에서 흔히 사용되는 커스텀 C++ 연산자를 관리해야 하는 번거로움을 피할 수 있습니다.

또한 Ultralytics YOLO 모델은 RT-DETR과 같은 트랜스포머 기반 탐지기보다 학습 중 훨씬 적은 CUDA 메모리를 필요로 합니다. 덕분에 사용자는 더 큰 배치 크기를 활용하여 학습을 안정화하고 커스텀 데이터셋에서의 수렴 속도를 가속화할 수 있습니다.

지원되는 통합

Ultralytics는 간단한 부울 플래그만으로 ONNX, OpenVINO, CoreML과 같은 업계 표준 형식으로 모델을 내보내는 기능을 기본적으로 지원하며, 이를 통해 모델 배포 프로세스를 크게 간소화합니다.

Link to this section코드 예제: Ultralytics를 사용한 학습#

Ultralytics 에코시스템을 사용하면 단 몇 줄의 코드로 YOLOv7이나 최신 아키텍처를 쉽게 로드하고 학습하며 추론을 실행할 수 있습니다.

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on a custom dataset (e.g., COCO8)
# The API handles data loading, augmentation, and memory management automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image
predictions = model("path/to/image.jpg")
predictions[0].show()

Link to this section미래: Ultralytics YOLO26#

YOLOv7과 YOLOX가 중요한 역사적 단계를 나타내지만, 최첨단 기술은 빠르게 변합니다. 2026년 1월에 출시된 Ultralytics YOLO26은 이전 모델들을 대체하는 획기적인 패러다임을 도입했습니다.

YOLO26에 대해 자세히 알아보기

  • End-to-End NMS-Free Design: YOLO26 natively eliminates Non-Maximum Suppression (NMS) post-processing. This drastically reduces latency bottlenecks and guarantees deterministic execution times across varied hardware setups.
  • CPU 추론 속도 최대 43% 향상: DFL(Distribution Focal Loss)을 제거하고 네트워크 깊이를 최적화함으로써, YOLO26은 전용 GPU 하드웨어가 없는 엣지 장치에 최적화되었습니다.
  • MuSGD 옵티마이저: 고급 LLM 학습 기술에서 영감을 받은 MuSGD 옵티마이저(SGD와 Muon의 하이브리드)는 탁월한 학습 안정성과 더 빠른 수렴을 제공합니다.
  • 소형 객체 탐지 개선: ProgLoss + STAL 손실 함수의 통합은 드론 매핑 및 보안 감시에 필수적인 작고 먼 거리의 객체를 인식하는 능력을 크게 향상시킵니다.
  • 네이티브 작업 지원: YOLO26은 동일한 간소화된 API 내에서 OBB(Oriented Bounding Boxes), 인스턴스 분할 및 포즈 추정을 종합적으로 지원합니다.

오늘날 새로운 컴퓨터 비전 프로젝트를 시작하는 현대적인 개발자에게는 플랫폼에서 Ultralytics YOLO26을 평가하는 것이 속도, 정확도 및 배포 용이성 간의 최상의 균형을 달성하기 위한 권장 경로입니다. YOLO11이나 YOLOv8과 같은 이전 세대에서 업그레이드하는 경우, 모델 문자열만 변경하면 즉시 우수한 기능을 활용할 수 있습니다.

댓글