Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 대 YOLOv7#

실시간 컴퓨터 비전의 발전은 아키텍처 효율성과 학습 방법론의 빠른 진보와 함께 이루어졌습니다. 이 분야에 큰 영향을 미친 두 가지 주요 모델은 YOLOv6-3.0YOLOv7입니다. 두 프레임워크 모두 추론 속도와 탐지 정확도 사이의 균형을 맞추기 위해 새로운 기술을 도입했으며, 고성능 서버 GPU부터 엣지 디바이스에 이르는 다양한 배포 환경을 목표로 합니다.

본 포괄적인 기술 비교에서는 두 모델의 아키텍처, 성능 지표, 이상적인 사용 사례를 살펴봅니다. 아울러 현대적인 Ultralytics Platform과 최신 YOLO26 모델이 이러한 기초 개념을 어떻게 발전시켜 독보적인 개발자 경험을 제공하는지 강조합니다.

Link to this sectionYOLOv6-3.0: 산업용 처리량 최적화#

Meituan의 Vision AI 부서에서 개발한 YOLOv6-3.0은 고처리량 산업용 애플리케이션을 위해 명시적으로 설계되었습니다. 하드웨어 가속기에서의 성능 극대화에 중점을 두고 있어, 전용 GPU에서 배치 처리가 가능한 환경에 매우 적합합니다.

  • 저자: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, Xiangxiang Chu
  • 조직: Meituan
  • 날짜: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Link to this section아키텍처 혁신#

YOLOv6-3.0은 GPU에서의 메모리 액세스 비용을 최적화하도록 설계된 하드웨어 친화적 아키텍처인 EfficientRep 백본에 의존합니다. 서로 다른 스케일 간의 특징 융합을 향상하기 위해, 이 모델은 넥(neck) 부분에 Bi-directional Concatenation (BiC) 모듈을 도입했습니다. 이를 통해 네트워크는 이전 반복 모델보다 복잡한 공간 계층 구조를 더 효과적으로 캡처할 수 있습니다.

또한 YOLOv6-3.0은 Anchor-Aided Training (AAT) 전략을 구현합니다. 이 접근 방식은 앵커 기반 학습의 풍부한 그래디언트 신호와 앵커 프리 추론의 간소화된 배포 이점을 결합하여, 후처리 속도를 희생하지 않으면서도 모델이 더 안정적으로 수렴하도록 돕습니다.

YOLOv6에 대해 더 알아보기

하드웨어 고려 사항

YOLOv6-3.0은 (NVIDIA T4와 같은) 서버급 GPU에서 뛰어난 성능을 발휘하지만, 특정 구조적 재매개변수화(structural re-parameterization)에 대한 의존도가 높아 CPU 기반 엣지 디바이스에서는 최신 아키텍처에 비해 지연 시간이 최적화되지 못할 때가 있습니다.

Link to this sectionYOLOv7: Bag-of-Freebies의 선구자#

Academia Sinica 연구원들이 발표한 YOLOv7은 추론 비용을 증가시키지 않는 그래디언트 경로 분석과 학습 시간 최적화에 중점을 두어 다른 접근 방식을 취했습니다. 저자들은 이를 "학습 가능한 프리비(trainable bag-of-freebies)"라는 개념으로 명명했습니다.

  • 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
  • 조직: 대만 Academia Sinica, 정보과학 연구소
  • 날짜: 2022-07-06
  • Arxiv: 2207.02696
  • GitHub: WongKinYiu/yolov7

Link to this section아키텍처 혁신#

YOLOv7의 핵심은 **Extended Efficient Layer Aggregation Network (E-ELAN)**입니다. E-ELAN은 원래의 네트워크 토폴로지를 방해하지 않으면서 여러 레이어가 더 다양한 특징을 학습할 수 있도록 하여 그래디언트 경로를 최적화합니다. 그 결과, 평균 정밀도(mAP)에서 최상위 수준을 달성할 수 있는 고성능 모델이 탄생했습니다.

또한 YOLOv7은 모델 재매개변수화를 광범위하게 활용하여, 추론 중에 합성곱 계층을 배치 정규화와 병합합니다. 이를 통해 NVIDIA TensorRTONNX와 같은 프레임워크를 사용하여 배포할 때 파라미터 수를 줄이고 포워드 패스 속도를 향상합니다.

YOLOv7에 대해 더 알아보기

Link to this section성능 비교#

MS COCO 데이터셋에서 이 모델들을 평가할 때, YOLOv6의 초경량 변형 모델들과 정확도에 중점을 둔 파라미터가 많은 YOLOv7 아키텍처 간의 뚜렷한 상충 관계를 확인할 수 있습니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

데이터에 따르면 YOLOv6-3.0n은 탁월한 추론 속도를 제공하여 고주파수 비디오 분석에 적합합니다. 반면, YOLOv7x는 가장 높은 mAP를 달성하여 원시 프레임 속도보다 탐지 정확도가 중요한 작업에서 압도적인 성능을 보입니다.

Link to this section활용 사례 및 권장 사항#

YOLOv6와 YOLOv7 중 하나를 선택하는 것은 특정 프로젝트 요구 사항, 배포 제약 조건, 그리고 생태계 선호도에 따라 달라집니다.

Link to this sectionYOLOv6을 선택해야 하는 경우#

YOLOv6은 다음과 같은 경우에 강력한 선택지입니다:

  • 산업용 하드웨어 인식 배포: 모델의 하드웨어 인식 설계와 효율적인 재파라미터화가 특정 타겟 하드웨어에서 최적화된 성능을 제공하는 시나리오.
  • 빠른 단일 스테이지 탐지: 통제된 환경에서 실시간 비디오 처리를 위해 GPU에서의 원시 추론 속도를 우선시하는 애플리케이션.
  • Meituan 생태계 통합: 이미 Meituan의 기술 스택 및 배포 인프라 내에서 작업 중인 팀.

Link to this sectionYOLOv7을 선택해야 하는 경우#

YOLOv7은 다음 상황에 권장됩니다:

  • 학술 벤치마킹: 2022년 시대의 최첨단 결과를 재현하거나 E-ELAN 및 학습 가능한 bag-of-freebies 기술의 효과를 연구할 때.
  • 재매개변수화 연구: 계획된 재매개변수화 컨볼루션 및 복합 모델 스케일링 전략을 조사할 때.
  • 기존 사용자 정의 파이프라인: 쉽게 리팩토링할 수 없는 YOLOv7의 특정 아키텍처를 중심으로 구축된 고도로 사용자 정의된 파이프라인을 가진 프로젝트.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this sectionUltralytics의 이점: 미래로 나아가다#

YOLOv6-3.0과 YOLOv7이 중요한 이정표를 세웠지만, 서로 다른 저장소를 프로덕션 파이프라인에 통합하는 작업은 종종 모델 배포 및 하이퍼파라미터 튜닝 측면에서 문제를 야기합니다. Ultralytics 생태계는 간소화된 통합 인터페이스를 제공하여 이러한 번거로움을 해결합니다.

Link to this section왜 Ultralytics를 선택해야 할까요?#

  • 사용 편의성: Ultralytics Python API를 통해 개발자는 몇 줄의 코드만으로 모델을 로드, 학습 및 내보내기 할 수 있습니다. 이전 모델에서 최신 아키텍처로 변경하는 작업도 단 하나의 문자열만 수정하면 됩니다.
  • 잘 관리된 생태계: Ultralytics는 빈번한 업데이트, 활발한 커뮤니티 지원, 그리고 강력한 문서를 제공합니다.
  • 범용성: 주로 바운딩 박스에 초점을 맞췄던 이전 모델들과 달리, Ultralytics 모델은 인스턴스 분할, 자세 추정, 회전된 바운딩 박스(OBB)를 포함한 다중 작업 학습을 기본적으로 지원합니다.
  • 메모리 요구 사항: Ultralytics YOLO 모델은 RT-DETR과 같은 Transformer 기반 아키텍처보다 학습 중 메모리 사용량이 낮아, 연구자들이 소비자용 하드웨어에서도 효과적으로 학습할 수 있습니다.

Link to this sectionYOLO26으로 업그레이드#

최고의 성능을 추구하는 개발자를 위해 2026년 1월에 출시된 YOLO26객체 탐지의 패러다임을 근본적으로 바꿉니다. 이 모델은 완벽한 엔드투엔드 NMS-Free 설계를 도입하여 복잡한 후처리 로직을 제거하고 엣지 디바이스에서의 지연 시간 편차를 크게 줄였습니다.

YOLO26의 주요 혁신은 다음과 같습니다:

  • MuSGD 옵티마이저: SGD와 Muon의 정교한 하이브리드 조합으로, 놀라울 정도로 안정적인 학습 동역학과 더 빠른 수렴을 보장합니다.
  • DFL 제거: Distribution Focal Loss를 제거함으로써 YOLO26은 내보내기 호환성을 단순화하고 저전력 디바이스에서의 성능을 향상합니다.
  • ProgLoss + STAL: 소형 객체 인식에서 현저한 개선을 가져오는 고급 손실 함수입니다.
  • 독보적인 속도: 이전 세대 대비 최대 43% 더 빠른 CPU 추론 속도를 달성하여 Raspberry PiApple CoreML 배포와 같은 임베디드 시스템에 최적입니다.

생태계 내의 다른 강력한 모델로는 YOLO11YOLOv8이 있으며, 이 두 모델 모두 레거시 하드웨어 통합을 위해 우수한 성능 균형을 제공합니다.

파이프라인의 미래 대비

컴퓨터 비전 애플리케이션을 Ultralytics Platform 위에 구축하면, 데이터셋 로더나 배포 스크립트를 다시 작성할 필요 없이 향후 등장할 최첨단 모델을 즉시 활용할 수 있습니다.

Link to this section코드 예제: 간소화된 학습#

다음 코드는 Ultralytics API를 사용하여 최첨단 YOLO26 모델을 얼마나 쉽게 학습할 수 있는지 보여줍니다. 이와 동일한 워크플로가 YOLO11이나 YOLOv8에도 매끄럽게 적용되며, 구형 저장소에서 일반적으로 요구되는 상용구 코드(boilerplate code)를 제거해 줍니다.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model for rapid training
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The API handles dataset downloading, augmentation, and hyperparameter configuration
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cuda:0",  # Automatically utilizes PyTorch GPU acceleration
)

# Run an end-to-end, NMS-free inference on a test image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for cross-platform deployment
model.export(format="onnx")

Link to this section결론#

YOLOv6-3.0과 YOLOv7은 실시간 탐지 과제의 서로 다른 측면을 성공적으로 해결했습니다. YOLOv6-3.0은 특수 산업용 GPU 환경을 위한 강력한 도구이며, YOLOv7은 철저한 그래디언트 경로 최적화를 통해 높은 정확도를 제공합니다.

하지만 독보적인 범용성, 최소한의 배포 마찰, 그리고 최첨단 성능을 요구하는 현대적인 애플리케이션에는 Ultralytics YOLO26이 단연 최고의 선택입니다. NMS-free 아키텍처, 고급 MuSGD 옵티마이저, 그리고 Ultralytics Platform과의 심층적인 통합은 개발자들이 강력하고 확장 가능한 비전 AI 솔루션을 그 어느 때보다 빠르게 배포할 수 있도록 보장합니다.

댓글