콘텐츠로 건너뛰기

YOLO26 대 YOLOv10: 종단간 객체 탐지 모델 비교

컴퓨터 비전 분야는 더 빠르고 정확하며 효율적인 모델에 대한 수요에 힘입어 끊임없이 진화하고 있습니다. 본 가이드는 실시간 객체 탐지 분야에서 두 가지 획기적인 아키텍처인 YOLO26과 YOLOv10. 두 아키텍처의 구조, 성능 지표 및 배포 능력을 분석함으로써 개발자와 연구자가 비전 애플리케이션에 최적의 모델을 선택할 수 있도록 돕는 것이 목표입니다.

NMS 아키텍처의 진화

수년간 YOLO You Only Look Once) 계열은 후처리 과정에서 중복 경계 상자를 걸러내기 위해 비최대 억제(NMS) 에 크게 의존해 왔습니다. 효과적이긴 하지만, NMS 추론 지연 시간을 NMS 라즈베리 파이 같은 에지 디바이스나 전용 신경망 처리 장치(NPU)에의 배포를 복잡하게 만듭니다.

YOLOv10 등장은 엔드투엔드 NMS 프리 설계를 선도함으로써 패러다임 전환을 YOLOv10 . 이러한 기초적인 돌파구를 바탕으로, Ultralytics 생산 환경을 위한 아키텍처를 정교화하여 더 다양한 작업에서 전례 없는 효율성과 사용 편의성을 달성했습니다.

후처리 병목 현상

NMS 하드웨어 가속기(예: TensorRTOpenVINO.

YOLOv10: 선구적인 NMS 탐지

날짜: 2024-05-23
저자: 왕아오(Ao Wang), 천후이(Hui Chen), 류리하오(Lihao Liu) 외
소속 기관:칭화대학교(Tsinghua University)
자료:ArXiv 논문 | GitHub 저장소

칭화대학교 연구진이 개발한 YOLOv10 NMS(노드 매칭 서비서)의 필요성을 제거하기 위해 일관된 이중 할당 전략을 YOLOv10 . 효율성과 정확도를 종합적으로 고려한 모델 설계를 통해 계산적 중복을 줄이면서도 강력한 mAP 평균 정밀도)를 유지했습니다.

강점:

  • NMS 아키텍처: YOLO NMS 설계의 원조 선구자로서, 실시간 애플리케이션의 지연 시간을 획기적으로 줄입니다.
  • 효율성: 이전 세대 모델에 비해 매개변수 수와 추론 속도 사이에서 강력한 절충점을 제공합니다.

약점:

  • 제한된 작업 지원: 주로 표준 객체 탐지에 초점을 맞추고 있으며, 분할이나 자세 추정과 같은 고급 작업에 대한 기본적인 지원이 부족합니다.
  • 학술적 초점: 코드베이스는 견고하지만, 효율적이고 기업 수준의 생산 환경 배포보다는 연구 목적에 더 중점을 두고 있습니다.

10에 대해 자세히 알아보기

YOLO26: 엣지와 클라우드를 위한 새로운 표준

날짜: 2026-01-14
저자: Glenn Jocher 및 Jing Qiu
기관:Ultralytics
자료:GitHub 저장소 | Ultralytics

다음의 후속작으로 출시됨 YOLO11의 후속작으로 출시된 YOLO26은 NMS 없는 개념을 궁극적으로 실현합니다. 이 모델은 고도로 최적화된 Ultralytics 엔드투엔드 감지 기능을 기본적으로 통합하여 현대적인 머신러닝 파이프라인을 위한 완벽한 도구 모음을 제공합니다.

YOLO26은 여러 가지 아키텍처적 혁신을 도입합니다:

  • DFL 제거: 분포 초점 손실(Distribution Focal Loss)이 완전히 제거되었습니다. 이로 인해 모델 내보내기 과정이 획기적으로 간소화되었으며, 에지 및 저전력 장치와의 호환성이 향상되었습니다.
  • 최대 43% 빠른 CPU : DFL 제거 및 구조적 최적화 덕분에 YOLO26은 CPU에서 훨씬 더 빠르게 작동하여 IoT 및 모바일 배포에 이상적입니다.
  • MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련 기법(예: Moonshot AI의 Kimi K2)에서 영감을 얻은 YOLO26은 SGD 의 하이브리드 방식을 활용합니다. 이는 컴퓨터 비전 분야에 비교할 수 없는 훈련 안정성과 더 빠른 수렴 속도를 제공합니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 항공 촬영 및 드론 기반 보안 감시에 중요한 소형 물체 인식에서 현저한 개선 효과를 보여줍니다.
  • 작업별 개선 사항: YOLO26은 단순한 탐지기가 아닙니다. 세분화를 위한 의미적 분할 손실 및 다중 스케일 프로토타입, 자세 추정을 위한 잔차 로그 가능도 추정(RLE), 방향성 바운딩 박스(OBB)를 위한 특수 각도 손실을 특징으로 합니다.

YOLO26에 대해 더 알아보기

성능 분석 및 지표

다음 표는 YOLO26과 YOLOv10 COCO 성능을 비교합니다. YOLO26이 탁월한 매개변수 효율성을 유지하면서도 우수한 정확도를 달성하는 점을 주목하십시오.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Ultralytics : 훈련 및 메모리 효율성

모델을 프로덕션에 배포할 때 메모리 요구사항과 훈련 효율성은 추론 속도만큼 중요합니다. Ultralytics , 특히 YOLO26은 훈련 중 CUDA 사용량을 줄이기 위해 고도로 최적화되어 있습니다. 이를 통해 개발자는 소비자용 GPU에서 더 큰 배치 크기를 사용할 수 있어 훈련 시간과 계산 비용을 획기적으로 절감할 수 있습니다. 반대로, 복잡한 아키텍처나 RT-DETR 와 같은 복잡한 아키텍처나 무거운 트랜스포머 모델은 효과적인 훈련을 위해 고가의 고급 하드웨어가 필요한 경우가 많습니다.

지속적 통합과 생태계

YOLO26을 선택할 때의 가장 큰 장점 중 하나는 잘 관리되는 Ultralytics 통합입니다. 데이터 주석 작업부터 실험 추적에 이르기까지, 이 플랫폼은 머신러닝 엔지니어가 필요로 하는 모든 것을 하나의 통합된 환경에서 제공합니다.

실용적 구현: 코드 예시

Ultralytics 핵심 특징은 업계 최고의 사용 편의성입니다. 직관적인 Python 통해 YOLOv8 에서 최신 YOLOv26으로의 마이그레이션은 단 한 줄의 코드만 업데이트하면 됩니다.

다음은 YOLO26을 사용하여 훈련 및 추론을 수행하는 방법을 보여주는 100% 실행 가능한 예시입니다:

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

사용 사례 및 권장 사항

YOLO26과 YOLOv10 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 YOLOv10 .

YOLO26을 선택해야 할 때

YOLO26은 다음에 대한 강력한 선택입니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

10 선택해야 할 때

YOLOv10 다음에 YOLOv10 :

  • NMS 실시간 감지: 비최대 억제(NMS) 없이 종단 간 감지의 이점을 제공하는 애플리케이션으로, 배포 복잡성을 줄입니다.
  • 균형 잡힌 속도-정확도 절충점: 다양한 모델 규모에 걸쳐 추론 속도와 탐지 정확도 간의 강력한 균형이 요구되는 프로젝트들.
  • 일관된 지연 시간 애플리케이션: 로봇 공학 이나 자율 시스템과 같이 예측 가능한 추론 시간이 중요한 배포 시나리오.

결론

YOLOv10 NMS 패러다임을 도입하여 학계에 상당한 기여를 YOLOv10 반면, YOLO26은 이 기술을 기업 수준의 준비 상태로 끌어올렸습니다. CPU 43%라는 놀라운 향상률, 혁신적인 MuSGD 최적화기, 그리고 비전 작업 전반에 걸친 탁월한 다용도성을 바탕으로 YOLO26은 엣지 컴퓨팅과 대규모 클라우드 배포 모두에 있어 궁극적인 선택으로 두각을 나타냅니다.

활발한 커뮤니티, 포괄적인 문서화, 마찰 없는 개발자 경험을 최우선으로 하는 팀에게 Ultralytics 타의 추종을 불허합니다. 특수한 시나리오용 모델을 탐색 중이라면 제로샷 오픈 어휘물체탐지를 위한 YOLO 검토해 볼 만합니다. 그러나 실제 사용 사례의 압도적 다수에는 YOLO26이 확실한 추천 모델입니다.


댓글