Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 대 YOLOv10#

컴퓨터 비전 분야는 지난 몇 년간 놀라운 발전을 이루었으며, YOLO(You Only Look Once) 모델 제품군이 실시간 객체 탐지 분야를 선도하고 있습니다. 컴퓨터 비전 프로젝트를 위해 올바른 아키텍처를 선택하려면 사용 가능한 옵션에 대한 깊은 이해가 필요합니다. 이 종합적인 기술 비교에서는 두 가지 랜드마크 아키텍처인 YOLOv7YOLOv10의 주요 차이점을 살펴보겠습니다.

Link to this section모델 소개#

두 모델 모두 인공지능 역사에서 중요한 이정표를 나타내지만, 객체 탐지의 문제를 해결하는 방식에는 근본적인 차이가 있습니다.

Link to this sectionYOLOv7: Bag-of-Freebies의 선구자#

대만 중앙연구원 정보과학연구소의 연구원 Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao가 2022년 7월 6일에 발표한 YOLOv7은 신경망 최적화 방식의 패러다임 전환을 가져왔습니다. 이들의 학술 논문공식 GitHub 저장소에 상세히 설명된 원본 연구는 아키텍처 재매개변수화와 학습 가능한 "bag-of-freebies"에 집중했습니다.

YOLOv7은 확장 효율적 계층 집계 네트워크(E-ELAN)를 활용하여 원래의 그래디언트 경로를 손상시키지 않으면서 네트워크가 다양한 특징을 학습하도록 안내합니다. 이로 인해 학술 연구 벤치마크와 표준 고성능 GPU에 크게 의존하는 시스템에 적합한 강력한 선택지가 되었습니다.

YOLOv7에 대해 더 알아보기

Link to this sectionYOLOv10: 실시간 종단간(End-to-End) 탐지#

칭화대학교의 Ao Wang 연구팀이 개발한 YOLOv10은 2024년 5월 23일에 공개되었습니다. arxiv 논문칭화대학교 GitHub 저장소에 상세히 설명된 바와 같이, 이 모델은 객체 탐지의 오랜 병목 현상이었던 비최대 억제(NMS)를 제거했습니다.

YOLOv10은 NMS 없는 학습을 위한 일관된 이중 할당 방식을 도입하여 후처리 파이프라인을 근본적으로 변경했습니다. 전체적인 효율성 및 정확도 중심의 모델 설계 전략을 적용함으로써, YOLOv10은 연산 중복을 줄였습니다. 그 결과 매우 낮은 지연 시간을 요구하는 엣지 장치에 최적화된 아키텍처가 탄생했습니다.

YOLOv10에 대해 더 알아보기

NMS 없는 아키텍처

YOLOv10에서 비최대 억제(NMS)를 제거함으로써 전체 모델을 단일 연산 그래프로 내보낼 수 있게 되었습니다. 이는 TensorRTOpenVINO와 같은 런타임을 사용한 배포를 크게 단순화합니다.

Link to this section성능 및 지표 비교#

모델 성능을 분석할 때는 정밀도, 속도, 연산 가중치 간의 트레이드오프를 평가하는 것이 중요합니다. 다음 표는 이러한 모델의 다양한 크기가 서로 어떻게 비교되는지 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Link to this section트레이드오프 분석#

위의 지표는 뚜렷한 세대 간 격차를 보여줍니다. YOLOv7x는 53.1%의 매우 강력한 mAPval을 제공하지만, 71.3M개의 파라미터와 189.9B FLOPs가 필요합니다. 반면, YOLOv10l은 53.3% mAP로 그보다 더 높은 정확도를 달성하면서도 파라미터는 절반 이하(29.5M), FLOPs는 훨씬 적게(120.3B) 요구합니다. 또한 고도로 최적화된 YOLOv10n은 1.56ms라는 놀라운 추론 속도를 제공하여 실시간 영상 분석 및 모바일 애플리케이션에 이상적입니다.

Link to this section실제 활용 사례#

이들 모델 간의 아키텍처 차이는 최적의 사용 사례를 결정짓습니다.

Link to this sectionYOLOv7을 활용해야 하는 경우#

풍부한 특징 표현력 덕분에 YOLOv7은 매우 복잡한 환경에서 뛰어난 성능을 발휘합니다. 밀집된 도심 지역의 교통 흐름 모니터링, 위성 영상 분석 또는 제조 자동화 분야의 결함 식별과 같은 사례들은 그 견고한 구조적 재매개변수화로부터 이점을 얻습니다. 또한 특정 PyTorch 1.12 파이프라인과 이미 깊게 통합된 레거시 환경에서도 널리 선호됩니다.

Link to this sectionYOLOv10을 활용해야 하는 경우#

NMS가 없는 YOLOv10의 경량 설계는 제약이 있는 환경에서 빛을 발합니다. NVIDIA Jetson Nano나 Raspberry Pi와 같은 엣지 컴퓨팅 장치에 강력히 권장됩니다. 낮은 지연 시간 성능 덕분에 스포츠 분석, 자율 드론 내비게이션, 컨베이어 벨트에서의 고속 로봇 선별과 같은 빠르게 움직이는 애플리케이션에 완벽합니다.

Link to this sectionUltralytics 생태계의 이점#

두 모델 모두 강력한 학술적 뿌리를 가지고 있지만, 진정한 잠재력은 통합 Ultralytics Platform 내에서 활용될 때 발휘됩니다. 처음부터 컴퓨터 비전 모델을 개발하는 것은 매우 어렵지만, Ultralytics 생태계는 머신 러닝 엔지니어에게 타의 추종을 불허하는 경험을 제공합니다.

  • 사용 편의성: Ultralytics Python API는 통합된 인터페이스를 제공합니다. 몇 줄의 코드만으로 모델을 학습, 검증 및 내보내기할 수 있어, 일반적인 학술 저장소와 관련된 복잡한 의존성 문제를 피할 수 있습니다.
  • 잘 관리된 생태계: Ultralytics는 기반 코드가 활발히 개발됨을 보장합니다. 사용자는 로깅을 위한 Weights & Biases나 빠른 웹 데모를 위한 Hugging Face와 같은 인기 있는 ML 도구와의 원활한 통합을 누릴 수 있습니다.
  • 메모리 요구 사항: Transformer 기반 객체 탐지기는 학습 중에 막대한 양의 CUDA 메모리를 소비하는 경우가 많습니다. 반면, Ultralytics YOLO 모델은 훨씬 적은 메모리를 필요로 하여 소비자용 하드웨어에서도 훨씬 큰 배치 크기를 사용할 수 있습니다.
  • Versatility: The Ultralytics pipeline is not restricted to standard bounding boxes. It seamlessly supports pose estimation, instance segmentation, and oriented bounding boxes across supported model families like YOLO11 and YOLOv8.

Link to this section간소화된 학습 예제#

Ultralytics로 학습 파이프라인을 실행하는 것은 매우 간단합니다. YOLOv7의 역사적 견고함을 활용하든 YOLOv10의 NMS 없는 속도를 활용하든, 구문은 일관되게 유지됩니다.

from ultralytics import YOLO

# Load the preferred model (e.g., YOLOv10 Nano)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run an inference prediction on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to an edge-friendly format like ONNX
model.export(format="onnx")

Link to this section활용 사례 및 권장 사항#

YOLOv7과 YOLOv10 중에서 선택하는 것은 귀하의 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 달려 있습니다.

Link to this sectionYOLOv7을 선택해야 하는 경우#

YOLOv7은 다음과 같은 경우에 강력한 선택입니다:

  • 학술 벤치마킹: 2022년 시대의 최첨단 결과를 재현하거나 E-ELAN 및 학습 가능한 bag-of-freebies 기술의 효과를 연구할 때.
  • 재매개변수화 연구: 계획된 재매개변수화 컨볼루션 및 복합 모델 스케일링 전략을 조사할 때.
  • 기존 사용자 정의 파이프라인: 쉽게 리팩토링할 수 없는 YOLOv7의 특정 아키텍처를 중심으로 구축된 고도로 사용자 정의된 파이프라인을 가진 프로젝트.

Link to this sectionYOLOv10을 선택해야 할 때#

YOLOv10은 다음 상황에 권장됩니다:

  • NMS 없는 실시간 탐지: Non-Maximum Suppression 없이 엔드 투 엔드 탐지를 수행하여 배포 복잡성을 줄이는 애플리케이션.
  • 균형 잡힌 속도-정확도 트레이드오프: 다양한 모델 스케일 전반에서 추론 속도와 탐지 정확도 사이의 강력한 균형이 필요한 프로젝트.
  • 일관된 지연 시간 애플리케이션: 로봇 공학 또는 자율 시스템과 같이 예측 가능한 추론 시간이 중요한 배포 시나리오.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this section미래: YOLO26 소개#

YOLOv7과 YOLOv10이 인상적인 이정표이기는 하지만, AI의 개척지는 항상 진보하고 있습니다. 2026년 1월에 출시된 Ultralytics YOLO26은 모든 엣지 및 클라우드 배포 시나리오에서 효율성과 정확도에 대한 명실상부한 새로운 표준입니다.

오늘 새로운 컴퓨터 비전 프로젝트를 시작한다면 YOLO26 아키텍처를 권장합니다. 이는 몇 가지 혁신적인 기술을 통합하여 이전 모델의 유산을 계승합니다:

  • 엔드투엔드(End-to-End) NMS 없는 설계: YOLOv10에서 영감을 받은 YOLO26은 NMS 후처리를 기본적으로 제거하여 결정론적 실시간 로봇 공학을 위한 초저지연 추론을 보장합니다.
  • 최대 43% 더 빠른 CPU 추론: DFL(Distribution Focal Loss) 모듈을 전략적으로 제거함으로써, YOLO26은 GPU가 없는 엣지 컴퓨팅 하드웨어에서의 실행 속도를 획기적으로 가속화하여 IoT 장치의 강력한 엔진이 됩니다.
  • MuSGD 옵티마이저: 최근 대규모 언어 모델 학습 혁신에서 영감을 받은 YOLO26은 SGD와 Muon의 하이브리드 방식을 통합하여 학습 경로를 안정화하고 더 빠른 수렴을 보장합니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 소형 객체 인식에서 현저한 개선을 가져오며, 이전 YOLO 세대들의 고질적인 약점을 극복합니다.
  • 독보적인 범용성: YOLO26은 자세 추적을 위한 잔차 로그 우도 추정(RLE) 및 항공 이미지에서 정확한 OBB 탐지를 위한 특수 각도 손실과 같은 작업별 최적화 기능을 기본 제공합니다.

속도, 정확도 및 배포 단순성의 궁극적인 균형을 찾는 엔지니어에게 레거시 모델에서 YOLO26으로의 전환은 즉각적이고 측정 가능한 경쟁 우위를 제공합니다.

댓글