Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv8 대 YOLOv7#

컴퓨터 비전 분야는 끊임없이 진화하고 있으며, 새로운 아키텍처들이 실시간 객체 탐지 분야에서 가능한 영역을 확장하고 있습니다. 본 심층 분석에서는 매우 영향력 있는 두 모델인 Ultralytics YOLOv8YOLOv7을 비교합니다. 두 모델 모두 개발자 커뮤니티와 학계 연구에 상당한 영향을 미쳤으며, 복잡한 시각적 작업을 해결하기 위한 고유한 접근 방식을 제공합니다.

이 두 모델 간의 구조적, 방법론적 차이를 이해하는 것은 배포 파이프라인을 최적화하려는 머신러닝 엔지니어에게 매우 중요합니다. YOLOv7이 순수 처리량을 위해 맞춤화된 강력한 "bag-of-freebies" 접근 방식을 도입했다면, Ultralytics YOLOv8은 높은 정확도와 낮은 메모리 소비, 그리고 다중 작업 범용성 사이의 균형을 유지하는 사용하기 쉬운 통합 생태계를 구축하는 데 중점을 두었습니다.

Link to this sectionUltralytics YOLOv8: 범용 생태계 표준#

2023년 초 Ultralytics에서 출시한 YOLOv8은 이전 모델들과 비교하여 아키텍처 면에서 큰 변화를 나타냅니다. 단순한 실시간 객체 탐지기를 넘어 다양한 비전 작업을 즉시 처리할 수 있는 통합 프레임워크로 설계되었습니다.

Link to this section아키텍처 혁신#

YOLOv8은 혁신적인 anchor-free 탐지 헤드를 도입했습니다. 이는 사용자의 커스텀 데이터셋 분포에 따라 앵커 박스를 수동으로 설정할 필요를 없애 학습 과정을 근본적으로 단순화합니다. 이러한 설계 선택은 모델을 매우 견고하게 만들며 다양한 환경에서 더 쉽게 일반화할 수 있도록 합니다.

또한, 이 아키텍처는 C2f 모듈(두 개의 컨볼루션을 포함한 Cross-Stage Partial 병목 구조)을 특징으로 합니다. 이는 그래디언트 흐름을 개선하고 계산 비용을 크게 증가시키지 않으면서도 신경망이 더 풍부한 특징 표현을 학습할 수 있게 하는 구조적 업그레이드입니다. 덕분에 PyTorch와 같은 표준 딥러닝 프레임워크를 통해 추론을 실행할 때 모델의 효율성이 매우 뛰어납니다.

YOLOv8에 대해 더 알아보기

메모리 효율성

Ultralytics YOLO 모델은 최고의 학습 효율성을 위해 설계되었습니다. 일반적으로 트랜스포머 기반 아키텍처나 무거운 CNN과 비교하여 학습 시 훨씬 적은 CUDA 메모리를 필요로 합니다. 이를 통해 소비자용 하드웨어에서도 더 큰 배치 크기로 학습할 수 있어 개발 주기를 앞당길 수 있습니다.

Link to this sectionYOLOv7: "Bag-of-Freebies" 접근 방식#

YOLOv7은 2022년 중반에 도입되었으며 학계에서 빠르게 인기 있는 기준 모델로 자리 잡았습니다. 이 모델은 고성능 GPU에서 실시간 객체 탐지의 한계를 넓히기 위해 아키텍처 재매개변수화와 그래디언트 경로 최적화에 집중했습니다.

  • 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
  • 조직: 대만 중앙연구원 정보과학연구소
  • 날짜: 2022-07-06
  • Arxiv: 2207.02696
  • GitHub: WongKinYiu/yolov7

Link to this section아키텍처 혁신#

YOLOv7은 **E-ELAN(Extended Efficient Layer Aggregation Network)**을 채택하여 모델이 더 다양한 특징을 지속적으로 학습할 수 있도록 합니다. 이는 앵커 기반 패러다임에 크게 의존하며, 추론 비용을 늘리지 않고 정확도를 개선하는 일련의 최적화 방법인 학습 가능한 "bag-of-freebies"를 도입합니다.

MS COCO 데이터셋과 같은 표준 학술 벤치마크에서 뛰어난 성능을 보이지만, YOLOv7의 아키텍처는 서버급 가속기에 최적화되어 있습니다. 이러한 모델을 에지 디바이스로 내보내고 배포하는 것은 더 현대적이고 간소화된 프레임워크와 비교했을 때 더 많은 수동 구성이 필요할 수 있습니다.

YOLOv7에 대해 더 알아보기

Link to this section상세 성능 비교#

모델을 평가할 때는 속도, 정확도, 모델 크기 간의 절충안을 최우선으로 고려해야 합니다. 아래 표는 두 모델의 지표를 강조합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

데이터에서 알 수 있듯이 YOLOv8x는 가장 높은 절대 정확도(53.9 mAP)를 달성하며, 나노 버전(YOLOv8n)은 뛰어난 추론 속도와 매우 가벼운 풋프린트를 제공합니다. 이러한 다양성 덕분에 YOLOv8은 하드웨어가 제한된 환경에 훨씬 더 적응력이 높습니다.

Link to this sectionUltralytics의 강점: 사용 편의성과 생태계#

YOLOv7이 강력한 순수 탐지 지표를 제공하지만, Ultralytics YOLOv8은 개발자 경험, 생태계 통합, 다중 작업 수행 능력 측면에서 훨씬 뛰어납니다.

Link to this section비교할 수 없는 범용성#

YOLOv7은 기본적으로 탐지 모델이며, 다른 작업을 위한 실험적 브랜치를 가지고 있습니다. 대조적으로 YOLOv8은 객체 탐지, 인스턴스 분할, 이미지 분류, 자세 추정, 그리고 회전 경계 상자(OBB)를 기본적으로 지원합니다. 이러한 통합 접근 방식을 통해 팀은 하나의 API를 학습하여 완전히 다른 프로젝트 요구 사항에 전반적으로 적용할 수 있습니다.

Link to this section간소화된 배포 및 통합#

프로덕션을 위해 모델을 내보내는 과정은 종종 병목 현상이 발생합니다. Ultralytics 패키지를 사용하면 개발자가 단 한 줄의 Python 코드로 ONNX, TensorRT, CoreML과 같은 형식으로 내보낼 수 있습니다. 이는 복잡한 앵커 기반 그래프를 내보낼 때 발생하는 연산자 지원 문제를 방지합니다.

또한 YOLOv8은 MLOps 도구와 원활하게 통합됩니다. Weights & Biases를 통해 실험을 추적하든 Hugging Face Spaces에서 배포를 테스트하든, Ultralytics 생태계가 번거로운 작업을 대신 처리합니다.

Link to this section코드 예제: YOLOv8 학습 및 내보내기#

다음 코드는 Ultralytics Python API의 단순함을 보여줍니다. 10줄 이내의 코드로 모델 초기화부터 학습, 그리고 에지 배포를 위한 내보내기까지 완료할 수 있습니다.

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model for fast inference
model = YOLO("yolov8n.pt")

# Train the model on the COCO8 dataset
# The API handles data loading, augmentation, and logging automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the trained model to ONNX format for deployment
model.export(format="onnx")
배포 유연성

model.export() 함수를 사용하면 고성능 추론 엔진으로 즉시 연결할 수 있어, YOLOv8을 모바일 애플리케이션, 임베디드 시스템 또는 고처리량 클라우드 서버에 쉽게 통합할 수 있습니다.

Link to this section실제 활용 사례#

두 모델 간의 아키텍처 차이가 이상적인 배포 시나리오를 결정합니다.

YOLOv8을 선택해야 할 때:

  • 에지 AI 및 IoT 디바이스: 초고속 Nano 및 Small 모델을 사용할 수 있어 YOLOv8은 스마트 카메라나 드론과 같이 연산 능력이 제한된 하드웨어에 완벽합니다.
  • 다중 작업 프로젝트: 파이프라인에서 장애물 매핑(분할)을 수행하는 동시에 사람의 관절 추적(자세 추정)이 필요한 경우, YOLOv8은 이를 기본적으로 처리합니다.
  • 신속한 프로토타이핑에서 프로덕션까지: 방대한 Ultralytics 문서와 원활한 Python API를 통해 팀은 제품을 더 빠르게 출시할 수 있습니다.

YOLOv7을 고려해야 할 때:

  • 학술 벤치마킹: 재매개변수화 기법의 효과를 연구하는 연구자들은 Papers With Code에서의 인기도를 반영하여 YOLOv7을 표준 기준으로 자주 사용합니다.
  • 레거시 서버 파이프라인: 기존의 고연산 파이프라인이 이미 YOLOv7의 특정 앵커 출력값에 엄격하게 최적화되어 있다면, 단기적으로는 이를 유지하는 것이 실용적일 수 있습니다.

Link to this section미래를 향해: 차세대 모델#

YOLOv8은 여전히 다재다능한 강자이지만, AI 환경은 빠르게 변하고 있습니다. 새로운 프로젝트를 시작하는 팀에게는 Ultralytics 라인업의 최신 발전을 탐색해 볼 것을 강력히 권장합니다.

최신 세대인 **YOLO26**은 현재 비전 AI의 정점을 나타냅니다. 이 모델은 End-to-End NMS-Free 설계를 특징으로 하여, 더 간단하고 빠른 배포를 위해 비최대 억제(NMS) 후처리를 제거했습니다. Distribution Focal Loss(DFL)를 제거하고 LLM에서 영감을 받은 MuSGD 옵티마이저를 도입함으로써 YOLO26은 더 안정적인 학습과 최대 43% 더 빠른 CPU 추론을 제공합니다. 고급 ProgLoss + STAL 손실 함수는 소형 객체 인식 능력을 크게 향상시켜 현대 에지 컴퓨팅 및 항공 이미지 분야를 위한 최고의 선택입니다.

이전 시스템에서 전환하는 사용자를 위해 고성능 **YOLO11**과 고전적인 YOLOv5 역시 통합 Ultralytics 생태계 내에서 완전히 지원되므로, 어떤 하드웨어 제약 조건에서도 즉시 배포 가능한 간소화된 고성능 모델을 사용할 수 있습니다.

댓글