Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 대 YOLOv8#

컴퓨터 비전의 급격한 발전으로 개발자와 연구자를 위한 강력한 도구가 다수 등장했습니다. 객체 탐지 파이프라인을 위한 적절한 아키텍처를 결정할 때는 기존 모델들을 비교하는 것이 필수적입니다. 이 기술 가이드는 매우 영향력 있는 두 모델인 YOLOv7과 Ultralytics YOLOv8의 아키텍처, 성능 지표 및 이상적인 사용 사례를 심층적으로 다룹니다.

Link to this section아키텍처 소개#

두 모델 모두 성능 면에서 상당한 도약을 이루었지만, 딥 뉴럴 네트워크 최적화라는 과제에 접근하는 구조적 철학은 다릅니다.

Link to this sectionYOLOv7: Bag-of-Freebies의 선구자#

2022년 중반에 발표된 YOLOv7은 아키텍처의 그래디언트 경로 최적화와 "학습 가능한 백오브프리비스(trainable bag-of-freebies)" 개념에 집중하여 하이엔드 하드웨어에서의 실시간 탐지 한계를 높였습니다.

아키텍처 주요 특징: YOLOv7은 주로 앵커 기반 탐지 헤드를 활용하며(앵커 프리 브랜치 실험도 진행함) 확장 효율적 계층 집계 네트워크(E-ELAN)를 도입합니다. 이 설계는 원래의 그래디언트 경로를 훼손하지 않으면서 네트워크의 학습 능력을 향상시킵니다. 서버급 GPU에서 탁월한 성능을 발휘하므로 고부하 비디오 분석에 매우 적합합니다.

장점과 단점: YOLOv7은 전용 하드웨어에서 뛰어난 지연 시간을 달성하지만, 생태계가 매우 파편화되어 있습니다. 학습을 위해서는 복잡한 명령줄 인수, 수동 리포지토리 클로닝, PyTorch 내의 엄격한 의존성 관리가 필요합니다. 또한, 학습 중 메모리 요구 사항이 소비자용 하드웨어에서는 부담스러울 수 있습니다.

YOLOv7에 대해 더 알아보기

Link to this sectionUltralytics YOLOv8: 다재다능한 표준#

2023년 초에 출시된 YOLOv8은 최첨단 정확도뿐만 아니라 통합된 프로덕션 준비 완료 프레임워크를 제공하는 데 중점을 두어 개발자 경험을 완전히 재정의했습니다.

아키텍처 주요 특징: YOLOv8은 MS COCO 데이터셋이나 사용자 정의 데이터 분포에 따라 앵커 박스를 수동으로 구성할 필요가 없는 기본 앵커 프리 탐지 헤드를 도입했습니다. 그래디언트 흐름을 개선하기 위해 C2f 모듈을 통합하고, 객체성(objectness), 분류, 회귀 작업을 분리하는 디커플링 헤드 구조를 사용합니다. 이는 수렴을 크게 가속화하고 정확도를 높입니다.

장점과 단점: YOLOv8은 뛰어난 메모리 요구 사항 효율성을 자랑합니다. YOLOv7 및 더 무거운 Transformer 모델에 비해 학습 중 훨씬 적은 CUDA 메모리를 사용하여 개발자가 더 큰 배치 크기를 사용할 수 있게 합니다. 주된 장점은 인스턴스 세그멘테이션, 이미지 분류, 포즈 추정, 방향이 있는 바운딩 박스(OBB)를 기본적으로 지원하는 범용성에 있습니다. 유일한 단점이라면 YOLOv7 텐서 전용으로 구축된 극도로 특수화된 레거시 파이프라인의 경우 짧은 리팩토링 기간이 필요할 수 있다는 점입니다.

YOLOv8에 대해 더 알아보기

생태계 이점

Ultralytics YOLOv8은 잘 관리된 생태계의 이점을 누립니다. 직관적인 Python API, 활발한 개발, 강력한 커뮤니티 지원을 통해 모델을 로컬 테스트에서 전 세계 배포까지 가져가는 데 드는 시간이 독립형 리포지토리에 비해 훨씬 짧습니다.

Link to this section상세 성능 비교#

다음 표는 주요 모델 크기에 따른 성능 지표를 세분화하여 보여줍니다. YOLOv8이 에지 기기에서의 빠른 추론을 위해 크게 최적화하면서도 세계 최고 수준의 정확도를 유지함으로써 달성한 독보적인 성능 균형을 확인해 보십시오.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

참고: YOLOv8x는 이 그룹에서 가장 높은 mAP를 달성하는 반면, YOLOv8n은 파라미터 효율성과 추론 속도 면에서 압도적이어서 에지 AI 기기에서의 컴퓨터 비전 배포를 위한 명실상부한 챔피언입니다.

Link to this section사용 편의성과 학습 효율성#

사용 편의성 측면에서 볼 때, Ultralytics YOLOv8은 독보적인 위치에 있습니다. YOLOv7과 같은 이전 아키텍처는 특정 리포지토리를 클론하고 장황한 명령줄 스크립트를 실행하여 데이터셋과 경로를 구성해야 합니다.

Conversely, YOLOv8's ultralytics package offers a highly streamlined developer experience. Training Efficiency is maximized through automatic data downloading, ready-to-use pretrained weights, and seamless exporting capabilities to formats like ONNX and TensorRT.

Ultralytics Python API를 사용하여 로드, 학습 및 추론을 실행하는 방법은 다음과 같습니다:

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
predictions[0].show()
실험 추적

YOLOv8은 Weights & BiasesClearML과 같은 인기 있는 MLops 도구와 기본적으로 통합되어 하이퍼파라미터 튜닝 및 학습 지표를 실시간으로 모니터링할 수 있습니다.

Link to this section이상적인 사용 사례#

이러한 아키텍처 중 하나를 선택하는 것은 종종 배포 환경의 구체적인 제약 사항에 달려 있습니다.

Link to this sectionYOLOv7을 선택해야 하는 경우#

  • 레거시 벤치마킹: 2022년의 아키텍처 표준과 비교할 고정된 기준점이 필요한 연구자에게 적합합니다.
  • 기존의 무거운 인프라: YOLOv7의 특정 텐서 구성이 레거시 C++ 파이프라인에 깊게 내장되어 있는 NVIDIA V100 또는 A100 GPU 환경.

Link to this sectionYOLOv8을 선택해야 할 때#

  • 크로스 플랫폼 프로덕션: 클라우드 GPU, 모바일 기기 및 브라우저 전반에 걸쳐 원활하게 배포해야 하는 팀에게 이상적입니다.
  • 멀티 태스크 요구 사항: 프로젝트가 바운딩 박스를 넘어 풍부한 인스턴스 세그멘테이션 마스크포즈 키포인트를 활용해야 하는 경우입니다.
  • 리소스가 제한된 에지: YOLOv8 Nano(yolov8n)는 로보틱스, 드론 및 IoT 센서에 대해 놀라운 정확도 대 속도 비율을 제공합니다.

Link to this section앞으로의 전망: YOLO26으로의 세대적 도약#

YOLOv8은 여전히 매우 강력한 선택지이지만, 컴퓨터 비전 분야는 빠르게 움직입니다. 완전히 새로운 고성능 프로젝트를 시작하는 개발자를 위해 Ultralytics는 최근 차세대 AI 모델을 도입했습니다. 깊이 있게 개선된 YOLO11과 새로 출시된 YOLO26을 모두 살펴보는 것을 강력히 권장합니다.

2026년 1월에 출시된 YOLO26은 에지 기기에서 가능한 것의 경계를 확장합니다:

  • 엔드투엔드 NMS-프리 설계: YOLO26은 기본적으로 엔드투엔드 방식이며 비최대 억제(NMS) 후처리를 완전히 제거합니다. 이는 기존의 조밀한 예측 모델의 지연 시간 병목 현상 없이 훨씬 더 빠르고 간단한 배포 파이프라인을 보장합니다.
  • DFL 제거: Distribution Focal Loss를 제거함으로써 YOLO26은 훨씬 더 간단한 모델 배포 옵션과 우수한 에지 호환성을 달성합니다.
  • 최대 43% 더 빠른 CPU 추론: Raspberry Pi 및 임베디드 시스템과 같은 제한된 환경에 최적화되어, CPU 처리량에서 이전 모든 세대를 능가합니다.
  • MuSGD 옵티마이저: 대규모 언어 모델(LLM) 학습 패러다임에서 영감을 받은 YOLO26은 SGD와 Muon의 하이브리드를 통합합니다. 이는 전례 없는 학습 안정성과 매우 빠른 수렴을 제공합니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 항공 이미지, 자동화된 농업 및 로보틱스에 매우 중요한 작은 객체 인식에서 눈에 띄는 개선을 가져옵니다.

YOLOv8을 통한 대규모 비디오 분석 클러스터로 확장하든, 최첨단 YOLO26을 통해 작은 에지 기기로 추론을 밀어붙이든, Ultralytics Platform은 전체 AI 수명 주기를 원활하게 관리할 수 있는 도구를 제공합니다.

댓글