YOLOv5 vs YOLO11: 종합적인 기술 비교

새로운 프로젝트를 위한 올바른 컴퓨터 비전 아키텍처를 선택할 때, 최신 모델의 진화 과정을 이해하는 것은 매우 중요합니다. 초기 아키텍처에서 현대적인 통합 프레임워크로의 발전은 알고리즘 효율성과 개발자 경험 모두에서 상당한 도약을 보여줍니다. 이 가이드는 Ultralytics가 개발한 두 가지 기념비적인 모델인 선구적인 YOLOv5와 고도로 정제된 YOLO11을 심층적으로 기술 비교합니다.

모델 소개

두 아키텍처 모두 실시간 객체 탐지 분야의 중요한 이정표를 나타내며, 배포 환경과 레거시 요구 사항에 따라 각기 다른 장점을 제공합니다.

YOLOv5: 업계의 주력 모델

2020년 여름에 출시된 YOLOv5는 기본 PyTorch 구현 덕분에 업계 표준으로 빠르게 자리 잡았으며, 이는 학습 및 배포의 진입 장벽을 크게 낮췄습니다. 이전 모델의 복잡한 Darknet C 프레임워크에서 벗어나 모델 구축에 Pythonic한 접근 방식을 제공했습니다.

YOLOv5는 사용 편의성에 대한 강력한 기준을 세웠으며 고급 모자이크 데이터 증강 및 자동 앵커링을 포함한 강력한 학습 방법론을 도입했습니다. 잘 문서화되고 철저하게 테스트된 코드베이스를 기반으로 구축하는 연구자들에게 여전히 엄청난 인기를 얻고 있습니다.

YOLOv5에 대해 더 알아보기

YOLO11: 통합 비전 프레임워크

수년간의 피드백과 아키텍처 연구를 바탕으로 도입된 YOLO11은 여러 비전 작업을 기본적으로 처리할 수 있는 통합 프레임워크의 일부입니다. 단순히 바운딩 박스를 넘어서, 최고의 범용성과 효율성을 위해 처음부터 새로 설계되었습니다.

YOLO11은 ultralytics Python 패키지를 통해 간소화된 사용자 경험을 제공하며, 객체 탐지, 인스턴스 세그멘테이션, 분류, 포즈 추정 및 OBB(Oriented Bounding Boxes)를 통합하는 간단한 API를 자랑합니다. 속도와 정확도 사이에서 매우 유리한 균형을 달성하여 다양한 실제 배포 시나리오에 이상적입니다.

YOLO11에 대해 더 알아보기

통합 플랫폼

두 모델 모두 Ultralytics Platform에서 제공하는 잘 관리된 생태계의 이점을 누립니다. 이 통합 환경은 데이터셋 어노테이션, 클라우드 학습 및 다양한 하드웨어 타겟에 대한 모델 내보내기를 간소화합니다.

성능 및 메트릭 비교

이 모델들에 대한 직접적인 비교는 아키텍처 개선이 어떻게 실질적인 성능 향상으로 이어지는지 보여줍니다. 아래 표는 COCO dataset에서 평가된 mAP(mean Average Precision)와 CPU 및 GPU 추론 속도, 파라미터 수를 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

결과 분석

지표는 YOLO11이 달성한 성능 균형의 확실한 도약을 강조합니다. 예를 들어, YOLO11n(nano) 모델은 YOLOv5n의 28.0% 대비 39.5%의 mAP를 달성하는 동시에 ONNX를 통해 내보냈을 때 CPU 추론 시간을 단축합니다. 또한 YOLO11은 무거운 Transformer 기반 모델과 비교하여 학습 중 메모리 요구 사항을 현저히 낮게 유지하므로 소비자용 하드웨어 및 엣지 장치 배포에 매우 접근하기 쉽습니다.

아키텍처 차이

YOLO11의 성능 향상은 여러 핵심 아키텍처 진화에서 비롯됩니다. YOLOv5는 C3 모듈을 포함한 표준 CSPNet 백본을 사용했지만, YOLO11은 그래디언트 흐름을 최적화하고 계산 오버헤드를 줄이는 C2f 및 이후 C3k2와 같은 보다 효율적인 특징 추출 블록을 도입했습니다.

YOLO11은 또한 대폭 개선된 헤드를 특징으로 합니다. 이전 모델의 앵커 기반 설계에서 벗어나, 최신 Ultralytics 아키텍처는 앵커 프리 접근 방식을 채택합니다. 이는 박스 예측 수를 줄여 후처리 파이프라인을 간소화하고 다양한 스케일 및 종횡비 전반에서 모델의 일반화 능력을 향상시킵니다. 또한 이러한 모델은 우수한 학습 효율성과 미세 조정된 데이터셋의 수렴을 가속화하는 사전 학습된 가중치를 제공합니다.

구현 및 코드 예제

Ultralytics 생태계의 두드러진 특징 중 하나는 단순성입니다. YOLOv5가 빠른 추론을 위해 torch.hub 사용을 대중화했다면, YOLO11은 통합 ultralytics Python 패키지로 이를 한 단계 더 발전시켰습니다.

YOLO11로 학습하기

모델을 로드, 학습 및 검증하는 데 최소한의 보일러플레이트 코드만 필요합니다. API는 하이퍼파라미터 튜닝과 모델 관리를 원활하게 처리합니다.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11s.pt")

# Train on a custom dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

# Easily export the model to TensorRT for hardware acceleration
model.export(format="engine")

YOLOv5를 사용한 레거시 추론

이전 파이프라인을 유지 관리하는 경우, YOLOv5는 PyTorch의 기본 로딩 메커니즘과 직접 통합되어 기존 추론 스크립트에 쉽게 적용할 수 있습니다.

import torch

# Load a custom or pretrained YOLOv5 model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Perform inference on an image URL
results = model("https://ultralytics.com/images/zidane.jpg")

# Print prediction details to the console
results.print()
배포 유연성

Both models support extensive export formats. Whether you are targeting an NVIDIA Jetson using TensorRT or an iOS application using CoreML, the deployment process is thoroughly documented and supported by the community.

이상적인 활용 사례

이 모델들 중에서 선택하는 것은 주로 프로젝트의 수명 주기 단계와 특정 요구 사항에 따라 달라집니다.

YOLOv5를 선택해야 할 때

  • 레거시 코드베이스 유지 관리: 프로덕션 환경이 YOLOv5 리포지토리 구조나 특정 하이퍼파라미터 진화 기술을 중심으로 크게 맞춤화된 경우입니다.
  • 학술적 기준: 확립된 2020-2022년 컴퓨터 비전 표준과 직접적인 벤치마킹이 필요한 연구를 발표할 때 적합합니다.

YOLO11을 선택해야 할 때

  • 멀티 태스크 프로젝트: 단일 통합 API를 사용하여 포즈 추정인스턴스 세그멘테이션과 같은 작업을 혼합해야 하는 애플리케이션의 경우입니다.
  • 엣지 배포: 주어진 계산 예산(FLOPs) 내에서 최대 mAP를 확보하는 것이 중요한 엣지 컴퓨팅 시나리오에 적합합니다.
  • 상업용 AI 솔루션: Ultralytics Platform의 강력한 지원을 활용하여 소매 및 보안 분야의 엔터프라이즈 애플리케이션에 이상적입니다.

차세대 모델: Ultralytics YOLO26

YOLO11은 속도와 정확도의 환상적인 균형을 나타내지만, 인공지능 분야는 빠르게 진화하고 있습니다. 오늘날 새로운 프로젝트를 시작하는 개발자들에게는 비전 AI의 최신 표준인 **Ultralytics YOLO26**을 탐색하는 것을 강력히 권장합니다.

2026년 1월에 출시된 YOLO26은 현대적인 배포 요구 사항에 맞게 설계된 패러다임 전환 기술을 도입했습니다:

  • 엔드 투 엔드 NMS-프리 설계: YOLOv10에서 처음 개척된 개념을 기반으로 하는 YOLO26은 기본적으로 엔드 투 엔드입니다. NMS(Non-Maximum Suppression) 후처리 과정이 필요 없어 배포 파이프라인을 크게 단순화하고 지연 시간을 줄입니다.
  • MuSGD 옵티마이저: Moonshot AI의 Kimi K2와 같은 모델의 LLM 학습 혁신에서 영감을 받은 이 SGD와 Muon의 하이브리드는 매우 안정적인 학습과 획기적으로 빠른 수렴을 보장합니다.
  • 전례 없는 CPU 속도: DFL(Distribution Focal Loss)을 제거함으로써 YOLO26은 최대 43% 더 빠른 CPU 추론을 달성하여 전용 GPU가 없는 엣지 장치 및 환경에 가장 적합한 선택이 되었습니다.
  • 고급 손실 함수: ProgLoss와 STAL의 통합으로 드론 분석, IoT 및 로봇 공학에 필수적인 소형 객체 인식에서 눈에 띄는 향상을 가져왔습니다.
  • 작업별 개선: 포즈를 위한 RLE(Residual Log-Likelihood Estimation) 및 OBB(Oriented Bounding Boxes)를 위한 특수 각도 손실과 같은 전문 최적화를 도입하여 모든 컴퓨터 비전 작업에서 뛰어난 성능을 보장합니다.

YOLO26에 대해 더 알아보기

표준 객체 탐지를 넘어선 특수 아키텍처에 관심이 있는 사용자는 Transformer 기반 탐지를 위해 RT-DETR을 살펴보거나 오픈 어휘 추적 및 탐지를 위해 YOLO-World를 고려할 수 있습니다. 이러한 잘 관리되고 고도로 최적화된 도구를 채택하면 컴퓨터 비전 파이프라인을 효율적이고 확장 가능하며 최첨단 상태로 유지할 수 있습니다.

댓글