콘텐츠로 건너뛰기

YOLO YOLOv5: 아키텍처와 성능에 대한 기술적 비교

컴퓨터 비전 분야의 급속한 발전 속에서, 정확도, 속도, 자원 효율성 사이의 균형을 맞추기 위해서는 올바른 객체 탐지 아키텍처를 선택하는 것이 매우 중요합니다. 본 가이드는 알리바바 그룹의 신경망 아키텍처 검색(NAS) 기반 모델인 YOLOYOLOv5( Ultralytics의 전설적인 모델) 간의 포괄적인 기술적 비교를 제공합니다.

경영진 요약

YOLO COCO 더 높은 정확도를 끌어내기 위해 신경망 구조 탐색(NAS) 및 중대한 재매개변수화와 같은 혁신적인 개념을 도입하는 반면, YOLOv5 는 사용성, 배포 준비도, 생태계 지원 측면에서 여전히 업계 표준으로 자리 잡고 있습니다.

2026년 최첨단을 추구하는 개발자들을 위해, YOLO26 가 권장되는 업그레이드 경로입니다. 이는 YOLOv5 사용 편의성과 엔드투엔드 NMS 설계, MuSGD 최적화기 같은 아키텍처적 YOLOv5 효율성과 속도 면에서 기존 모델들을 모두 뛰어넘습니다.

YOLO: 아키텍처와 혁신

알리바바 그룹 연구진이 개발한YOLO 자동화된 아키텍처 설계를 통해 속도와 정확성의 한계를 뛰어넘는 데YOLO .

  • 작성자: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
  • Organization: Alibaba Group
  • 날짜: 2022년 11월 23일
  • 링크:Arxiv, GitHub

주요 아키텍처 기능

  1. 신경망 구조 탐색(NAS): 수작업으로 설계된 백본과 달리,YOLO 보조 조기 정지 방법(MAE-NAS)YOLO 다양한 지연 시간 제약에 맞춤화된 효율적인 백본을 자동으로 발견합니다.
  2. RepGFPN (효율적인 Rep-매개변수화 일반화 FPN): 이 모델은 재매개변수화를 활용하여 추론 속도를 유지하면서 특징 풍부성을 극대화하는 동시에, 서로 다른 규모 간 정보 흐름 경로를 최적화하는 새로운 특징 융합 목(neck)을 도입합니다.
  3. ZeroHead: 기존 분리형 헤드에 비해 계산 부담을 크게 줄여주는 경량 탐지 헤드.
  4. AlignedOTA: 훈련 중 분류 및 회귀 작업 간의 정렬 불일치 문제를 해결하는 동적 레이블 할당 전략.

강점과 약점

YOLO 학술적 벤치마크에서YOLO , 특정 매개변수 수에 대해 YOLO 우수한 mAP 자주 기록합니다. 그러나 복잡한 NAS 구조에 의존하기 때문에 맞춤형 하드웨어에 대한 수정이나 미세 조정이 어려울 수 있습니다. 또한 "증류 우선" 훈련 방식은 종종 무거운 교사 모델을 필요로 하여, 제한된 자원을 가진 사용자의 훈련 파이프라인을 복잡하게 만들 수 있습니다.

DAMO-YOLO에 대해 자세히 알아보세요.

YOLOv5: 업계 표준

Ultralytics 출시된 YOLOv5 객체 탐지 분야의 사용자 경험을 YOLOv5 . 단순한 모델이 아닌, 완전한 생산 환경 적용이 가능한 프레임워크였습니다.

주요 아키텍처 기능

  1. CSP-다크넷 백본: 단계 간 부분 네트워크를 활용하여 기울기 흐름을 강화하고 연산을 줄이며, 깊이와 너비를 효과적으로 균형 잡은 견고한 수제 설계입니다.
  2. PANet Neck: 경로 집계 네트워크는 정보 흐름을 크게 개선하여 서로 다른 백본 계층의 특징을 융합함으로써 모델이 객체를 더 잘 국소화하도록 돕습니다.
  3. 모자이크 증강: 네 개의 훈련 이미지를 하나로 결합하는 선구적인 데이터 증강 기법으로, 모델이 다양한 규모와 맥락에서 detect 효과적으로 detect 학습할 수 있게 합니다.
  4. 자동 앵커: 특정 데이터셋에 최적화된 앵커 박스를 자동으로 계산하여 사용자 정의 데이터의 설정 과정을 간소화합니다.

강점과 약점

YOLOv5 가장 큰 장점은 보편성입니다. 클라우드 서버부터 라즈베리 파이, CoreML 통한 아이폰까지 모든 환경에서 실행됩니다. '백-오브-프리비즈(bag-of-freebies)' 훈련 전략은 복잡한 설정 없이도 높은 성능을 보장합니다. COCO mAP 순수 mAP YOLO 같은 최신 연구 모델보다 COCO , 실제 환경에서의 신뢰성, 이식성, 그리고 방대한 커뮤니티 지원 덕분에 여전히 매우 유용합니다.

5에 대해 자세히 알아보기

성능 벤치마크

다음 표는 두 모델의 성능을 비교합니다.YOLO 집중적인 NAS 최적화를 mAP YOLO 반면, YOLOv5 속도와 내보내기 용이성 사이의 균형 YOLOv5 .

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

성능 컨텍스트

YOLO 유사한 모델 mAP 더 높은 mAP YOLO , 실제 추론 속도는 특정 레이어(예: RepVGG 블록)에 대한 하드웨어 지원에 좌우되며, 이는 올바르게 폴딩하기 위해 특정 내보내기 단계가 필요할 수 있습니다. YOLOv5 표준 연산은 거의 모든 추론 엔진에서 보편적으로 최적화되어 있습니다.

사용 사례 권장 사항

이 두 아키텍처 중에서 선택할 때는 배포 환경의 구체적인 요구 사항을 고려하십시오.

YOLO 위한 이상적인 시나리오

  • 학술 연구: NAS 연구나 mAP 마지막 0.1% mAP 끌어올리는 것이 목표라면,YOLO 혁신적인 아키텍처는 실험을 위한 풍부한 토대를 제공합니다.
  • 고성능 GPU : 메모리 및 컴퓨팅 제약이 완화된 환경에서, 복잡한 벤치마크에서의 정확도가 주요 평가 지표인 경우.

Ultralytics YOLOvYOLOv5의 이상적인 시나리오

  • 엣지 배포: NVIDIA 이나 Raspberry Pi와 같은 장치의 경우, YOLOv5 단순한 아키텍처는 TensorRTTFLite로 원활하게 내보낼 수 있습니다.
  • 신속한 프로토타이핑: "제로에서 히어로까지"의 경험을 통해 맞춤형 데이터셋으로 훈련하고 몇 분 안에 결과를 확인할 수 있습니다.
  • 생산 시스템: 안정성이 핵심입니다. YOLOv5 수백만 건의 배포 환경에서 YOLOv5 생산 파이프라인에서 예상치 못한 장애 발생 위험을 줄여줍니다.

Ultralytics 이점

YOLO 흥미로운 연구 성과를YOLO 반면, Ultralytics 실제 애플리케이션을 구축하는 개발자들에게 뚜렷한 이점을 제공합니다.

1. 사용 편의성 및 생태계

Ultralytics 전체 워크플로를 통합합니다. 생태계를 벗어나지 않고도 데이터셋을 관리하고, 클라우드에서 모델을 훈련시키며, 다양한 엔드포인트에 배포할 수 있습니다. 문서화가 철저하고 커뮤니티가 활발하여 버그로 인해 오랫동안 막히는 일이 없습니다.

2. 감지 불가능한 다용도성

YOLO 주로 객체 탐지YOLO . 반면 Ultralytics 현대 AI 애플리케이션에 필수적인 더 다양한 작업을 지원합니다:

3. 메모리 및 자원 효율성

Ultralytics YOLO 효율적인 메모리 사용으로 유명합니다. VRAM을 많이 차지하는 트랜스포머 중심 아키텍처나 복잡한 디스틸레이션 파이프라인과 달리, YOLOv5 YOLO26과 같은 모델은 소비자용 GPU(예: RTX 3060)로도 훈련이 가능해 고급 AI 훈련에 대한 접근성을 확대합니다.

4. 훈련 효율성

YOLO 훈련에는 종종 사전 훈련된 교사 모델이 필요한 복잡한 "증류" 단계가 수반됩니다. Ultralytics 간소화된 "무료 제공 패키지" 방식을 활용합니다. 사전 훈련된 가중치를 로드하고 데이터 구성을 지정하기만 하면 최적화된 하이퍼파라미터로 즉시 훈련이 시작됩니다.

앞으로 바라보기: YOLO26

2026년에 새로운 프로젝트를 시작한다면, 위의 어느 것도 확실한 승자가 아닙니다. YOLO26 효율성의 정점을 상징합니다.

  • 엔드투엔드 NMS 제거: 비최대 억제(NMS)를 제거함으로써 YOLO26은 배포 로직을 단순화하고 추론 지연 시간 편차를 줄입니다.
  • MuSGD 최적화기: 대규모 언어 모델(LLM) 훈련에서 영감을 받아 개발된 이 최적화기는 안정적인 수렴성과 더 빠른 훈련 시간을 보장합니다.
  • 에지 최적화: 분포 초점 손실(DFL) 제거 및 블록 최적화를 통해 YOLO26은 이전 세대에 비해 CPU에서 최대 43% 빠른 추론을 달성하여 모바일 및 IoT 애플리케이션에 최적의 선택이 됩니다.

YOLO26에 대해 더 알아보기

코드 예시: Ultralytics 사용한 추론

Ultralytics 의 단순성 덕분에 모델 세대 간 전환을 손쉽게 수행할 수 있습니다.

from ultralytics import YOLO

# Load the latest state-of-the-art model
model = YOLO("yolo26n.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize and save the results
for result in results:
    result.show()  # Display to screen
    result.save(filename="output.jpg")  # Save image to disk

결론

YOLO YOLOv5 모두 객체 탐지 역사에서 중요한 역할을 YOLOv5 .YOLO 신경망 구조 탐색(Neural Architecture Search)의 잠재력을YOLO , YOLOv5 사용성과 배포 측면에서 기준을 YOLOv5 . 그러나 이 분야는 빠르게 진화하고 있습니다. 속도, 정확도, 개발자 경험의 최적 균형을 요구하는 이들에게 Ultralytics 현대 컴퓨터 비전 애플리케이션을 위한 확실한 선택지입니다.

추가적인 탐구를 위해 YOLO11 EfficientDet 또는 RT-DETR YOLOv8 같은 다른 아키텍처와의 비교를 검토해 보시기 바랍니다.


댓글