콘텐츠로 건너뛰기

YOLO YOLOv5: 종합적인 기술 비교

최적의 객체 감지 아키텍처를 선택하는 것은 컴퓨터 비전 개발의 중추적인 단계로 정확도, 추론 속도, 통합 복잡성을 신중하게 평가해야 합니다. 이 분석에서는 알리바바 그룹에서 개발한 고정밀 모델인 YOLO 다음과 비교합니다. Ultralytics YOLOv5와 성능, 속도, 개발자 친화적인 에코시스템의 균형으로 유명한 업계 표준 아키텍처를 비교합니다. 이 아키텍처의 혁신, 벤치마크 지표, 이상적인 애플리케이션 시나리오를 살펴보고 정보에 입각한 결정을 내릴 수 있도록 도와드립니다.

YOLO: 정확성 중심 아키텍처

저자 Xianzhe Xu, 이치 장, 웨이화 첸, 일룬 황, 위안 장, 시우위 선
조직:알리바바 그룹
날짜: 2022-11-23
아카이브:https://arxiv.org/abs/2211.15444v2
깃허브YOLO
문서:YOLO README

YOLO 합리적인 지연 시간을 유지하면서 탐지 정확도의 한계를 뛰어넘기 위한 알리바바 그룹의 중요한 노력의 결과물입니다. 고급 신경망 아키텍처 검색(NAS) 기술과 새로운 기능 융합 전략을 통합하여 정적 벤치마크에서 많은 동종 제품을 능가하는 성능을 발휘합니다.

아키텍처 혁신

YOLO 네트워크에서 최대한의 성능을 끌어내기 위해 설계된 몇 가지 기술적으로 복잡한 구성 요소를 통해 차별화됩니다:

  • MAE-NAS 백본: 수동으로 백본을 설계한 모델과 달리, YOLO 최대 엔트로피 원칙에 따라 신경 구조 검색(NAS) 을 사용합니다. 그 결과 다양한 제약 조건 하에서 특징 추출 효율을 위해 특별히 최적화된 백본 구조가 만들어집니다.
  • 효율적인 RepGFPN: 이 모델은 재파라미터화된 일반화된 특징 피라미드 네트워크(RepGFPN)를 활용합니다. 이 고급 넥 모듈은 다양한 규모에서 특징 융합을 최적화하고 재매개변수화를 활용하여 정확도 저하 없이 추론 지연 시간을 줄임으로써 표준 FPN을 개선합니다.
  • 제로헤드: 탐지 헤드의 계산 비용을 최소화하기 위해 YOLO 분류 및 회귀 작업을 효율적으로 처리하는 경량 디커플링 헤드인 제로헤드를 도입했습니다.
  • AlignedOTA: 정적 매칭 규칙보다 더 효과적으로 예측 앵커를 기준 데이터 오브젝트에 정렬하는 동적 라벨 할당 전략인 AlignedOTA(정렬된 최적 전송 할당)를 통해 학습 안정성과 정확도가 향상됩니다.
  • 증류 강화: 교육 과정에는 종종 지식 증류가 포함되는데, 더 큰 '교사' 모델이 더 작은 '학생' 모델의 학습을 안내하여 더 풍부한 기능 표현을 전달합니다.

연구 중심 설계

YOLO COCO 같은 벤치마크에서 높은 mAP 달성하는 데 매우 최적화되어 있습니다. NAS와 증류법을 사용하기 때문에 훈련의 복잡성을 감수하더라도 1%의 정확도가 중요한 학술 연구 및 시나리오에 강력한 도구가 될 수 있습니다.

강점과 약점

YOLO 가장 큰 장점은 원시 감지 정확도입니다. NAS와 고급 넥 설계를 활용하여 같은 세대의 동급 모델보다 높은 평균 정밀도(mAP ) 점수를 달성하는 경우가 많습니다. 세밀한 특징 구분이 중요한 복잡한 장면에서 물체를 식별하는 데 탁월한 성능을 발휘합니다.

하지만 이러한 장점에는 단점도 있습니다. NAS 백본과 증류 파이프라인에 의존하면 트레이닝과 통합의 복잡성이 증가합니다. 다른 대안의 플러그 앤 플레이 특성과 달리, YOLO 위한 맞춤형 교육 파이프라인을 설정하는 것은 리소스 집약적일 수 있습니다. 또한 에코시스템이 상대적으로 작기 때문에 기존 프레임워크에 비해 커뮤니티 리소스, 튜토리얼 및 타사 통합이 더 적습니다.

DAMO-YOLO에 대해 자세히 알아보세요.

Ultralytics YOLOv5: 실용적인 AI의 표준

저자: 작성자: Glenn Jocher
조직:Ultralytics
날짜: 2020-06-26
깃허브yolov5
문서yolov5

출시 이후 Ultralytics YOLOv5 는 실제 컴퓨터 비전 애플리케이션을 위한 최고의 솔루션으로 자리매김했습니다. 데이터 세트 큐레이션부터 배포에 이르기까지 머신 러닝 수명 주기의 모든 단계를 간소화하는 에코시스템을 기반으로 속도, 정확성, 사용성 사이에서 전설적인 균형을 이룹니다.

아키텍처 및 사용성

YOLOv5 GPU 및 CPU 하드웨어의 견고성과 효율성을 위해 선택된 아키텍처인 PANet 넥과 결합된 CSPDarknet53 백본을 활용합니다. 검증된 방법론인 앵커 기반 탐지를 사용하지만, 그 진정한 힘은 엔지니어링과 에코시스템에 있습니다:

  • 간소화된 사용자 경험: YOLOv5 "제로에서 영웅으로"라는 철학으로 유명합니다. 개발자는 단 몇 줄의 코드만으로 환경을 설정하고, 사용자 지정 데이터 세트를 학습하고, 추론을 실행할 수 있습니다.
  • 다목적성: 표준 객체 감지 외에도 YOLOv5 인스턴스 분할이미지 분류를 지원하여 사용자가 단일 프레임워크 내에서 여러 비전 작업을 처리할 수 있습니다.
  • 내보내기 기능: 이 모델은 다음과 같은 다양한 포맷으로 원활하게 내보낼 수 있도록 지원합니다. ONNX, TensorRT, CoreML, TFLite 등 다양한 포맷을 지원하므로 클라우드 서버부터 엣지 디바이스까지 모든 곳에 쉽게 배포할 수 있습니다.
  • 메모리 효율성: Ultralytics 모델은 일반적으로 복잡한 트랜스포머 기반 아키텍처나 NAS를 많이 사용하는 모델에 비해 트레이닝 중 메모리 사용량이 적기 때문에 더 다양한 하드웨어에서 액세스할 수 있습니다.

에코시스템 이점

Ultralytics 에코시스템은 개발을 위한 거대한 가속기입니다. 광범위한 문서, 활발한 커뮤니티 포럼, 빈번한 업데이트를 통해 개발자는 디버깅에 소요되는 시간을 줄이고 혁신에 더 많은 시간을 할애할 수 있습니다. Ultralytics HUB와 같은 도구와의 통합으로 모델 관리 및 교육이 더욱 간소화됩니다.

개발자가 YOLOv5 선택하는 이유

사용 편의성과 훈련 효율을 우선시하는 YOLOv5 여전히 최고의 선택입니다. 사전 학습된 가중치는 쉽게 사용할 수 있고 견고하여 신속한 전이 학습이 가능합니다. 추론 속도가 매우 빠르기 때문에 비디오 분석, 자율 주행, 산업 검사와 같은 실시간 애플리케이션에 이상적입니다.

다음과 같은 최신 모델은 YOLO11 와 같은 최신 모델들이 앵커 프리 아키텍처와 추가적인 성능 향상을 도입했지만, YOLOv5 여전히 수많은 프로덕션 시스템에서 안정적이고 지원이 잘 지원되며 뛰어난 성능을 발휘하는 주력 제품입니다.

YOLOv5에 대해 자세히 알아보세요

성능 비교

직접 비교하면 두 모델 간의 차이가 명확해집니다. YOLO 검증 정확도mAP를 극대화하는 데 중점을 두는 반면, YOLOv5 추론 속도와 배포 실용성에 최적화되어 있습니다. 아래 표는 YOLO 모델이 비슷한 매개변수 수에서 더 높은 mAP 점수를 달성하는 경우가 많지만, YOLOv5 모델(특히 나노 및 소형 변형)은 에지 배포의 결정적인 요소인 CPU GPU 우수한 속도를 제공한다는 점을 강조합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

실제 애플리케이션 코드

Ultralytics 모델에 대한 가장 강력한 주장 중 하나는 통합의 단순성입니다. 아래는 개발자 친화적인 에코시스템의 특성을 보여주는 검증된 예시로, PyTorch Hub를 사용하여 YOLOv5 모델을 얼마나 쉽게 로드하고 추론에 사용할 수 있는지 보여줍니다.

import torch

# Load YOLOv5s from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image source (URL or local path)
img = "https://ultralytics.com/images/zidane.jpg"

# Run inference
results = model(img)

# Print results to console
results.print()

# Show the results
results.show()

결론

두 아키텍처는 컴퓨터 비전 환경에서 각기 다른 역할을 수행합니다. 최첨단 정확도를 달성하는 것이 유일한 목표이고 NAS 기반 트레이닝 파이프라인의 복잡성이 허용되는 학술 연구 및 경연 대회에는 YOLO 탁월한 선택이 될 수 있습니다.

그러나 대다수의 개발자, 연구원 및 기업에게는 그렇지 않습니다, Ultralytics YOLOv5 (및 그 후속 버전인 YOLO11)가 여전히 최고의 추천 제품입니다. 잘 관리된 에코시스템의 장점은 아무리 강조해도 지나치지 않습니다. 간단한 API, 포괄적인 문서화, 원활한 내보내기 옵션으로 시장 출시 시간을 대폭 단축할 수 있습니다. 실시간 제약 조건을 효과적으로 처리하는 성능 균형과 세분화 및 분류와 같은 작업 전반에 걸친 다목적성을 갖춘 Ultralytics 모델은 실용적인 AI 솔루션 구축을 위한 견고하고 미래 지향적인 기반을 제공합니다.

최신 성능과 기능을 원하는 분들께는 다음과 같은 제품을 적극 추천합니다. YOLO11를 살펴보는 것을 적극 추천합니다. 이 버전은 기존 YOLOv5 기반으로 정확성과 효율성을 더욱 향상시켰습니다.

다른 비교 살펴보기

필요에 가장 적합한 모델을 추가로 평가하려면 다음 세부 비교를 살펴보세요:


댓글