콘텐츠로 건너뛰기

YOLOv6.0 대 PP-YOLOE+: 산업용 객체 탐지 최적화

다양한 하드웨어에서 높은 정확도와 낮은 지연 시간을 동시에 달성할 수 있는 모델에 대한 수요에 힘입어 실시간 객체 탐지 기술은 급속히 발전해 왔습니다. 이 분야를 선도하는 두 가지 주요 아키텍처는 산업용 애플리케이션을 위해 메이투안(Meituan)이 개발한 YOLOv6.0과 바이두(Baidu)의 PaddlePaddle 고급 앵커 프리 모델인 PP-YOLOE+입니다.

이 비교 분석은 컴퓨터 비전 프로젝트에 적합한 도구를 선택하는 데 도움을 주기 위해 각 기술의 아키텍처 혁신, 성능 벤치마크, 배포 적합성을 탐구합니다.

모델 개요

YOLOv6-3.0

저자: 리추이, 리루루, 겅이페이, 장홍량, 쳉멍, 장보, 케자이단, 쉬샤오밍, 추샹샹
소속:메이투안
날짜: 2023년 1월 13일
링크:Arxiv | GitHub

YOLOv6.YOLOv6 흔히 "완전한 재장전(A Full-Scale Reloading)"으로 불리며, 산업용 애플리케이션을 위해 특별히 설계된 단일 단계 객체 탐지기입니다. 주요 설계 목표는 NVIDIA T4 GPU와 같은 하드웨어에서 처리량을 극대화하는 것입니다. 속도와 정확도의 한계를 뛰어넘기 위해 양방향 경로 집계 네트워크(Bi-PAN)와 앵커 보조 훈련(AAT) 전략을 도입했습니다.

6에 대해 자세히 알아보기

PP-YOLOE+

저자: PaddlePaddle
기관:Baidu
날짜: 2022년 4월 2일
링크:Arxiv | GitHub

PP-YOLOE+는YOLO 진화형으로, CSPRepResNet의 확장 가능한 백본과 작업에 최적화된 헤드를 활용합니다. 이는 더 넓은 PaddleDetection 제품군의 일부이며, 고정점 없는(anchor-free) 탐지기로서 높은 정밀도와 낮은 지연 시간을 목표로 합니다. 특히 PaddlePaddle 내에서 배포될 때 강점을 발휘하며, PaddleLite를 활용하여 FPGA 및 NPU 최적화를 포함한 다양한 백엔드 지원을 제공합니다.

PP-YOLOE에 대해 자세히 알아보기

성능 비교

생산용 모델을 선택할 때 평균 정밀도(mAP)와 추론 속도 간의 상충 관계를 이해하는 것이 중요합니다. 아래 표는 다양한 크기의 모델 간 비교 결과를 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

중요 분석

  1. 소형 모델 효율성: 나노/초소형 영역에서 PP-YOLOE+t는 유사한 매개변수 수 대비 현저히 높은 정확도(39.9% mAP 37.5% mAP)를 제공합니다. 그러나 YOLOv6.YOLOv6 GPU에서 지연 시간을 극도로 최적화하여 T4에서 놀라운 1.17ms의 속도를 기록합니다.
  2. 중간 규모 균형: 중간 규모에서는 경쟁이 치열해집니다. YOLOv6. YOLOv6 정확도(50.0% 대 49.8%)와 속도(5.28ms 대 5.56ms)에서 PP-YOLOE+m을 근소하게 앞섭니다. 이는 일반적인 산업용 검사 작업에 강력한 선택지가 됩니다.
  3. 대규모 정확도: 위성 이미지 분석과 같이 최대 세부 정보가 필요한 애플리케이션을 위해 PP-YOLOE+는 54.7% mAP 도달하는 초대형 변형을 제공합니다. 이는 YOLOv6. YOLOv6 이 특정 벤치마크 비교에서 명시적으로 대응하지 않는 크기 계층입니다.

아키텍처 및 혁신

YOLOv6.0: 산업 전문가

YOLOv6 고처리량 환경을 위해 설계된 여러 공격적인 최적화 기법을 YOLOv6 .

  • RepBi-PAN: RepVGG 스타일 블록을 탑재한 양방향 경로 통합 네트워크입니다. 이를 통해 모델은 훈련 중 복잡한 분기를 가질 수 있지만 추론 시 단순한 3x3 컨볼루션으로 융합되어 메모리 접근 비용을 절감합니다.
  • 앵커 보조 훈련(AAT): 모델 추론은 앵커 프리 방식이지만, YOLOv6 훈련 중 수렴 안정화를 위해 앵커 기반 분기를 YOLOv6 두 방식의 장점을 결합합니다.
  • 분리형 헤드: 회귀 및 분류 작업을 분리하여 수렴 속도와 정확도를 향상시키는 현대적 탐지기의 표준 방식입니다.

PP-YOLOE+: 앵커 없는 정제

PP-YOLOE+는 앵커 프리 패러다임을 정교화하며, 특히 특징 표현에 중점을 둡니다.

  • CSPRepResNet 백본: 확장 가능한 백본을 사용하여 크로스 스테이지 부분 네트워크(Cross Stage Partial networks)와 잔차 연결(residual connections)을 결합함으로써 강력한 기울기 흐름을 제공합니다.
  • TAL(작업 정렬 학습): 이 동적 레이블 할당 전략은 분류 품질과 국소화 품질의 결합 점수를 기반으로 가장 우수한 품질의 앵커를 선별합니다.
  • ET-Head: 작업 정렬의 이점을 희생하지 않으면서 속도를 위해 예측 레이어를 간소화하는 효율적인 작업 정렬 헤드.

하드웨어 고려 사항

YOLOv6 NVIDIA (TensorRT)에 YOLOv6 T4 및 A100 칩에서 최고의mAP 자주 보여줍니다. PP-YOLOE+는 PaddleLite를 통한 광범위한 하드웨어 지원이 필요할 때 빛을 발하며, 여기에는 에지 디바이스에 탑재된 ARM CPU 및 NPU도 포함됩니다.

Ultralytics 이점

YOLOv6 PP-YOLOE+는 뛰어난 연구 성과이지만, 개발자들은 논문에서 제품으로 전환할 때 통합, 배포 및 유지 관리에 어려움을 겪는 경우가 많습니다. Ultralytics 이러한 문제점을 직접 해결합니다.

사용 편의성 및 에코시스템

Ultralytics Python 사용하면 최소한의 코드로 모델을 훈련, 검증 및 배포할 수 있습니다. PaddleDetection이나 연구 저장소에서 흔히 요구되는 복잡한 구성 파일과 달리, Ultralytics 워크플로를 Ultralytics .

from ultralytics import YOLO

# Load a model (YOLOv8, YOLO11, or YOLO26)
model = YOLO("yolo26s.pt")

# Train on a custom dataset with a single command
model.train(data="coco8.yaml", epochs=100)

또한, Ultralytics (구 HUB)는 데이터셋 관리, 자동 주석 처리, 원클릭 클라우드 훈련을 위한 노코드 솔루션을 제공하여 팀의 MLOps 라이프사이클을 간소화합니다.

다용도성과 작업 지원

YOLOv6 PP-YOLOE+는 주로 객체 탐지에 중점을 둡니다. 반면 Ultralytics YOLO11YOLO26과 같은 Ultralytics 모델은 단일 라이브러리 내에서 컴퓨터 비전 작업의 전체 스펙트럼을 기본적으로 지원합니다:

교육 효율성 및 메모리

Ultralytics Ultralytics 효율적인 메모리 사용으로 유명합니다. 아키텍처와 데이터 로더를 최적화함으로써 YOLO26과 같은 모델은 구형 아키텍처나 트랜스포머 기반 모델(예: RT-DETR과 같은 모델에 비해 소비자용 GPU에서도 더 큰 배치 크기를 지원합니다. 이로 인해 데이터 센터 없이도 고성능 AI를 활용할 수 있게 되었습니다.

추천: 왜 YOLO26을 선택해야 할까요?

2026년 신규 프로젝트를 시작하는 개발자들에게 Ultralytics 효율성과 정확성의 정점을 보여줍니다. 이 모델은 이전 세대와 경쟁 모델에서 발견된 특정 한계를 해결합니다:

  • 엔드투엔드 NMS: YOLOv6 달리 NMS 비최대 억제) 후처리가 필요할 수 있는 반면, YOLO26은 기본적으로 엔드투엔드 방식입니다. 이는 배포 로직을 단순화하고 혼잡한 장면에서 지연 시간 변동성을 줄여줍니다.
  • MuSGD 최적화기: 대규모 언어 모델(LLM)의 혁신에서 영감을 받아, 복잡한 맞춤형 데이터셋에서도 안정적인 훈련을 보장합니다.
  • 에지 최적화: 분포 초점 손실(DFL) 및 기타 무거운 구성 요소를 제거함으로써 YOLO26은 CPU 속도를 최대 43%까지 향상시켜 GPU를 사용할 수 없는 모바일 및 IoT 애플리케이션에 최적의 선택이 됩니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 범용 탐지기의 전통적인 약점인 소형 물체 탐지 성능을 크게 향상시킵니다.

YOLO26에 대해 더 알아보기

결론

YOLOv6.0과 PP-YOLOE+는 모두 객체 탐지 역사에서 중요한 역할을 수행합니다. 인프라가 NVIDIA 엄격히 종속되어 있고 산업용 검사를 위한 처리량 극대화가 필요하다면 YOLOv6.YOLOv6 선택하십시오. Baidu PaddlePaddle 깊이 통합되어 있거나 중국산 하드웨어 가속기에 대한 특정 지원이 필요하다면 PP-YOLOE+를 선택하십시오.

그러나 다양한 작업에 걸쳐 다용도로 활용 가능하며 사용 편의성과 CPU GPU 모두에서 최첨단 성능을 제공하는 미래 대비 솔루션으로는 Ultralytics 권장합니다. Ultralytics 통합으로 환경 구성에 소요되는 시간을 줄이고 실제 문제 해결에 더 많은 시간을 할애할 수 있습니다.

추가 자료

  • YOLOv8: 산업계에서 널리 사용되는 대표적인 최첨단 모델.
  • YOLOv10: NMS 훈련 전략의 선구자.
  • RT-DETR: 고정밀 시나리오를 위한 실시간 탐지 트랜스포머.
  • YOLO : 맞춤형 훈련 없이 물체를 탐지하는 오픈 어휘 탐지.

댓글