콘텐츠로 건너뛰기

YOLO11 PP-YOLOE+: 자세한 기술 비교

최적의 객체 감지 아키텍처를 선택하는 것은 컴퓨터 비전 프로젝트의 속도, 정확도, 배포 가능성에 영향을 미치는 중요한 결정입니다. 이 가이드에서는 다음 간의 심층적인 기술 비교를 제공합니다. Ultralytics YOLO11와 바이두 PaddlePaddle 에코시스템의 강력한 검출기인 PP-YOLOE+를 심층적으로 비교합니다. 두 모델 모두 고성능을 제공하지만, YOLO11 뛰어난 계산 효율성, 원활한 PyTorch 통합, 연구자와 엔지니어의 개발 가속화를 위해 설계된 포괄적인 에코시스템을 통해 차별화됩니다.

Ultralytics YOLO11: 효율성과 다목적성의 만남

YOLO11 실시간 객체 감지의 한계를 뛰어넘기 위해 Ultralytics 출시한 유명한 YOLO (You Only Look Once) 시리즈의 최신 진화 버전입니다. 글렌 조처와 징 치우가 설계한 이 모델은 앵커 프리 아키텍처를 개선하여 계산 오버헤드를 크게 줄이면서 뛰어난 정확도를 제공합니다.

저자 저자: Glenn Jocher, Jing Qiu
조직:Ultralytics
날짜: 2024-09-27
GitHubultralytics
Docsyolo11

아키텍처 및 핵심 강점

YOLO11 특징 추출과 융합을 최적화하는 간소화된 네트워크 설계를 채택하고 있습니다. 사전 정의된 박스에 의존하는 기존의 앵커 기반 디텍터와 달리 YOLO11 물체의 중심과 크기를 직접 예측합니다. 이 접근 방식은 모델 헤드를 단순화하고 튜닝에 필요한 하이퍼파라미터의 수를 줄입니다.

이 모델의 아키텍처는 매우 다재다능하여 단순 감지를 넘어 광범위한 컴퓨터 비전 작업을 지원합니다. 이 모델은 기본적으로 단일 통합 프레임워크 내에서 인스턴스 분할, 포즈 추정, 이미지 분류, 방향성 경계 상자(OBB)를 모두 처리합니다.

개발자 경험

YOLO11 가장 큰 장점 중 하나는 바로 ultralytics Python 패키지. 이는 교육, 유효성 검사 및 배포를 위한 일관된 API를 제공하여 개발자가 작업 간에 전환하거나 다음과 같은 형식으로 모델을 내보낼 수 있습니다. ONNXTensorRT 를 한 줄의 코드로 만들 수 있습니다.

주요 이점

  • 뛰어난 성능 균형: YOLO11 업계 최고의 절충점을 달성합니다. mAP 과 추론 지연 시간 간의 업계 최고의 균형을 달성하여 엣지 디바이스의 실시간 애플리케이션에 적합합니다.
  • 계산 효율성: 이 모델은 PP-YOLOE+와 같은 경쟁사 모델에 비해 더 적은 수의 매개변수와 부동 소수점 연산(FLOP)을 필요로 하므로 실행 속도가 빨라지고 에너지 소비가 줄어듭니다.
  • 낮은 메모리 풋프린트: 효율적인 메모리 사용을 위해 최적화된 YOLO11 리소스를 많이 사용하는 트랜스포머 모델과 달리 VRAM이 제한된 하드웨어에서 더 빠르게 트레이닝하고 실행할 수 있습니다.
  • 강력한 에코시스템: 사용자는 적극적인 유지 관리, 광범위한 문서화 및 커뮤니티 지원을 통해 기업 프로젝트의 장기적인 실행 가능성을 보장받습니다.

YOLO11에 대해 자세히 알아보세요

PP-YOLOE+: PaddlePaddle 에코시스템의 높은 정밀도

PP-YOLOE+는 바이두 연구진이 개발한 YOLO 시리즈의 발전된 버전입니다. 2022년에 출시된 이 제품은 패들감지 툴킷의 일부로, PaddlePaddle 딥러닝 프레임워크 내에서 효율적으로 실행되도록 설계되었습니다.

저자들: PaddlePaddle 저자:
조직:바이두
날짜: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHubPaddlePaddle
문서:PaddleDetection 문서

아키텍처 및 기능

PP-YOLOE+는 CSPRepResNet 백본과 효율적인 작업 정렬 헤드(ET-Head)를 활용합니다. 이 모델은 작업 정렬 학습(TAL)을 통한 동적 라벨 할당을 통합하고 다양 초점 손실(Varifocal Loss)을 사용해 객체 분류 품질을 향상시킵니다. 이 모델은 특히 PaddlePaddle 추론 엔진에 최적화되어 있으며, 배포를 위해 TensorRT 통합을 활용합니다.

장점과 한계

PP-YOLOE+는 다음과 같은 벤치마크에서 경쟁력 있는 정확도를 제공하지만 COCO와 같은 벤치마크에 비해 경쟁력 있는 정확도를 제공하지만 프레임워크 종속성으로 인해 채택 장애물에 직면해 있습니다. 대부분의 글로벌 연구 커뮤니티는 PyTorch에 의존하고 있어 PaddlePaddle 전환이 마찰의 원인이 되고 있습니다. 또한, PP-YOLOE+ 모델은 일반적으로 YOLO11 같은 최신 아키텍처의 정확도에 맞추기 위해 더 많은 매개변수 수를 필요로 하기 때문에 학습과 추론 과정에서 계산 비용이 증가합니다.

PP-YOLOE+에 대해 자세히 알아보세요.

성능 분석: 효율성 및 속도

성능 메트릭을 직접 비교한 결과, YOLO11 최신 정확도를 유지하면서 효율성과 속도 면에서 PP-YOLOE+보다 지속적으로 우수한 성능을 보였습니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

중요 관찰 사항

  1. 효율성 우위: YOLO11 파라미터 효율성은 극명합니다. 예를 들어, YOLO11x는 PP-YOLOE+x에 비해 54. mAP 달성하지만 파라미터는 9,842만 개에 비해 56.9만 개에 불과합니다. 이는 YOLO11x가 약 42% 더 작아 스토리지 제약이 있는 디바이스에 더 쉽게 배포할 수 있다는 것을 의미합니다.
  2. 추론 속도: 실제 배포 시나리오에서는 속도가 매우 중요합니다. YOLO11n은 T4 GPU 1.5ms의 놀라운 추론 시간을 제공하며, 이는 동급의 PP-YOLOE+t의 2.84ms보다 훨씬 빠른 속도입니다. 이러한 속도 이점 덕분에 자율 주행 차량이나 로봇 공학 같은 애플리케이션에서 더 높은 프레임 속도로 처리할 수 있습니다.
  3. CPU 성능: YOLO11 최적화된 CPU 벤치마크가 제공되어 유연성을 강조합니다. YOLO11n으로 CPU 56.1ms를 달성하면 경쟁사 프레임워크에서는 종종 누락되거나 최적화되지 않은 지표인 전용 GPU 가속 없이도 실행 가능한 실시간 애플리케이션을 구현할 수 있습니다.

실제 사용 사례

YOLO11 아키텍처적 장점은 다양한 산업에 직접적인 혜택으로 이어집니다.

  • 스마트 시티 인프라: YOLO11 높은 처리량은 더 적은 수의 서버를 사용하여 여러 카메라 스트림에서 실시간 교통 모니터링 및 혼잡 분석을 지원합니다.
  • 산업 제조: 짧은 지연 시간에서 뛰어난 정확도를 제공하는 YOLO11 고속 조립 라인에서 품질 관리 및 결함 감지에 탁월합니다.
  • 리테일 분석: 객체 카운팅과 히트맵 생성을 효율적으로 처리하는 이 모델의 기능은 소매업체가 매장 레이아웃과 재고 관리를 최적화하는 데 도움이 됩니다.
  • 의료 영상: 종양 식별이나 세포 구조 분석과 같은 정밀한 의료 이미지 분석에서 세분화를 수행할 수 있는 다양한 기능을 제공합니다.

교육 및 에코시스템 통합

가장 큰 차별화 요소는 개발자가 모델을 쉽게 훈련하고 배포할 수 있다는 점입니다. Ultralytics 에코시스템은 사용자 여정의 간소화를 중심으로 구축되었습니다.

간소화된 워크플로

사용자 지정 데이터 세트에서 YOLO11 모델을 훈련하려면 최소한의 코드만 필요합니다. 이 프레임워크는 데이터 증강, 하이퍼파라미터 진화, GPU GPU 훈련과 같은 복잡한 작업을 자동으로 처리합니다.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

반면, PP-YOLOE+를 활용하려면 원본 데이터 파이프라인이 PyTorch 경우 복잡한 PaddlePaddle 에코시스템, 구성 파일, 잠재적인 변환 스크립트를 탐색해야 하는 경우가 많습니다.

배포 유연성

Ultralytics ONNX, OpenVINO, CoreML, TFLite 등 다양한 포맷을 위한 기본 내보내기 모드를 제공합니다. 따라서 한 번 학습된 모델은 NVIDIA Jetson 엣지 디바이스부터 iOS 스마트폰 또는 클라우드 API에 이르기까지 어디에서나 배포할 수 있습니다.

결론

PP-YOLOE+는 바이두 생태계의 맥락에서 여전히 유능한 모델로 남아 있습니다, Ultralytics YOLO11 이 더 광범위한 컴퓨터 비전 커뮤니티를 위한 탁월한 선택으로 돋보입니다. 훨씬 적은 매개변수 수, 빠른 추론 속도, PyTorch 사용성이 결합되어 진입 장벽을 없애고 시장 출시 기간을 단축할 수 있습니다.

최첨단 성능과 사용 편의성이 균형을 이루는 미래 지향적인 솔루션을 찾는 개발자를 위해 YOLO11 차세대 AI 애플리케이션을 구축하기 위한 강력하고 다재다능하며 매우 효율적인 플랫폼을 제공합니다.

다른 모델 살펴보기

Ultralytics 에코시스템 내의 다른 아키텍처를 살펴보고 싶다면 다음 비교를 고려해 보세요:


댓글