YOLO11 대 PP-YOLOE+: 상세 모델 비교
정확도, 속도 및 배포 효율성의 요구 사항 간의 균형을 맞추는 올바른 객체 감지 모델을 선택하는 것은 매우 중요한 결정입니다. 이 페이지에서는 Ultralytics의 최신 최첨단 모델인 Ultralytics YOLO11과 Baidu의 PaddlePaddle 에코시스템의 강력한 모델인 PP-YOLOE+ 간의 포괄적인 기술 비교를 제공합니다. 두 모델 모두 매우 유능하지만 YOLO11은 뛰어난 성능 균형, 탁월한 사용 용이성, 다재다능하고 잘 관리되는 에코시스템과의 통합으로 두각을 나타내므로 광범위한 컴퓨터 비전 응용 분야에 권장되는 선택입니다.
Ultralytics YOLO11: 최첨단 성능 및 다재다능함
Ultralytics YOLO11은 Glenn Jocher와 Jing Qiu가 엔지니어링한 Ultralytics의 최신 플래그십 모델입니다. 2024년 9월 27일에 출시되었으며 실시간 객체 탐지 및 그 이상에서 새로운 표준을 설정하기 위해 YOLOv8과 같은 매우 성공적인 이전 모델의 유산을 기반으로 합니다. YOLO11은 최대 효율성, 다재다능성 및 사용자 친화성을 위해 설계되어 고급 컴퓨터 비전을 모든 곳의 개발자와 연구원이 액세스할 수 있도록 합니다.
작성자: Glenn Jocher, Jing Qiu
기관: Ultralytics
날짜: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolo11/
아키텍처 및 주요 기능
YOLO11은 속도와 정확도 간의 균형을 최적화하는 정교한 단일 단계 앵커 프리(Anchor-Free) 아키텍처를 특징으로 합니다. 간소화된 네트워크 설계는 매개변수 수와 계산 부하를 줄여 더 빠른 추론 속도와 더 낮은 메모리 요구 사항을 제공합니다. 이러한 효율성 덕분에 YOLO11은 NVIDIA Jetson과 같은 리소스가 제한된 에지 장치에서 강력한 클라우드 서버에 이르기까지 다양한 하드웨어에 배포하는 데 이상적입니다.
YOLO11의 가장 큰 강점 중 하나는 다재다능함입니다. 객체 감지 모델일 뿐만 아니라 인스턴스 분할, 이미지 분류, 포즈 추정 및 OBB(Oriented Bounding Box)를 지원하는 포괄적인 비전 프레임워크입니다. 이 다중 작업 기능은 사용 편의성으로 유명한 Ultralytics 생태계에 완벽하게 통합되어 있습니다. 간단한 Python API 및 CLI, 광범위한 문서 및 지원 커뮤니티를 통해 개발자는 몇 분 안에 시작할 수 있습니다. 또한 이 생태계에는 노코드 훈련 및 배포를 위한 Ultralytics HUB와 같은 도구가 포함되어 진입 장벽을 더욱 낮춥니다.
강점
- 뛰어난 성능 균형: 속도와 정확성 사이에서 뛰어난 균형을 이루며, 종종 더 적은 파라미터로 경쟁사보다 뛰어난 성능을 보입니다.
- 탁월한 효율성: CPU와 GPU 모두에서 고속 추론에 최적화되었으며 교육 및 배포 중 메모리 사용량이 적습니다.
- 탁월한 다재다능함: 단일 프레임워크가 광범위한 비전 작업을 지원하여 복잡한 프로젝트를 위한 통합 솔루션을 제공합니다.
- 사용 편의성: 간단한 API, 포괄적인 문서, 풍부한 튜토리얼을 통해 간소화된 사용자 경험을 제공합니다.
- 잘 관리되는 에코시스템: 활발한 개발, 잦은 업데이트, 강력한 커뮤니티 지원, 그리고 MLOps 도구와의 원활한 통합을 통해 이점을 얻습니다.
- 효율적인 훈련: 즉시 사용 가능한 사전 훈련된 가중치와 최적화된 훈련 루틴을 제공하여 개발 주기를 단축합니다.
약점
- 단일 단계 검출기인 YOLO는 특화된 2단계 검출기에 비해 밀집된 장면에서 매우 작은 객체에 대한 문제점이 있을 수 있습니다.
- YOLO11x와 같은 가장 큰 모델은 실시간 성능을 달성하기 위해 상당한 컴퓨팅 리소스가 필요하며, 이는 고정밀 모델의 일반적인 특징입니다.
사용 사례
YOLO11은 속도, 정확성 및 다재다능성을 결합하여 광범위하고 까다로운 응용 분야에 이상적인 선택입니다.
- 산업 자동화: 제조업의 품질 관리 및 로봇 공학에 활용됩니다.
- 스마트 시티: 실시간 교통 모니터링 및 공공 보안 시스템을 강화합니다.
- 소매 분석: 재고 관리를 개선하고 도난을 방지합니다.
- 헬스케어: 더 빠른 진단을 위한 의료 영상 분석 지원.
PP-YOLOE+: PaddlePaddle 생태계 내의 높은 정확도
PP-YOLOE+는 Baidu에서 개발하고 2022년에 PaddleDetection 제품군의 일부로 출시한 객체 감지 모델입니다. 특히 PaddlePaddle 딥 러닝 프레임워크 내에서 합리적인 효율성을 유지하면서 높은 정확도를 달성하는 데 중점을 둔 앵커 프리(anchor-free) 단일 단계 검출기입니다.
작성자: PaddlePaddle Authors
기관: Baidu
날짜: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/PaddlePaddle/PaddleDetection/
Docs: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
아키텍처 및 주요 기능
PP-YOLOE+는 또한 앵커 프리 설계를 채택하여 감지 헤드를 단순화합니다. 이 모델의 아키텍처는 종종 CSPRepResNet과 같은 백본을 사용하고 Varifocal Loss 및 효율적인 ET-Head와 같은 기술을 통합하여 성능을 향상시킵니다. 이 모델은 PaddlePaddle 생태계에 고도로 최적화되어 있으며, 이는 핵심 설계 고려 사항입니다.
강점과 약점
PP-YOLOE+는 특히 더 큰 모델 변형에서 높은 mAP 점수를 제공하는 강력한 성능을 자랑합니다. 그러나 주요 약점은 생태계 종속성에 있습니다. PaddlePaddle에 종속되어 있다는 점은 PyTorch를 사용하는 대다수의 개발자와 연구자에게 상당한 학습 곡선과 통합 문제를 야기할 수 있습니다. 또한 성능 표에서 볼 수 있듯이 YOLO11과 비슷한 정확도를 얻기 위해 모델이 훨씬 더 많은 파라미터와 FLOP를 요구하는 경우가 많아 계산 효율성이 떨어집니다.
사용 사례
PP-YOLOE+는 높은 정확도가 가장 중요하고 개발 환경이 이미 PaddlePaddle 기반인 애플리케이션에 적합합니다.
- 산업 검사: 제조 라인의 결함 감지.
- 리테일: 자동 재고 점검 및 분석.
- 재활용: 자동 분류를 위해 재료를 식별합니다.
성능 분석: YOLO11 vs. PP-YOLOE+
성능 지표를 비교할 때 Ultralytics YOLO11은 최첨단 정확도를 제공하면서 효율성과 속도에서 분명한 이점을 보여줍니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
- 정확도 vs. 효율성: YOLO11은 유사한 모델 규모에서 PP-YOLOE+보다 일관되게 더 높은 mAP 점수를 달성합니다(예: YOLO11m vs. PP-YOLOE+m). 중요한 점은 파라미터와 FLOP 수가 훨씬 적다는 것입니다. 예를 들어 YOLO11x는 PP-YOLOE+x의 mAP와 일치하지만 파라미터는 58%에 불과하고 FLOP 수도 더 적어 훨씬 효율적인 모델입니다.
- 추론 속도: YOLO11은 전반적으로 훨씬 빠릅니다. T4 GPU에서 모든 YOLO11 변형이 PP-YOLOE+ 대응 모델보다 성능이 뛰어납니다. YOLO11의 CPU 벤치마크 가용성은 전용 GPU가 없는 애플리케이션에 중요한 이점인 배포 유연성을 더욱 강조합니다.
학습, 사용성 및 생태계
원시 성능 외에도 개발자 경험은 Ultralytics YOLO11이 진정으로 빛을 발하는 곳입니다. Ultralytics 생태계는 가장 인기 있는 딥 러닝 프레임워크인 PyTorch를 기반으로 구축되어 방대한 커뮤니티, 광범위한 리소스 및 광범위한 하드웨어 지원을 보장합니다. 훈련, 유효성 검사 및 배포는 간단하고 직관적인 명령으로 간소화됩니다.
반면, PP-YOLOE+는 PaddlePaddle 프레임워크에 국한됩니다. 강력하기는 하지만, 이 생태계는 덜 널리 퍼져 있어 학습 곡선이 더 가파르고, 커뮤니티에서 제공되는 리소스가 적으며, 다른 도구와의 통합 시 더 많은 어려움이 발생할 수 있습니다. YOLO11의 학습 과정 및 메모리 사용량 또한 고도로 최적화되어 있어 더 광범위한 하드웨어에서 더 빠른 실험과 배포가 가능합니다.
결론: YOLO11이 권장되는 이유
PP-YOLOE+는 훌륭한 객체 감지 모델이지만, 대다수의 사용 사례에서 Ultralytics YOLO11이 더 나은 선택입니다. 최첨단 정확도, 뛰어난 추론 속도 및 뛰어난 컴퓨팅 효율성을 제공하는 더욱 강력한 패키지입니다.
YOLO11의 주요 장점은 다음과 같습니다.
- 더 나은 전체 성능: 더 적은 컴퓨팅 자원으로 더 높은 정확도를 제공합니다.
- 더 큰 다양성: 여러 비전 작업을 위한 단일 통합 프레임워크입니다.
- 탁월한 사용 편의성: 개발을 가속화하는 사용자 친화적인 API 및 에코시스템입니다.
- 더 넓은 커뮤니티 및 지원: PyTorch를 기반으로 구축되었으며 활발한 Ultralytics 팀과 커뮤니티에서 지원합니다.
강력하고 유연하며 사용하기 쉬운 비전 AI 모델을 찾는 개발자 및 연구자에게 YOLO11은 명확한 승자이며, 더 빠른 속도와 효율성으로 최첨단 애플리케이션을 만들 수 있도록 지원합니다.
다른 모델 살펴보기
다양한 아키텍처를 탐색하는 경우 Ultralytics 생태계 내에서 사용 가능한 다른 최첨단 모델에도 관심이 있을 수 있습니다. 다른 비교 페이지를 확인하십시오.