YOLOv8 vs. PP-YOLOE+: 기술 비교
객체 감지 모델을 선택할 때 개발자는 정확도, 추론 속도 및 구현 용이성 간의 균형을 고려해야 합니다. 이 페이지에서는 Ultralytics의 다재다능하고 널리 채택된 모델인 Ultralytics YOLOv8과 Baidu의 고정확도 모델인 PP-YOLOE+의 두 가지 강력한 모델 간의 자세한 기술 비교를 제공합니다. 아키텍처 차이점, 성능 벤치마크 및 이상적인 사용 사례를 자세히 살펴보고 컴퓨터 비전 프로젝트에 가장 적합한 모델을 결정하는 데 도움을 드립니다.
Ultralytics YOLOv8: 다재다능성 및 성능
Ultralytics YOLOv8은 이전 YOLO 버전의 성공을 기반으로 구축된 Ultralytics에서 개발한 최첨단 모델입니다. 객체 탐지, 인스턴스 분할, 이미지 분류, 포즈 추정 등을 위한 모델 학습을 위한 통합 프레임워크로 설계되었습니다. 성능, 유연성 및 사용 편의성의 조합으로 개발자와 연구자 모두에게 인기가 높습니다.
작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
소속: Ultralytics
날짜: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolov8/
아키텍처 및 주요 기능
YOLOv8은 가벼움을 유지하면서 특징 추출 기능을 향상시키는 새로운 C2f 백본을 갖춘 앵커 프리 설계를 특징으로 합니다. PyTorch에서 기본적으로 구축되어 접근성이 높고 수정하기 쉽습니다.
YOLOv8의 주요 장점은 잘 관리된 Ultralytics 생태계에 있습니다. 간단한 Python API 및 CLI, 광범위한 문서 및 활발한 커뮤니티 지원을 통해 간소화된 사용자 경험을 제공합니다. 이 모델은 단일 프레임워크 내에서 여러 비전 작업을 지원하는 매우 다재다능하며, 이는 보다 전문화된 모델에서는 종종 부족한 기능입니다. 또한 YOLOv8은 많은 대안에 비해 더 빠른 훈련 시간과 더 낮은 메모리 요구 사항으로 뛰어난 훈련 효율성을 보여줍니다. Ultralytics HUB와의 통합은 데이터 레이블링에서 배포에 이르기까지 전체 MLOps 파이프라인을 간소화합니다.
강점
- 뛰어난 성능 균형: 속도와 정확도 간의 강력한 균형을 제공하므로 에지 장치에서 클라우드 서버에 이르기까지 광범위한 애플리케이션에 적합합니다.
- 다재다능함: 단일 모델 프레임워크는 감지, 분할, 분류, 포즈 추정 및 OBB(oriented bounding box)를 지원하여 탁월한 유연성을 제공합니다.
- 사용 편의성: 사용자 친화적인 API, 포괄적인 문서 및 크고 활발한 커뮤니티를 통해 쉽게 시작하고 문제를 해결할 수 있습니다.
- 잘 관리되는 에코시스템: 지속적인 업데이트, 새로운 기능, 그리고 Weights & Biases 및 Comet과 같은 MLOps 도구와의 원활한 통합을 통해 이점을 얻습니다.
- Deployment Flexibility: ONNX, TensorRT 및 OpenVINO와 같은 다양한 형식으로 쉽게 내보낼 수 있어 다양한 하드웨어에서 최적화된 추론이 가능합니다.
약점
- 매우 경쟁력이 있지만, 가장 큰 PP-YOLOE+ 모델은 COCO 데이터 세트에서 약간 더 높은 mAP를 달성할 수 있지만, 파라미터가 훨씬 많고 추론 속도가 느립니다.
사용 사례
YOLOv8의 균형 잡힌 성능과 다재다능함은 다음과 같은 분야에 이상적입니다.
- 실시간 비디오 분석: 보안 시스템, 교통 모니터링 및 군중 관리에 활용됩니다.
- 산업 자동화: 제조업의 품질 관리 자동화 및 창고 물류 개선.
- 소매 분석: 재고 관리를 개선하고 고객 행동을 분석합니다.
- 헬스케어: 종양 감지와 같은 작업을 위한 의료 영상 분석 지원.
PP-YOLOE+: PaddlePaddle 생태계에서 높은 정확도 제공
PP-YOLOE+는 Baidu에서 PaddleDetection 제품군의 일부로 개발한 객체 감지 모델입니다. 합리적인 효율성을 유지하면서 높은 정확도를 달성하는 데 중점을 둔 앵커 프리(anchor-free) 단일 단계 검출기입니다. 이 모델은 PaddlePaddle 딥 러닝 프레임워크를 기반으로 구축되었습니다.
작성자: PaddlePaddle Authors
기관: Baidu
날짜: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/PaddlePaddle/PaddleDetection/
Docs: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
아키텍처 및 주요 기능
PP-YOLOE+는 분류 및 회귀를 위한 분리된 헤드와 TAL(Task Alignment Learning)이라는 특수 손실 함수를 포함하여 몇 가지 아키텍처 개선 사항을 도입합니다. 효과적인 기능 융합을 위해 PAN(Path Aggregation Network) neck과 결합된 ResNet 또는 CSPRepResNet과 같은 백본을 사용합니다. 이러한 설계 선택은 특히 더 큰 모델 변형에서 높은 정확도에 기여합니다.
강점
- 높은 정확도: 가장 큰 모델인 PP-YOLOE+x는 COCO 벤치마크에서 매우 높은 mAP 점수를 달성합니다.
- 효율적인 앵커 프리 디자인: 미리 정의된 앵커 박스의 필요성을 제거하여 감지 파이프라인을 단순화합니다.
- PaddlePaddle에 최적화됨: PaddlePaddle 생태계와 긴밀하게 통합되어 있어 이미 이 프레임워크를 사용하고 있는 개발자에게는 장점이 될 수 있습니다.
약점
- 프레임워크 종속성: PaddlePaddle 프레임워크에 대한 주요 의존성은 주로 PyTorch를 사용하는 더 광범위한 커뮤니티에 대한 접근성을 제한합니다.
- 제한적인 다용도성: PP-YOLOE+는 주로 객체 감지기이며 YOLOv8에서 볼 수 있는 분할, 분류 및 포즈 추정에 대한 기본 멀티태스킹 지원이 부족합니다.
- 높은 리소스 사용량: 성능 표에서 볼 수 있듯이 PP-YOLOE+ 모델은 일반적으로 유사한 정확도 수준에서 YOLOv8 모델보다 더 많은 파라미터와 더 높은 FLOPs를 가집니다.
- 제한적인 확장성: 커뮤니티 지원, 문서, 타사 통합이 Ultralytics YOLOv8에서 제공되는 것만큼 포괄적이지 않습니다.
사용 사례
PP-YOLOE+는 최고 수준의 정확도 달성이 최우선 과제이며 개발팀이 PaddlePaddle 프레임워크를 표준으로 사용하는 애플리케이션에 적합합니다.
- 산업 결함 감지: 정밀성이 중요한 제조 분야에서 미세한 결함을 식별합니다.
- 특수 과학 연구: 특정 데이터 세트에서 가능한 가장 높은 탐지 정확도를 요구하는 프로젝트.
- 리테일 자동화: 자동 결제 시스템과 같은 고정밀 작업.
성능 및 벤치마크 분석
아래 성능 비교는 YOLOv8과 PP-YOLOE+ 간의 주요 차이점을 강조합니다. PP-YOLOE+x는 가장 높은 mAP를 달성하지만 YOLOv8x보다 44% 더 많은 매개변수를 사용합니다. 대조적으로 YOLOv8 모델은 일관되게 우수한 효율성을 보여주어 더 나은 속도와 더 낮은 리소스 요구 사항을 제공합니다. 예를 들어 YOLOv8n은 CPU 및 GPU에서 모든 PP-YOLOE+ 모델보다 훨씬 빠르면서 가장 적은 매개변수와 FLOP를 사용합니다. 이러한 효율성 덕분에 YOLOv8은 특히 리소스가 제한된 에지 장치에서 실제 배포에 더 실용적인 선택입니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
결론: 어떤 모델을 선택해야 할까요?
대다수의 개발자와 애플리케이션에게 Ultralytics YOLOv8이 더 나은 선택입니다. 속도, 정확성 및 리소스 효율성의 뛰어난 균형을 제공하여 경쟁 모델을 압도합니다. 그러나 진정한 강점은 다재다능함과 견고한 생태계에 있습니다. 사용하기 쉬운 단일 프레임워크 내에서 여러 컴퓨터 비전 작업을 처리할 수 있는 기능과 광범위한 문서, 활발한 커뮤니티 지원, 원활한 MLOps 통합을 통해 YOLOv8은 매우 강력하고 실용적인 도구입니다.
PP-YOLOE+는 PaddlePaddle 프레임워크 내에서 정확도의 경계를 넓히는 훌륭한 모델입니다. Baidu 생태계에 이미 투자한 팀이나 모델 크기 및 프레임워크 유연성 측면에서 비용에 관계없이 mAP에서 마지막 몇 퍼센트의 아주 작은 부분을 짜내는 것이 유일한 목표인 틈새 애플리케이션에 적합한 옵션입니다.
궁극적으로 유연하고 빠르며 사용하기 쉬운 모델을 찾고 있고, 광범위한 작업에 잘 지원되고 적응할 수 있다면 YOLOv8이 확실한 승자입니다.
다른 모델 살펴보기
다른 최첨단 모델을 살펴보고 싶다면 다른 비교 페이지도 확인해 보세요.