PP-YOLOE+ vs. YOLOv8: 기술 비교
정확도, 속도 및 구현 용이성 간의 균형을 맞추는 올바른 객체 감지 모델을 선택하는 것은 매우 중요한 결정입니다. 이 페이지에서는 Baidu의 고정확도 모델인 PP-YOLOE+와 다재다능함과 성능으로 잘 알려진 최첨단 모델인 Ultralytics YOLOv8 간의 포괄적인 기술 비교를 제공합니다. 컴퓨터 비전 프로젝트에 가장 적합한 모델을 선택하는 데 도움이 되도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 자세히 살펴보겠습니다.
PP-YOLOE+: PaddlePaddle 생태계에서 높은 정확도 제공
PP-YOLOE+는 Baidu에서 PaddleDetection 제품군의 일부로 개발한 객체 감지 모델입니다. 2022년에 출시되었으며, 주로 PaddlePaddle 딥 러닝 프레임워크 내에서 합리적인 효율성을 유지하면서 높은 정확도를 달성하는 데 중점을 두고 YOLO 아키텍처를 기반으로 구축되었습니다.
기술 세부 사항:
- 작성자: PaddlePaddle 작성자
- Organization: Baidu
- 날짜: 2022-04-02
- ArXiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- 문서: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
아키텍처 및 주요 기능
PP-YOLOE+는 YOLO 프레임워크에 몇 가지 개선 사항을 도입한 단일 스테이지, 앵커 프리 감지기입니다.
- Efficient Task-aligned Head (ET-Head): 정확도를 향상시키기 위해 Varifocal Loss 및 Distribution Focal Loss와 함께 분리된 헤드를 사용합니다.
- Task Alignment Learning (TAL): 분류 및 지역화 작업을 정렬하여 탐지 정확도를 향상시키는 전략입니다.
- Backbone and Neck: 강력한 특징 추출 및 융합을 위해 CSPRepResNet 백본과 PAN(Path Aggregation Network) 넥을 주로 사용합니다.
강점과 약점
강점:
- 높은 정확도: 더 큰 PP-YOLOE+ 모델은 COCO 데이터 세트에서 매우 높은 mAP 점수를 달성하여 정밀도가 가장 중요한 작업에 적합합니다.
- 효율적인 앵커 프리 디자인: 감지 헤드를 단순화하고 조정할 하이퍼파라미터 수를 줄입니다.
약점:
- 생태계 의존성: PP-YOLOE+는 PaddlePaddle 프레임워크와 깊이 통합되어 있어 PyTorch 또는 TensorFlow를 주로 사용하는 개발자와 연구자에게는 상당한 장벽이 될 수 있습니다.
- 제한적인 활용성: 이 모델은 주로 객체 탐지에 중점을 두고 있으며, 보다 포괄적인 프레임워크에서 제공하는 다른 비전 작업에 대한 기본 지원이 부족합니다.
- 커뮤니티 및 지원: 커뮤니티 및 사용 가능한 리소스는 Ultralytics YOLO 모델을 둘러싼 광대한 생태계에 비해 덜 광범위할 수 있습니다.
Ultralytics YOLOv8: 최첨단 다재다능성 및 성능
Ultralytics YOLOv8은 Ultralytics에서 개발한 최첨단 모델입니다. 2023년에 출시되었으며, 속도, 정확성 및 사용 편의성에 대한 새로운 표준을 제시합니다. YOLOv8은 단순한 객체 탐지 모델이 아니라 다양한 비전 AI 작업에서 뛰어난 성능을 발휘하도록 설계된 포괄적인 프레임워크입니다.
기술 세부 사항:
- 작성자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
- 조직: Ultralytics
- 날짜: 2023-01-10
- GitHub: https://github.com/ultralytics/ultralytics
- 문서: https://docs.ultralytics.com/models/yolov8/
아키텍처 및 생태계 장점
YOLOv8은 C2f 백본과 분리된 헤드가 있는 고급 앵커 프리 아키텍처를 특징으로 하여 성능과 효율성의 우수한 균형을 제공합니다. 그러나 진정한 강점은 그것이 속한 전체적인 생태계에 있습니다.
- 탁월한 다재다능함: YOLOv8은 객체 감지, 인스턴스 분할, 이미지 분류, 포즈 추정 및 객체 추적을 위한 통합 프레임워크를 제공합니다. 이러한 다중 작업 기능은 복잡한 컴퓨터 비전 프로젝트를 위한 원스톱 솔루션입니다.
- 사용 편의성: Ultralytics는 개발자 경험을 우선시합니다. YOLOv8은 광범위한 documentation 및 튜토리얼을 기반으로 하는 간단하고 직관적인 Python API와 CLI를 제공합니다.
- 잘 관리되는 에코시스템: 이 모델은 Ultralytics와 대규모 오픈 소스 커뮤니티에 의해 활발히 개발되고 지원됩니다. 이를 통해 잦은 업데이트, 새로운 기능 및 문제에 대한 빠른 해결이 보장됩니다. Ultralytics HUB와 같은 도구와의 통합은 노코드 학습 및 배포 솔루션을 제공합니다.
- 학습 효율성: YOLOv8은 효율적인 학습을 위해 설계되었으며, 많은 대안에 비해 더 적은 메모리와 시간을 필요로 합니다. 사전 학습된 가중치를 즉시 사용할 수 있어 사용자 정의 데이터 세트에서 빠른 개발 및 미세 조정이 가능합니다.
사용 사례
YOLOv8은 성능, 속도 및 다재다능함이 결합되어 광범위한 애플리케이션에 이상적인 선택입니다.
- 실시간 분석: 속도가 중요한 교통 모니터링, 보안 감시 및 스포츠 분석에 적합합니다.
- 산업 자동화: 제조 분야의 품질 관리, 결함 감지 및 로봇 안내에 사용됩니다.
- Edge 배포: YOLOv8n과 같은 경량 모델은 NVIDIA Jetson 및 Raspberry Pi와 같이 리소스가 제한된 장치에 최적화되어 있습니다.
- 의료: 종양 감지 및 세포 분할과 같은 작업을 위해 의료 영상 분석에 적용됩니다.
성능 비교: 속도, 정확도 및 효율성
성능을 비교할 때 두 모델 모두 매우 유능하다는 것을 알 수 있습니다. 그러나 YOLOv8은 속도, 정확도 및 계산 비용의 전체적인 그림을 고려할 때 더욱 강력한 패키지를 제공합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
표에서 다음과 같은 몇 가지 결론을 내릴 수 있습니다.
- 정확도: 가장 큰 PP-YOLOE+x 모델이 mAP에서 YOLOv8x를 앞서지만, YOLOv8 모델은 매우 경쟁력이 있으며 종종 소형 및 중형 크기 클래스(예: YOLOv8s/m)에서 우수합니다.
- 효율성: YOLOv8 모델은 특히 더 큰 규모에서 파라미터 및 FLOP 측면에서 훨씬 더 효율적입니다. 예를 들어 YOLOv8l은 더 적은 파라미터로 PP-YOLOE+l과 동일한 mAP를 달성하고 YOLOv8x는 파라미터의 70%만으로 PP-YOLOE+x만큼 정확합니다.
- 속도: YOLOv8n은 GPU에서 전체적으로 가장 빠른 모델입니다. 전반적으로 추론 속도는 비슷하지만, YOLOv8은 GPU 없이도 더 넓은 범위의 하드웨어에 배포할 수 있도록 접근성을 강조하는 포괄적인 CPU 벤치마크를 제공합니다.
결론: YOLOv8이 권장되는 이유
PP-YOLOE+는 높은 정확도를 제공하는 강력한 모델이지만, PaddlePaddle 생태계에 대한 의존성으로 인해 틈새 선택이 됩니다. 대다수의 개발자, 연구원 및 기업에게 Ultralytics YOLOv8이 더 나은 옵션입니다.
YOLOv8은 최첨단 성능을 제공할 뿐만 아니라 유연하고 사용자 친화적이며 포괄적인 프레임워크 내에서 이를 수행합니다. 여러 작업에 걸친 다재다능함, 사용 용이성, 탁월한 훈련 및 배포 효율성, 활발한 생태계 지원과 같은 주요 장점은 최신 비전 AI 솔루션을 구축하는 데 가장 실용적이고 강력한 선택입니다. 에지 장치에서 실시간 속도를 우선시하든 클라우드에서 최대 정확도를 우선시하든 YOLOv8 모델 제품군은 확장 가능하고 강력한 솔루션을 제공합니다.
다른 최첨단 모델을 탐색하는 데 관심이 있는 사람들을 위해 Ultralytics는 YOLOv10, YOLO11 및 RT-DETR과 같은 모델과의 비교도 제공합니다.