PP-YOLOE+ vs YOLOv10: 기술 비교
최적의 객체 감지 모델을 선택하는 것은 모든 컴퓨터 비전 프로젝트에서 정확도, 속도 및 컴퓨팅 리소스 간의 균형을 맞추는 중요한 결정입니다. 이 페이지에서는 Baidu에서 개발한 PP-YOLOE+와 Ultralytics 생태계에 완전히 통합된 Tsinghua University의 최첨단 모델인 YOLOv10 간의 자세한 기술 비교를 제공합니다. 정보에 입각한 선택을 할 수 있도록 아키텍처, 성능 지표 및 이상적인 사용 사례를 분석합니다.
PP-YOLOE+: PaddlePaddle 생태계에서 높은 정확도 제공
PP-YOLOE+ (Practical PaddlePaddle You Only Look One-level Efficient Plus)는 Baidu의 PaddleDetection 프레임워크에서 제공하는 앵커 프리, 단일 스테이지 객체 감지 모델입니다. 2022년에 소개되었으며, 특히 PaddlePaddle 딥 러닝 환경 내의 사용자를 위해 효율성을 유지하면서 높은 정확도를 제공하는 데 주력합니다.
작성자: PaddlePaddle Authors
기관: Baidu
날짜: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/PaddlePaddle/PaddleDetection/
Docs: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
아키텍처 및 주요 기능
PP-YOLOE+는 성능을 향상시키기 위해 몇 가지 주요 수정 사항을 통해 표준 YOLO 아키텍처를 개선합니다.
- Anchor-Free Design: 사전 정의된 앵커 박스를 제거함으로써 PP-YOLOE+는 감지 파이프라인을 간소화하고 하이퍼파라미터 튜닝의 복잡성을 줄입니다. 이 접근 방식은 많은 최신 앵커 프리(anchor-free) 감지기에서 일반적입니다.
- 효율적인 구성 요소: 속도와 정확도의 균형을 맞추는 데 입증된 조합인 효과적인 특징 융합을 위해 ResNet 백본과 PAN(Path Aggregation Network) neck을 활용합니다.
- Decoupled Head: 이 모델은 detection head 내에서 분류 및 회귀 작업을 분리합니다. 이는 작업 간 간섭을 방지하여 감지 정확도를 향상시키는 것으로 알려진 기술입니다.
- Task Alignment Learning (TAL): 분류 및 지역화 작업을 더 효과적으로 정렬하도록 설계된 특수 손실 함수를 활용하여 보다 정확한 예측을 가능하게 합니다.
강점과 약점
PP-YOLOE+는 강력한 성능을 입증했지만 특정 트레이드오프가 있습니다.
- 강점: 이 모델은 특히 더 큰 변형에서 매우 높은 정확도를 달성할 수 있습니다. 앵커 프리 디자인은 효율적이며 PaddlePaddle 프레임워크에 이미 투자한 사용자에게 매우 최적화되어 있습니다.
- 약점: 주요 단점은 PaddlePaddle 에코시스템과의 긴밀한 결합입니다. 이로 인해 PyTorch와 같은 더 일반적인 프레임워크를 사용하는 개발자에게는 가파른 학습 곡선과 통합 문제가 발생할 수 있습니다. 또한 커뮤니티 지원 및 사용 가능한 리소스는 Ultralytics 에코시스템 내의 모델에 비해 적을 수 있습니다.
사용 사례
PP-YOLOE+는 높은 정확도가 중요하고 개발 환경이 PaddlePaddle 기반인 애플리케이션에 적합합니다.
- 산업 품질 검사: 제조 공정에서 미세한 결함 감지.
- 스마트 리테일: 자동 결제 및 재고 관리와 같은 애플리케이션을 지원합니다.
- 재활용 자동화: 자동 분류 시스템을 위해 다양한 재료를 식별합니다.
YOLOv10: 실시간 엔드 투 엔드 효율성
Ultralytics YOLOv10은 칭화대학교 연구원들이 개발한 YOLO 시리즈의 최신 진화입니다. 2024년 5월에 출시되었으며, 후처리 병목 현상을 제거하고 뛰어난 효율성을 위해 모델을 최적화하여 진정한 엔드 투 엔드 실시간 객체 감지를 달성하기 위한 획기적인 아키텍처 변경 사항을 도입했습니다.
작성자: Ao Wang, Hui Chen, Lihao Liu 외
소속: Tsinghua University
날짜: 2024-05-23
ArXiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
문서: https://docs.ultralytics.com/models/yolov10/
아키텍처 및 주요 기능
YOLOv10의 디자인 철학은 전체적인 효율성과 성능에 중점을 두고 있어 광범위한 애플리케이션에 탁월한 선택입니다.
- NMS-Free 학습: YOLOv10의 가장 중요한 혁신은 학습 중에 일관된 이중 할당을 사용한다는 것입니다. 이를 통해 Non-Maximum Suppression (NMS)가 후처리 중에 필요 없으므로 추론 지연 시간이 크게 줄고 배포 파이프라인이 단순화됩니다.
- 전체적인 효율성-정확도 설계: 이 모델은 백본, Neck, Head의 포괄적인 최적화를 특징으로 합니다. 경량 분류 헤드 및 공간-채널 분리 다운샘플링과 같은 혁신 기술은 풍부한 특징 정보를 보존하면서 계산 오버헤드를 줄입니다.
- 탁월한 효율성 및 확장성: YOLOv10은 Nano(N)에서 Extra-large(X)에 이르기까지 광범위한 확장 가능한 모델을 제공합니다. 이러한 모델은 더 적은 파라미터와 더 낮은 계산 비용(FLOPs)으로 더 높은 정확도를 제공하여 경쟁사보다 지속적으로 뛰어난 성능을 제공합니다.
- Ultralytics 생태계 장점: YOLOv10은 Ultralytics 생태계에 완벽하게 통합되어 있습니다. 따라서 사용자는 간단한 Python API 및 CLI를 통한 사용 편의성, 광범위한 문서, 즉시 사용 가능한 사전 훈련된 가중치를 통한 효율적인 학습, 낮은 메모리 요구 사항을 특징으로 하는 탁월한 경험을 할 수 있습니다. 이 모델은 강력한 커뮤니티와 Ultralytics HUB를 통한 활발한 개발에 의해 지원됩니다.
강점과 약점
YOLOv10은 실시간 객체 감지기의 새로운 표준을 설정합니다.
- 강점: 최첨단 속도와 정확도, 진정한 엔드 투 엔드(end-to-end) NMS-free 디자인, 뛰어난 계산 효율성 및 탁월한 확장성을 제공합니다. 잘 관리되는 Ultralytics 생태계에 통합되어 있어 훈련, 배포 및 유지 관리가 매우 용이합니다.
- 약점: 최신 모델이므로 커뮤니티 및 타사 도구는 YOLOv8과 같이 오랫동안 확립된 모델에 비해 여전히 성장하고 있습니다.
사용 사례
YOLOv10의 효율성과 end-to-end 디자인은 속도와 리소스 제약이 중요한 애플리케이션에 이상적인 선택입니다.
- 실시간 애플리케이션: 자율 주행 자동차, 로보틱스 및 절도 예방을 위한 고속 감시 시스템과 같은 자율 시스템에 적합합니다.
- Edge 배포: 더 작은 변형(YOLOv10n, YOLOv10s)은 Raspberry Pi 및 NVIDIA Jetson과 같은 리소스가 제한된 엣지 장치에 고도로 최적화되어 있습니다.
- 높은 정확도를 요구하는 작업: 더 큰 모델(YOLOv10l, YOLOv10x)은 의료 영상 분석과 같이 까다로운 분야에서 최고의 정밀도를 제공합니다.
성능 분석: PP-YOLOE+ vs. YOLOv10
성능 벤치마크는 YOLOv10의 최신 아키텍처의 장점을 명확하게 보여줍니다. PP-YOLOE+x가 약간의 차이로 가장 높은 mAP를 달성했지만, YOLOv10은 모든 모델 크기에서 일관되게 더 나은 속도, 정확성 및 효율성 균형을 제공합니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
예를 들어 YOLOv10m은 PP-YOLOE+m보다 더 빠르고 매개변수가 훨씬 적음(15.4M 대 23.43M)에도 불구하고 더 높은 mAP를 달성합니다. 마찬가지로 YOLOv10l은 매개변수가 거의 절반임에도 불구하고 PP-YOLOE+l보다 정확도가 뛰어납니다. 최고급에서도 YOLOv10x는 PP-YOLOE+x보다 훨씬 효율적이며 훨씬 낮은 대기 시간과 계산 요구 사항으로 비슷한 정확도를 제공합니다.
결론: 어떤 모델을 선택해야 할까요?
PP-YOLOE+는 PaddlePaddle 프레임워크에 전념하는 사용자를 위한 강력한 모델이지만, 대다수의 개발자 및 연구원에게는 YOLOv10이 확실한 추천 대상입니다.
YOLOv10의 뛰어난 효율성, 혁신적인 NMS-free 아키텍처 및 최첨단 성능은 보다 다재다능하고 미래 지향적인 선택입니다. Ultralytics 생태계에 원활하게 통합되어 진입 장벽을 제거하고 엣지 장치에서 고성능 클라우드 서버에 이르기까지 광범위한 실제 애플리케이션을 위한 사용하기 쉽고, 잘 지원되며, 매우 유능한 솔루션을 제공합니다.
다른 모델 살펴보기
다른 옵션을 살펴보고 있다면 Ultralytics 생태계의 다른 최첨단 모델을 고려해 보세요. YOLOv10 vs. YOLOv9 및 YOLOv10 vs. YOLOv8과 같은 자세한 비교를 확인할 수 있습니다. 최신 개발 사항에 관심이 있다면 새로운 Ultralytics YOLO11을 확인해 보세요.