PP-YOLOE+ vs. YOLOv7: 객체 탐지를 위한 기술 비교
적절한 객체 탐지 모델을 선택하는 것은 모든 컴퓨터 비전 프로젝트에서 중요한 단계이며, 정확도, 속도 및 컴퓨팅 리소스 간의 신중한 균형이 필요합니다. 이 페이지에서는 PP-YOLOE+와 YOLOv7의 자세한 기술 비교를 제공합니다. 두 모델은 영향력 있는 객체 탐지 모델입니다. 특정 요구 사항에 대한 정보에 입각한 결정을 내릴 수 있도록 아키텍처 설계, 성능 벤치마크, 훈련 방법 및 이상적인 사용 사례를 자세히 살펴봅니다.
PP-YOLOE+: 앵커 프리 및 다용도
Baidu의 PaddlePaddle Authors에서 개발한 PP-YOLOE+는 PaddleDetection 제품군의 고성능 앵커 프리 감지기입니다. 정확도와 효율성의 뛰어난 균형을 목표로 백본, 넥 및 헤드에 대한 개선 사항을 도입하여 이전 제품의 성공을 기반으로 합니다.
- 작성자: PaddlePaddle 작성자
- Organization: Baidu
- 날짜: 2022-04-02
- ArXiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- 문서: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
아키텍처 및 학습
PP-YOLOE+는 사전 정의된 앵커 박스와 관련된 하이퍼파라미터 튜닝의 필요성을 없애 감지 파이프라인을 단순화하는 앵커 프리 아키텍처로 차별화됩니다. 이러한 설계 선택은 종종 더 빠른 훈련 및 추론으로 이어집니다. 이 모델은 분류 및 위치 파악 작업을 위한 분리된 헤드를 특징으로 하여 각 분기가 보다 전문화된 기능을 학습할 수 있도록 합니다. 핵심 구성 요소는 훈련 중에 어려운 예제의 우선 순위를 지정하는 손실 함수 유형인 VariFocal Loss와 분류 및 위치 파악 간의 기능 정렬을 개선하는 TAL(Task Alignment Learning)의 사용입니다.
성능
Anchor-free 모델인 PP-YOLOE+는 다양한 모델 크기(t, s, m, l, x)에 걸쳐 속도와 정확도 간의 강력한 균형을 제공합니다. 이러한 확장성 덕분에 다양한 하드웨어 및 성능 요구 사항에 적응할 수 있습니다. 이 모델은 경쟁력 있는 mAP 점수와 빠른 추론 시간을 보여주며, 특히 TensorRT와 같은 도구로 가속화할 경우 광범위한 애플리케이션에 적합합니다.
사용 사례
PP-YOLOE+는 균형 잡힌 성능과 앵커 프리 디자인 덕분에 속도를 희생하지 않으면서 강력한 탐지가 필요한 애플리케이션에 적합합니다. 생산 라인에서 결함을 식별할 수 있는 산업 품질 검사와 재료를 정확하게 분류하여 재활용 효율성을 개선하는 등의 시나리오에서 뛰어난 성능을 발휘합니다. 또한, 강력한 서버에서 제약이 많은 에지 장치에 이르기까지 다양한 하드웨어에 배포할 수 있습니다.
강점과 약점
- 강점: 앵커 프리 디자인으로 구현이 간단하고 하이퍼파라미터 튜닝이 줄어듭니다. 뛰어난 정확도/속도 균형을 제공하며 PaddlePaddle 프레임워크에 잘 통합되어 있습니다.
- 약점: PaddlePaddle 에코시스템을 위해 기본적으로 설계되었으므로 PyTorch와 같은 다른 프레임워크로 통합하려면 추가적인 노력이 필요할 수 있습니다. 강력하지만 커뮤니티 지원은 Ultralytics YOLO 시리즈와 같이 더 널리 채택된 모델보다 적을 수 있습니다.
YOLOv7: 속도 및 효율성에 최적화됨
유명한 YOLO 제품군의 일부인 YOLOv7은 출시 시 실시간 객체 감지기에 대한 새로운 최첨단 기술을 설정했습니다. 아키텍처 최적화 및 고급 학습 전략을 통해 뛰어난 속도와 정확도를 제공하는 데 중점을 둡니다.
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- Organization: Institute of Information Science, Academia Sinica, Taiwan
- 날짜: 2022-07-06
- ArXiv: https://arxiv.org/abs/2207.02696
- GitHub: https://github.com/WongKinYiu/yolov7
- 문서: https://docs.ultralytics.com/models/yolov7/
아키텍처 및 학습
YOLOv7은 몇 가지 아키텍처 혁신을 도입했으며, 그중 가장 주목할 만한 것은 백본에 있는 E-ELAN(Extended Efficient Layer Aggregation Network)입니다. E-ELAN은 그래디언트 경로를 방해하지 않고 네트워크의 학습 능력을 향상시켜 특징 추출 효율성을 개선합니다. 또한, 이 모델은 추론 비용을 늘리지 않고 정확도를 향상시키는 훈련 기술 세트인 "trainable bag-of-freebies"를 통합합니다. 여기에는 YOLOv7 논문에 자세히 설명된 모델 재파라미터화 및 Coarse-to-fine lead guided training이 포함됩니다.
성능
YOLOv7은 속도와 정확도 간의 뛰어난 균형으로 유명합니다. 문서에서 강조된 바와 같이 다음과 같은 모델이 있습니다. YOLOv7
V100 GPU에서 161 FPS로 51.4% mAP를 달성하여 많은 경쟁 제품보다 성능이 뛰어납니다. 이러한 높은 효율성 덕분에 다음과 같은 애플리케이션에 가장 적합합니다. 실시간 추론.
사용 사례
YOLOv7의 빠른 속도 기능은 낮은 지연 시간이 중요한 애플리케이션에 이상적입니다. 여기에는 보안 경보 시스템, 차량 속도 추정 및 로보틱스와 같은 자율 시스템이 포함됩니다. 또한 효율성 덕분에 NVIDIA Jetson과 같은 에지 플랫폼에 배포하기가 용이합니다.
강점과 약점
- 강점: 최첨단 속도 및 정확도 균형. 매우 효율적인 아키텍처는 실시간 및 에지 애플리케이션에 적합합니다. 대규모 사용자 기반과 광범위한 커뮤니티 리소스를 보유하고 있습니다.
- 약점: 앵커 기반 모델이므로 앵커가 없는 대안 모델에 비해 사용자 정의 데이터 세트에서 최적의 성능을 얻으려면 앵커 구성을 더 신중하게 조정해야 할 수 있습니다. 강력하지만 이후에 보다 통합된 에코시스템을 갖춘 최신 모델이 등장했습니다.
성능 분석: PP-YOLOE+ vs. YOLOv7
성능 지표를 직접 비교하면 각 모델의 뚜렷한 장점을 알 수 있습니다. PP-YOLOE+는 더 넓은 범위의 모델 크기를 제공하여 정확도와 리소스 사용량 간의 보다 세분화된 절충이 가능합니다. 반면에 YOLOv7은 실시간 성능의 경계를 넓힙니다.
모델 | 크기 (픽셀) |
mAPval 50-95 |
속도 CPU ONNX (ms) |
속도 T4 TensorRT10 (ms) |
파라미터 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
표에서 PP-YOLOE+x는 54.7의 가장 높은 mAP를 달성하지만 대기 시간이 더 높습니다. YOLOv7x는 53.1의 약간 낮은 mAP로 더 빠른 추론 속도를 제공하는 매력적인 대안입니다. 더 작은 PP-YOLOE+ 모델(예: t
및 s
, 매우 빠른 추론을 제공하므로 리소스가 매우 제한적인 환경에 이상적입니다.
Ultralytics YOLO 모델을 선택해야 하는 이유
PP-YOLOE+와 YOLOv7은 모두 강력한 모델이지만, 객체 탐지 환경은 끊임없이 진화하고 있습니다. 가장 현대적이고 다재다능하며 사용자 친화적인 프레임워크를 추구하는 개발자와 연구자에게 Ultralytics YOLO 모델(예: YOLOv8 및 YOLO11)은 우수한 선택을 제시합니다.
- 사용 편의성: Ultralytics 모델은 간단한 Python API, 광범위한 문서 및 간단한 CLI 명령어를 특징으로 하는 간소화된 사용자 경험을 염두에 두고 설계되었습니다.
- 잘 관리되는 에코시스템: 이 모델은 활발한 개발, 강력한 오픈 소스 커뮤니티, 원활한 MLOps를 위한 Ultralytics HUB와 같은 도구와의 통합을 갖춘 포괄적인 에코시스템의 일부입니다.
- 성능 및 효율성: Ultralytics 모델은 속도와 정확도 간의 뛰어난 균형을 달성합니다. 이 모델은 훈련 및 추론 중에 효율적인 메모리 사용을 위해 설계되었으며, 종종 다른 아키텍처보다 적은 CUDA 메모리를 필요로 합니다.
- 다재다능함: YOLOv8 및 YOLO11과 같은 모델은 단일 통합 프레임워크 내에서 객체 탐지, 분할, 분류, 자세 추정 및 방향이 지정된 객체 탐지(OBB)를 지원하는 멀티태스킹 솔루션입니다.
- 학습 효율성: 효율적인 학습 프로세스, COCO와 같은 데이터 세트에서 즉시 사용 가능한 사전 학습된 가중치, 더 빠른 수렴 시간을 통해 이점을 얻으십시오.
결론
PP-YOLOE+와 YOLOv7은 모두 가능한 것의 경계를 넓힌 강력한 객체 감지 모델입니다. PP-YOLOE+는 특히 PaddlePaddle 생태계 내에서 가치 있는 확장 가능하고 효율적인 앵커 프리 솔루션을 제공합니다. YOLOv7은 원시 속도와 정확성이 뛰어나 까다로운 실시간 애플리케이션에 적합합니다.
그러나 완벽하고 미래를 보장하는 솔루션을 찾는 개발자에게는 YOLOv8 및 YOLO11과 같은 Ultralytics 모델이 더 매력적인 패키지를 제공합니다. 최첨단 성능, 사용 편의성, 다중 작업 다용성, 강력하고 잘 관리된 생태계의 조합은 학술 연구에서 프로덕션 배포에 이르기까지 광범위한 컴퓨터 비전 프로젝트에 이상적인 선택입니다.
다른 모델 살펴보기
더 자세한 내용을 알아보려면 PP-YOLOE+, YOLOv7 및 기타 주요 모델과 관련된 다음 비교를 살펴보십시오.
- YOLOv7 vs. YOLOv8
- YOLOv7 vs. YOLOv5
- RT-DETR vs. YOLOv7
- PP-YOLOE+ vs. YOLOv8
- YOLOX 대 YOLOv7
- YOLOv10 및 YOLO11과 같은 최신 모델을 살펴보세요.