PP-YOLOE+와 YOLOv7: 객체 감지 아키텍처에 대한 기술적 심층 분석
최적의 객체 감지 모델을 선택하려면 정확도, 추론 속도, 배포 복잡성 간의 균형을 맞춰야 합니다. 이 환경에서 중요한 두 가지 경쟁자는 PP-YOLOE+와 YOLOv7은 모두 최첨단 성능 향상을 목표로 2022년에 출시되었습니다. 이 포괄적인 분석에서는 고유한 아키텍처, 벤치마크, 실제 애플리케이션에 대한 적합성을 살펴보고 개발자가 데이터 기반 의사 결정을 내리는 데 도움을 줍니다.
성능 지표 비교
다음 표는 지원되는 하드웨어의 평균 정밀도(mAP) 및 추론 속도를 포함한 주요 성능 지표를 직접 비교한 것입니다. 이 데이터는 PP-YOLOE+의 앵커 프리 접근 방식과 YOLOv7 최적화된 아키텍처 간의 장단점을 시각화하는 데 도움이 됩니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
PP-YOLOE+: 정교한 앵커 프리 감지
PP-YOLOE+는 바이두의 연구원들이 개발한 YOLO 시리즈의 진화 버전입니다. 이전 버전인 PP-YOLOE의 강점을 기반으로 학습 과정과 아키텍처를 개선하여 컨버전스 속도와 다운스트림 작업 성능을 더욱 향상시켰습니다. 앵커가 필요 없는 디텍터로서 사전 정의된 앵커 박스가 필요하지 않아 설계가 간소화되고 하이퍼파라미터 튜닝이 줄어듭니다.
- 작성자: PaddlePaddle 작성자
- 조직조직: Baidu
- 날짜: 2022-04-02
- ArXiv:https://arxiv.org/abs/2203.16250
- GitHub:https://github.com/PaddlePaddle/PaddleDetection/
- Docs:패들감지 README
건축 하이라이트
PP-YOLOE+의 아키텍처는 다양한 수용 필드가 장착된 CSPResNet 백본을 통해 다양한 규모의 특징을 효과적으로 캡처합니다. 핵심 혁신은 특정 손실 함수를 통해 정렬을 보장하면서 분류 작업과 회귀 작업을 분리하는 효율적인 작업 정렬 헤드(ET-head)입니다.
PP-YOLOE+는 분류 및 로컬라이제이션 품질의 정렬을 기반으로 양성 샘플을 동적으로 선택하는 라벨 할당 전략인 작업 정렬 학습(TAL)을 활용합니다. 이를 통해 모델은 학습 중에 고품질 예측에 집중할 수 있습니다. 또한 이 모델은 분산 훈련 전략을 채택하고 비표준 연산자를 사용하지 않으므로 PaddlePaddle 에코시스템에서 지원하는 다양한 하드웨어 플랫폼에 쉽게 배포할 수 있습니다.
주요 기능: 앵커 프리 디자인
앵커 박스를 제거함으로써 PP-YOLOE+는 앵커 클러스터링 및 매칭 단계와 관련된 복잡성을 줄여줍니다. 이는 종종 객체의 종횡비가 극단적인 다양한 데이터 세트에서 더 나은 일반화로 이어집니다.
YOLOv7: 실시간 속도 최적화
YOLOv7 은 출시와 동시에 실시간 객체 감지의 새로운 기준을 세웠으며, 아키텍처 효율성과 '공짜 백' 방식(추론 비용을 늘리지 않고 정확도를 높이는 기술)에 중점을 두었습니다. 속도와 정확도 측면에서 YOLOR 및 YOLOv5 같은 이전 최신 모델을 능가하도록 설계되었습니다.
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 조직:기관: 대만 학술원 정보 과학 연구소
- 날짜: 2022-07-06
- ArXiv:https://arxiv.org/abs/2207.02696
- GitHub:https://github.com/WongKinYiu/yolov7
- 문서:Ultralytics YOLOv7 문서
아키텍처 혁신
YOLOv7 확장된 효율적인 레이어 집계 네트워크(E-ELAN)를 도입했습니다. 이 백본 설계는 네트워크가 최단 및 최장 기울기 경로를 제어하여 원래 기울기 경로를 파괴하지 않고 학습 기능을 향상시킴으로써 더욱 다양한 특징을 학습할 수 있도록 합니다.
또 다른 중요한 기여는 모델 재파라미터화의 사용입니다. 학습 중에 모델은 추론을 위해 더 간단한 단일 분기 구조로 병합된 다중 분기 구조를 사용합니다. 이를 통해 YOLOv7 학습 중에 풍부한 기능 표현의 이점을 누리는 동시에 배포 중에 빠른 속도를 유지할 수 있습니다. 또한 이 모델은 '거칠게-세밀하게' 리드 가이드 라벨 할당 전략을 사용하여 딥 네트워크 학습을 위한 보조 헤드를 사용합니다.
비교 분석: 강점 및 약점
이 두 가지 강력한 모델 중 하나를 결정할 때는 컴퓨터 비전 프로젝트의 특정 요구 사항을 고려하는 것이 중요합니다.
정확도 대 속도
PP-YOLOE+는 세분화된 모델을 제공합니다. 그리고 PP-YOLOE+s 는 엣지 디바이스에 매우 효율적인 반면 PP-YOLOE+x 는 낮은 프레임 속도에도 불구하고 최고 수준의 mAP 구현합니다. YOLOv7 실시간 감지의 '스위트 스팟'에서 탁월한 성능을 발휘하여 많은 경쟁사에 비해 GPU 하드웨어에서 주어진 정확도 수준에서 더 높은 FPS를 제공하는 경우가 많습니다. 다음과 같이 처리량이 많은 애플리케이션의 경우 트래픽 모니터링의 경우 YOLOv7 추론 최적화가 유리합니다.
에코시스템 및 사용성
가장 큰 차이점 중 하나는 생태계에 있습니다. PP-YOLOE+는 PaddlePaddle 프레임워크에 깊이 뿌리를 두고 있습니다. 강력하지만, 주로 PyTorch 익숙한 팀에게는 학습 곡선이 더 가파를 수 있습니다. YOLOv7 PyTorch 기본으로 제공되므로 일반적으로 더 광범위한 연구 커뮤니티에서 더 쉽게 접근할 수 있습니다.
그러나 두 모델 모두 최신 표준에 비해 훈련과 미세 조정이 복잡할 수 있습니다. YOLOv7 복잡한 앵커 계산과 하이퍼파라미터 감도를 포함하며, PP-YOLOE+는 패들 감지 구성을 탐색해야 합니다.
Ultralytics 이점: 왜 업그레이드해야 할까요?
PP-YOLOE+와 YOLOv7 훌륭한 모델이지만, AI 분야는 빠르게 변화하고 있습니다. 다음과 같은 Ultralytics 모델 YOLOv8 과 같은 울트라 애널리틱스 모델과 최첨단 YOLO11과 같은 울트라 애널리틱스 모델은 차세대 비전 AI를 대표하며, 이전 아키텍처에서 발견된 많은 사용성 및 효율성 문제를 해결합니다.
탁월한 사용자 경험 및 에코시스템
Ultralytics 사용 편의성을 우선시합니다. 다른 프레임워크에서 종종 필요한 복잡한 구성 파일과 달리, Ultralytics 모델은 몇 줄의 Python 코드 또는 간단한 CLI 명령만으로 학습, 검증 및 배포할 수 있습니다.
- 통합 API: 오브젝트 감지, 인스턴스 분할, 분류, 포즈 추정, OBB와 같은 작업 간에 원활하게 전환할 수 있습니다.
- 잘 관리된 에코시스템: 잦은 업데이트, 활발한 커뮤니티, 신속한 문제 해결에 도움이 되는 방대한 문서를 활용하세요.
- 통합: 실험 추적(MLflow, Comet), 데이터 세트 관리, 간소화된 모델 내보내기를 ONNX, TensorRT, CoreML 같은 형식으로 기본적으로 지원합니다.
성능 및 효율성
Ultralytics 모델은 최적의 성능 균형을 위해 설계되었습니다. 계산 오버헤드는 낮으면서도 YOLOv7 높은 정확도를 달성하는 경우가 많습니다. 또한 메모리 효율이 높도록 설계되어 더 적은 양의 CUDA 메모리를 덜 필요로 하도록 설계되어 많은 트랜스포머 기반 대안이나 이전 YOLO 버전에 비해 트레이닝 중에 더 적은 메모리를 필요로 합니다. 이러한 트레이닝 효율 덕분에 더 빠른 반복과 클라우드 컴퓨팅 비용 절감이 가능합니다.
코드 예시: 행동하는 단순성
레거시 워크플로우와 비교하여 최신 Ultralytics 모델을 훈련하는 것이 얼마나 간단한지 알아보세요:
from ultralytics import YOLO
# Load a pre-trained YOLO11 model (recommended for best performance)
model = YOLO("yolo11n.pt")
# Train the model on a dataset (e.g., COCO8)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
# Export to ONNX format for deployment
model.export(format="onnx")
프로젝트의 미래 보장
Ultralytics 프레임워크를 채택하면 단순한 모델이 아니라 진화하는 플랫폼을 사용할 수 있습니다. 최신 Python 버전과 하드웨어 가속기를 지원하므로 기술 부채를 줄이고 AI 솔루션에 대한 장기적인 유지보수성을 보장할 수 있습니다.
결론
PP-YOLOE+는 강력한 앵커 프리 아키텍처를 제공함으로써 PaddlePaddle 생태계에 투자한 사람들에게 여전히 강력한 선택입니다. YOLOv7 원시 GPU 처리량이 필요한 프로젝트에 여전히 강력한 옵션입니다. 그러나 컴퓨터 비전 작업의 모든 범위를 포괄하는 다목적, 사용자 친화적인 고성능 솔루션을 찾는 개발자에게도 적합합니다, Ultralytics YOLO11 을 권장합니다.
다른 모델 살펴보기
이러한 비교를 통해 물체 감지 환경에 대한 이해의 폭을 넓혀보세요: