Link to this sectionPP-YOLOE+ 대 YOLOv7#
컴퓨터 비전 파이프라인을 구축할 때 올바른 객체 탐지 모델을 선택하는 것은 매우 중요합니다. 2022년에 등장한 두 가지 주요 아키텍처인 PP-YOLOE+와 YOLOv7은 실시간 객체 탐지 분야에서 강력한 발전을 가져왔습니다. 본 기술 비교에서는 두 모델의 아키텍처, 학습 방법론, 그리고 실제 성능을 심층적으로 분석하여 사용자의 애플리케이션에 적합한 정보를 제공합니다.
Link to this section모델 개요#
PP-YOLOE+와 YOLOv7 모두 정확도와 속도의 한계를 뛰어넘기 위해 설계되었으나, 서로 다른 개발 생태계와 설계 철학을 바탕으로 합니다.
Link to this sectionPP-YOLOE+#
Baidu의 PaddlePaddle 제작자가 개발한 PP-YOLOE+는 기존 PP-YOLOv2를 기반으로 합니다. 이 모델은 PaddlePaddle 생태계에 최적화된 효율적이고 정확도가 높은 객체 탐지기를 제공하기 위해 도입되었습니다.
- 저자: PaddlePaddle 저자진
- 조직: Baidu
- 날짜: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddleDetection 저장소
- 문서: PP-YOLOE+ 문서
Link to this sectionYOLOv7#
Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao가 개발한 YOLOv7은 '학습 가능한 bag-of-freebies'를 도입하여 출시 당시 실시간 객체 탐지기의 새로운 최첨단 벤치마크를 세웠습니다.
- 저자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- 조직: 대만 중앙연구원 정보과학연구소
- 날짜: 2022-07-06
- Arxiv: 2207.02696
- GitHub: YOLOv7 저장소
- 문서: Ultralytics YOLOv7 문서
Link to this section아키텍처 혁신#
Link to this sectionPP-YOLOE+ 아키텍처#
PP-YOLOE+는 앵커 프리(anchor-free) 패러다임에 크게 의존하며, 커스텀 데이터셋을 위한 앵커 박스 튜닝 필요성을 제거하여 배포 과정을 단순화합니다. 이 모델은 강력한 RepResNet 백본과 효과적인 멀티 스케일 특징 융합을 위한 CSPNet 스타일의 PAN(Path Aggregation Network)을 통합합니다. 또한, 학습 중에 분류 및 위치 파악 작업을 동적으로 조정하는 TAL(Task Alignment Learning) 개념을 활용하여 다양한 컴퓨터 비전 작업 전반에서 높은 정확도를 보장합니다.
Link to this sectionYOLOv7 아키텍처#
YOLOv7은 E-ELAN(Extended Efficient Layer Aggregation Network)을 도입하여 다른 접근 방식을 취했습니다. 이 아키텍처는 네트워크가 원래의 그래디언트 경로를 손상시키지 않으면서 더 다양한 특징을 학습할 수 있게 하여 더 나은 수렴을 유도합니다. 또한 YOLOv7은 모델 재매개변수화(model re-parameterization), 특히 계획된 재매개변수화 컨볼루션을 대거 활용합니다. 이는 추론 중에 컨볼루션 레이어를 병합하여 정확도 손실 없이 실행 속도를 높입니다. 이러한 특징 덕분에 YOLOv7은 다중 객체 추적이나 복잡한 보안 경보 시스템과 같은 작업에서 매우 뛰어난 성능을 발휘합니다.
Link to this section성능 분석#
속도, 파라미터, 정확도(mAP) 간의 균형을 맞출 때 모델들은 특정 변형 모델과 타겟 하드웨어에 따라 장단점이 갈립니다. 다음은 해당 지표에 대한 포괄적인 비교입니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
PP-YOLOE+x 모델이 약간 더 높은 mAP를 달성하는 반면, YOLOv7 변형 모델들은 매우 우수한 파라미터 대비 정확도 비율을 제공합니다. YOLOv7 아키텍처는 TensorRT 최적화를 통해 매우 낮은 지연 시간을 제공하는 원시 GPU 처리 환경에서 여전히 선호됩니다.
Link to this sectionUltralytics의 장점#
모델을 학습하고 배포할 때 사용하는 프레임워크는 모델 자체만큼이나 중요합니다. Ultralytics를 활용하면 전체 머신 러닝 수명 주기를 단순화하는 고도로 통합된 Python API 덕분에 효율적인 사용자 경험을 제공받을 수 있습니다.
- 잘 관리된 생태계: Ultralytics YOLO 모델은 지속적으로 업데이트되는 생태계, 강력한 문서화, 그리고 활발한 커뮤니티의 혜택을 받습니다.
- 메모리 요구 사항: Ultralytics는 데이터 로딩 및 학습 체계를 대폭 최적화합니다. Ultralytics YOLO 모델을 학습하는 것은 일반적으로 무거운 Transformer 기반 아키텍처보다 훨씬 적은 CUDA 메모리를 필요로 하므로, 개발자가 소비자 등급 하드웨어에서 더 큰 배치 사이즈를 사용할 수 있도록 합니다.
- 학습 효율성: 강력한 데이터 증강 전략과 내장된 하이퍼파라미터 튜닝을 활용하여, Ultralytics는 미리 학습된 가중치를 통해 모델이 신속하게 수렴하도록 보장합니다.
Link to this section간단한 API 구현#
Ultralytics를 사용하여 YOLOv7 모델을 학습하는 것은 몇 줄의 코드만으로 가능하며, 복잡한 학습 스크립트를 완전히 추상화합니다.
from ultralytics import YOLO
# Load a pretrained YOLOv7 model
model = YOLO("yolov7.pt")
# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to TensorRT for deployment
model.export(format="engine", device=0)Link to this section새로운 표준: YOLO26 소개#
PP-YOLOE+와 YOLOv7이 객체 탐지 분야의 이정표인 것은 분명하지만, AI 환경은 빠르게 진화하고 있습니다. 새로운 컴퓨터 비전 프로젝트에는 Ultralytics YOLO26을 강력히 권장합니다. 2026년 1월에 출시된 YOLO26은 엣지 중심의 비전 AI에서 엄청난 도약을 의미합니다.
YOLO26이 기존 아키텍처보다 뛰어난 이유:
- 엔드투엔드 NMS 프리 설계: YOLO26은 기본적으로 엔드투엔드 방식입니다. NMS(Non-Maximum Suppression) 후처리를 제거함으로써 YOLOv10에서 처음 선보였던 혁신적인 기능인 예측 가능하고 결정론적인 추론 지연 시간을 보장합니다.
- DFL 제거: DFL(Distribution Focal Loss)을 제거하여 내보내기(export) 과정을 단순화하고 저전력 엣지 장치에 대한 호환성을 크게 향상했습니다.
- 최대 43% 더 빠른 CPU 추론: 스마트 시티 IoT 센서와 같이 전용 GPU가 부족한 환경에서 YOLO26은 CPU에서 효율적으로 실행되도록 최적화되었습니다.
- MuSGD 옵티마이저: 고급 LLM 학습 기술(예: Moonshot AI의 Kimi K2)에서 영감을 받은 YOLO26은 SGD와 Muon의 하이브리드를 사용하여 매우 안정적인 학습과 빠른 수렴을 제공합니다.
- ProgLoss + STAL: 향상된 손실 함수는 소형 객체 탐지에서 놀라운 성능 향상을 가져오며, 이는 드론 항공 이미지 및 제조 결함 탐지와 같은 사용 사례에 매우 중요합니다.
Link to this section이상적인 사용 사례 및 배포 시나리오#
Link to this sectionPP-YOLOE+를 사용해야 할 때#
PP-YOLOE+는 Baidu 및 PaddlePaddle 생태계에 깊이 관여하고 있을 때 빛을 발합니다. 배포 대상이 Paddle 모델에 맞춤화된 특수 하드웨어를 사용하는 경우(예: 특정 아시아 제조 파이프라인), PP-YOLOE+는 뛰어난 정확도와 원활한 통합을 제공합니다. 이는 산업 제조 자동화에 매우 효과적입니다.
Link to this sectionYOLOv7을 사용해야 하는 경우#
YOLOv7은 일반적인 고성능 추론, 특히 TensorRT를 활용하는 NVIDIA 하드웨어에 배포할 때 여전히 훌륭한 선택입니다. PyTorch 생태계로의 통합 덕분에 학술 연구 및 실시간 군중 관리 또는 복잡한 포즈 추정 작업과 같이 네트워크의 구조적 무결성이 중요한 맞춤형 상용 파이프라인에서 매우 다재다능합니다.
Link to this section참고할 만한 다른 모델#
정확한 요구 사항에 따라, 광범위하고 즉시 배포 가능한 유연성을 위해 YOLO11과 비교하거나, 프로젝트가 기존 컨볼루션 네트워크보다 비전 Transformer의 특정 이점을 요구한다면 RT-DETR과 비교해 보는 것도 좋습니다.
Link to this section결론#
PP-YOLOE+와 YOLOv7 모두 실시간 객체 탐지 세계에 중대한 개선을 가져왔습니다. PP-YOLOE+는 PaddlePaddle을 기준으로 표준화된 환경에서 탁월한 성능을 발휘하며, YOLOv7은 PyTorch 및 Ultralytics 생태계를 통해 놀라운 유연성과 성능을 제공합니다.
그러나 컴퓨터 비전 솔루션이 계속 발전함에 따라 최신 도구를 활용하는 것이 필수적입니다. Ultralytics 플랫폼과 차세대 아키텍처인 YOLO26을 도입함으로써, 개발자는 자신의 애플리케이션이 속도, 정확도, 사용 편의성 측면에서 최첨단을 유지하도록 보장할 수 있습니다.