YOLOv7 PP-YOLOE+: 실시간 탐지기의 포괄적 비교

최첨단 컴퓨터 비전 모델을 생산 파이프라인에 적용할 때 개발자들은 종종 다양한 아키텍처의 장점을 비교 평가합니다. 객체 탐지 분야에서 주목할 만한 두 가지 모델은 YOLOv7 와 PP-YOLOE+입니다. 본 가이드는 두 모델의 아키텍처, 성능 지표, 이상적인 배포 시나리오에 대한 상세한 기술적 비교를 제공하여 다음 컴퓨터 비전 프로젝트를 위한 정보에 기반한 결정을 내리는 데 도움을 드립니다.

아키텍처 혁신

이러한 모델들 간의 핵심 구조적 차이를 이해하는 것은 훈련 및 추론 과정에서 모델이 어떻게 동작할지 예측하는 데 매우 중요합니다.

YOLOv7 주요 특징

YOLOv7 추론 비용을 크게 증가시키지 않으면서 정확도를 향상시키기 위해 설계된 몇 가지 핵심적인 발전을 YOLOv7 .

확장된 효율적인 계층 집계 네트워크 (E-ELAN): 이 아키텍처는 가장 짧고 가장 긴 그라디언트 경로를 제어합니다. 이를 통해 네트워크는 원래의 그라디언트 경로를 손상시키지 않으면서 더 다양한 특징을 학습하고 전반적인 학습 능력을 향상시킬 수 있습니다.
모델 스케일링 전략: YOLOv7은 복합 모델 스케일링을 사용하여 깊이와 너비를 동시에 조정하고 레이어를 연결하여 다양한 크기에서 최적의 아키텍처 구조를 유지합니다.
훈련 가능한 Bag-of-Freebies: 저자들은 항등 연결이 없는 재매개변수화된 컨볼루션(RepConv) 방식을 통합하여, 모델의 예측 능력을 저하시키지 않으면서 추론 속도를 크게 향상시켰습니다.

YOLOv7 세부 정보:
저자: Chien-Yao Wang, Alexey Bochkovskiy, and Hong-Yuan Mark Liao
소속: 대만 중앙연구원 정보과학연구소
날짜: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696

7에 대해 자세히 알아보기

PP-YOLOE+ 건축 하이라이트

PaddlePaddle 생태계 내에서 Baidu가 개발한 PP-YOLOE+는 이전 모델인 PP-YOLOv2를 기반으로 하며, 앵커 프리 방법론과 향상된 특징 표현에 중점을 둡니다.

앵커 프리 설계: 앵커 기반 접근 방식과 달리, 이 설계는 예측 헤드를 단순화하고 하이퍼파라미터 수를 줄여 사용자 정의 데이터셋에 대한 모델 튜닝을 더 쉽게 만듭니다.
CSPRepResNet 백본: 이 백본은 잔차 연결과 Cross Stage Partial 네트워크를 통합하여 계산 효율성을 유지하면서 특징 추출 기능을 향상시킵니다.
태스크 정렬 학습 (TAL): PP-YOLOE+는 ET-head (Efficient Task-aligned head)를 활용하여 분류 및 위치화 태스크를 더 잘 정렬함으로써, 원스테이지 detect 모델의 일반적인 병목 현상을 해결합니다.

PP-YOLOE+ 세부 정보:
저자: PaddlePaddle 저자
기관: Baidu
날짜: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250

PP-YOLOE+에 대해 자세히 알아보세요.

성능 지표 및 벤치마크

올바른 모델을 선택하는 것은 종종 하드웨어의 특정 제약 사항과 지연 시간 요구 사항에 달려 있습니다. 아래 표는 정확도 (mAP), 속도 및 모델 복잡성 간의 절충점을 보여줍니다.

모델	크기 ^(픽셀)	mAP^val 50-95	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^(B)
YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

결과 분석

고정확도 시나리오: YOLOv7x는 복잡한 감지 작업에 경쟁력 있는 높은 mAP를 달성하며 강력한 성능을 보여줍니다. PP-YOLOE+x가 mAP에서 약간 더 높은 스케일을 보이지만, 이는 매개변수 및 FLOPs의 상당한 증가를 동반합니다.
효율성 및 속도: PP-YOLOE+의 더 작은 변형(t 및 s)은 매우 낮은 TensorRT 속도를 제공하여 하드웨어 제약이 엄격한 엣지 배포에 매우 적합합니다.
최적의 지점: YOLOv7l은 T4 GPU에서 7ms 미만의 추론 시간을 유지하면서 51% 이상의 mAP를 달성하여 매력적인 균형을 제공하며, 표준 실시간 서버 애플리케이션을 위한 강력한 선택이 됩니다.

생산 환경 최적화

이러한 모델을 배포할 때, TensorRT 또는 ONNXPyTorch 활용하면 네이티브 PyTorch 비해 지연 시간을 크게 줄일 수 있습니다.

Ultralytics 이점

YOLOv7 PP-YOLOE+ 모두 강력한 벤치마크 성능을 제공하지만, 프로젝트 성공을 위해서는 개발 경험과 생태계 지원 역시 동등하게 중요합니다.

간소화된 사용자 경험

Ultralytics 통합된 Python 통해 사용 편의성을 최우선으로 합니다. PaddlePaddle 특정 구성 파일을 탐색해야 하는 PP-YOLOE+와 달리, Ultralytics 훈련에서 배포까지 원활하게 전환할 수 있도록 Ultralytics .

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov7.pt")

# Train the model effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export for optimized deployment
model.export(format="engine")  # TensorRT export

리소스 효율성

Ultralytics YOLO 모델의 주요 강점은 훈련 및 추론 시 더 낮은 메모리 요구 사항입니다. 이러한 효율성 덕분에 연구원과 개발자는 소비자용 하드웨어에서 더 큰 배치 크기를 사용할 수 있으며, 무거운 모델이나 RT-DETR와 같은 복잡한 트랜스포머 아키텍처에 비해 훈련 프로세스를 가속화할 수 있습니다.

생태계 및 다용도성

Ultralytics 매우 잘 관리되어 있으며, 빈번한 업데이트, 방대한 문서화, 표준 탐지 기능을 넘어선 다양한 작업에 대한 네이티브 지원을 특징으로 합니다. Ultralytics 사용하면 단일 프레임워크로 인스턴스 세그멘테이션, 포즈 추정, 분류, 방향성 바운딩 박스(OBB)를 지원하여 경쟁 모델들이 종종 갖추지 못한 탁월한 다용도성을 제공합니다.

비전 AI의 미래: YOLO26

컴퓨터 비전이 빠르게 발전함에 따라, 속도와 효율성에 대한 기준을 재정의하는 새로운 아키텍처들이 등장했습니다. 2026년 1월에 출시된 Ultralytics YOLO26은 이러한 진화의 정점을 나타내며, 모든 새로운 프로젝트에 강력히 권장되는 선택입니다.

YOLO26의 주요 혁신 사항:

종단 간 NMS-Free 설계: YOLO26은 NMS(Non-Maximum Suppression) 후처리를 제거합니다. 이 기본 종단 간(end-to-end) 접근 방식은 배포 로직을 극적으로 단순화하고 가변 지연 시간을 줄이며, 이는 YOLOv10에서 처음 도입된 획기적인 발전입니다.
전례 없는 엣지 성능: DFL(Distribution Focal Loss)을 제거함으로써 YOLO26은 최대 43% 더 빠른 CPU 추론을 달성하여, 이전 세대에 비해 IoT 및 엣지 장치에 더 우수합니다.
고급 훈련 역학: Moonshot AI의 Kimi K2와 같은 LLM 혁신에서 영감을 받은 MuSGD 옵티마이저의 통합은 더 안정적인 훈련과 더 빠른 수렴을 보장합니다.
우수한 작은 객체 detect 성능: 특히 ProgLoss + STAL과 같은 향상된 손실 함수는 작은 객체 인식의 기존 약점을 해결하여 항공 이미지와 같은 애플리케이션에 매우 중요합니다.

실제 응용 분야

이러한 아키텍처 중 선택은 종종 특정 배포 환경에 달려 있습니다.

PP-YOLOE+를 선택해야 하는 경우

PaddlePaddle 통합: 인프라가 이미 Baidu의 PaddlePaddle 생태계와 깊이 통합되어 있다면, PP-YOLOE+는 기본적으로 적합합니다.
아시아 산업 검사: 하드웨어 및 소프트웨어 스택이 Baidu 도구에 사전 구성된 아시아 제조 허브에서 자주 활용됩니다.

7 선택해야 할 때

GPU 가속 시스템: 비디오 분석과 같이 높은 처리량을 요구하는 작업에서 서버급 GPU에서 탁월한 성능을 발휘합니다.
로봇 통합: 로봇 공학에 컴퓨터 비전을 통합하는 데 이상적이며, 동적 환경에서 빠른 의사 결정을 가능하게 합니다.
학술 연구: PyTorch 기반 연구에서 널리 지원되며 신뢰할 수 있는 기준선으로 자주 활용됩니다.

구형 모델들은 역사적 의미를 지니지만, YOLO26이나 YOLO11 으로의 Ultralytics 최신 최적화 기술, 가장 간소화된 훈련 워크플로우, 그리고 현재 이용 가능한 가장 광범위한 다중 작업 지원을 보장합니다.