PP-YOLOE+ 대 YOLOv7: 실시간 객체 탐지 아키텍처 탐색

컴퓨터 비전 파이프라인을 구축할 때 적절한 객체 탐지 모델을 선택하는 것은 매우 중요합니다. 2022년에 등장한 PP-YOLOE+와 YOLOv7이라는 두 가지 중요한 아키텍처는 실시간 객체 탐지 분야에 강력한 발전을 가져왔습니다. 이 기술적 비교에서는 귀하의 애플리케이션에 대해 정보에 입각한 결정을 내릴 수 있도록 각 아키텍처, 학습 방법론 및 실제 성능을 심층적으로 살펴봅니다.

모델 개요

PP-YOLOE+와 YOLOv7 모두 정확도와 속도의 한계를 돌파하기 위해 설계되었지만, 서로 다른 개발 생태계와 설계 철학을 바탕으로 합니다.

PP-YOLOE+

Baidu의 PaddlePaddle 작성자들이 개발한 PP-YOLOE+는 기존 PP-YOLOv2를 기반으로 합니다. 이 모델은 PaddlePaddle 생태계에 최적화된 효율적이고 매우 정확한 객체 탐지기를 제공하기 위해 도입되었습니다.

PP-YOLOE+에 대해 더 알아보기

YOLOv7

Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao가 개발한 YOLOv7은 "학습 가능한 bag-of-freebies"를 도입하여 출시 당시 실시간 객체 탐지기에 대한 새로운 최첨단 벤치마크를 설정했습니다.

YOLOv7에 대해 자세히 알아보기

아키텍처 혁신

PP-YOLOE+ 아키텍처

PP-YOLOE+는 앵커 프리(anchor-free) 패러다임에 크게 의존하며, 커스텀 데이터셋을 위해 앵커 박스를 조정할 필요가 없어 배포 과정을 간소화합니다. 강력한 RepResNet 백본과 효과적인 다중 스케일 특징 융합을 위한 CSPNet 스타일의 PAN(Path Aggregation Network)을 통합합니다. 또한 학습 중에 분류 및 위치 파악 작업을 동적으로 조정하는 작업 정렬 학습(TAL, Task Alignment Learning) 개념을 활용하여 다양한 컴퓨터 비전 작업 전반에서 높은 정확도를 보장합니다.

YOLOv7 아키텍처

YOLOv7은 E-ELAN(Extended Efficient Layer Aggregation Network)을 도입하여 다른 접근 방식을 취했습니다. 이 아키텍처는 네트워크가 원래의 그래디언트 경로를 손상시키지 않으면서 더 다양한 특징을 학습할 수 있게 하여 더 나은 수렴을 유도합니다. YOLOv7은 또한 모델 재매개변수화(model re-parameterization), 구체적으로는 계획된 재매개변수화 컨볼루션(planned re-parameterized convolutions)을 적극 활용하며, 추론 중에 컨볼루션 계층을 병합하여 정확도 저하 없이 실행 속도를 높입니다. 이 덕분에 YOLOv7은 다중 객체 추적이나 복잡한 보안 경보 시스템과 같은 작업에서 매우 뛰어난 성능을 발휘합니다.

생태계 차이

While PP-YOLOE+ is tightly integrated with Baidu's PaddlePaddle framework, YOLOv7 was built in PyTorch, which historically offers a larger community and broader out-of-the-box compatibility with deployment pipelines like ONNX and TensorRT.

성능 분석

속도, 파라미터 및 정확도(mAP)의 균형을 맞출 때 모델들은 특정 변형 및 타겟 하드웨어에 따라 장단점이 갈립니다. 아래는 해당 메트릭에 대한 종합적인 비교입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

PP-YOLOE+x 모델이 약간 더 높은 mAP를 달성하지만, YOLOv7 변형은 매우 뛰어난 파라미터 대 정확도 비율을 제공합니다. YOLOv7 아키텍처는 TensorRT 최적화가 매우 낮은 지연 시간을 제공하는 원시 GPU 처리 작업에서 여전히 선호됩니다.

Ultralytics의 강점

이러한 모델을 학습하고 배포할 때 선택하는 프레임워크는 모델 자체만큼이나 중요합니다. Ultralytics를 사용하면 머신러닝 수명 주기 전체를 단순화하는 고도로 통합된 Python API 덕분에 간소화된 사용자 경험을 제공받을 수 있습니다.

  • 잘 관리되는 생태계: Ultralytics YOLO 모델은 지속적으로 업데이트되는 생태계, 강력한 문서화 및 활발한 커뮤니티의 이점을 누립니다.
  • 메모리 요구 사항: Ultralytics는 데이터 로딩 및 학습 체제를 강력하게 최적화합니다. Ultralytics YOLO 모델을 학습하는 것은 일반적으로 무거운 Transformer 기반 아키텍처에 비해 훨씬 적은 CUDA 메모리를 필요로 하므로, 개발자가 소비자 등급 하드웨어에서도 더 큰 배치 크기를 사용할 수 있도록 합니다.
  • 학습 효율성: 강력한 데이터 증강 전략과 내장된 하이퍼파라미터 튜닝을 활용하여, Ultralytics는 즉시 사용 가능한 사전 학습된 가중치를 통해 모델이 빠르게 수렴하도록 보장합니다.

간단한 API 구현

Ultralytics를 사용하여 YOLOv7 모델을 학습하는 것은 복잡한 학습 스크립트를 완전히 추상화하여 단 몇 줄의 코드만으로 가능합니다:

from ultralytics import YOLO

# Load a pretrained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to TensorRT for deployment
model.export(format="engine", device=0)

새로운 표준: YOLO26 소개

PP-YOLOE+와 YOLOv7은 객체 탐지의 이정표이지만, AI 분야는 빠르게 진화하고 있습니다. 새로운 컴퓨터 비전 프로젝트를 위해서는 Ultralytics YOLO26을 강력히 권장합니다. 2026년 1월에 출시된 YOLO26은 엣지 우선 비전 AI의 거대한 도약을 의미합니다.

YOLO26이 구형 아키텍처보다 뛰어난 이유:

  • 엔드투엔드 NMS 프리 설계: YOLO26은 기본적으로 엔드투엔드 방식입니다. NMS(Non-Maximum Suppression) 후처리를 제거함으로써 YOLOv10에서 처음 선보인 혁신 기술인 예측 가능하고 결정론적인 추론 지연 시간을 보장합니다.
  • DFL 제거: Distribution Focal Loss를 제거하여 내보내기(export) 과정을 간소화하고 저전력 엣지 장치에 대한 호환성을 크게 향상시킵니다.
  • 최대 43% 빠른 CPU 추론: 스마트 시티 IoT 센서와 같이 전용 GPU가 없는 시나리오에서 YOLO26은 CPU에서 직접 효율적으로 실행되도록 최적화되어 있습니다.
  • MuSGD 옵티마이저: (Moonshot AI의 Kimi K2와 같은) 고급 LLM 학습 기술에서 영감을 받은 YOLO26은 놀랍도록 안정적인 학습과 빠른 수렴을 위해 SGD와 Muon의 하이브리드를 사용합니다.
  • ProgLoss + STAL: 이러한 개선된 손실 함수는 드론 항공 이미지 및 제조 결함 탐지와 같은 사용 사례에 필수적인 소형 객체 탐지에서 놀라운 이득을 가져옵니다.

YOLO26에 대해 더 알아보기

이상적인 사용 사례 및 배포 시나리오

PP-YOLOE+ 사용 시기

PP-YOLOE+는 Baidu 및 PaddlePaddle 생태계에 깊이 관여하고 있을 때 빛을 발합니다. 귀하의 배포 타겟이 Paddle 모델에 맞춰진 특수 하드웨어를 사용하는 경우(예: 특정 아시아 제조 파이프라인), PP-YOLOE+는 우수한 정확도와 원활한 통합을 제공합니다. 이는 산업 제조 자동화에 매우 효과적입니다.

YOLOv7 사용 시기

YOLOv7은 범용적인 고성능 추론, 특히 TensorRT를 활용하는 NVIDIA 하드웨어에 배포할 때 여전히 훌륭한 선택지입니다. PyTorch 생태계로의 통합 덕분에 학술 연구 및 실시간 군중 관리 또는 네트워크의 구조적 무결성이 중요한 복잡한 포즈 추정 작업과 같은 맞춤형 상업용 파이프라인에서 매우 다재다능하게 활용됩니다.

고려해야 할 다른 모델

정확한 요구 사항에 따라 광범위하고 즉시 사용 가능한 유연성을 원한다면 YOLO11과 비교하거나, 전통적인 컨볼루션 네트워크보다 비전 Transformer의 특정 이점이 필요한 프로젝트라면 RT-DETR과 비교해 보는 것도 좋습니다.

결론

PP-YOLOE+와 YOLOv7은 모두 실시간 객체 탐지 세계에 상당한 개선을 가져왔습니다. PP-YOLOE+는 PaddlePaddle을 중심으로 표준화된 환경에서 탁월한 반면, YOLOv7은 PyTorch 및 Ultralytics 생태계를 통해 놀라운 유연성과 성능을 제공합니다.

그러나 컴퓨터 비전 솔루션이 계속 발전함에 따라 최신 도구를 활용하는 것이 필수적입니다. Ultralytics 플랫폼YOLO26 같은 차세대 아키텍처를 도입함으로써 개발자는 애플리케이션이 속도, 정확도 및 사용 편의성 측면에서 최첨단을 유지하도록 할 수 있습니다.

댓글