콘텐츠로 건너뛰기

YOLOv7 PP-YOLOE+: 객체 감지를 위한 기술 비교

최적의 객체 감지 아키텍처를 선택하는 것은 컴퓨터 비전 개발에서 중추적인 결정이며, 다운스트림 애플리케이션의 성능과 효율성에 큰 영향을 미칩니다. 이 분석에서는 다음에 대한 심층적인 기술 분석을 제공합니다. YOLOv7 와 실시간 감지 환경을 형성한 두 가지 대표적인 모델인 PP-YOLOE+에 대한 심층적인 기술적 분석을 제공합니다. 이 두 모델의 아키텍처 혁신, 훈련 방법론, 성능 메트릭을 살펴보고 연구자와 엔지니어가 정보에 입각한 선택을 할 수 있도록 안내합니다.

YOLOv7: 실시간 속도와 정확성 정의하기

YOLOv7 은 실시간 애플리케이션의 속도와 정확도의 한계를 뛰어넘기 위해 설계된 You Only Look Once 제품군의 진화에 있어 중요한 이정표로 부상했습니다. 이 제품은 추론 비용을 늘리지 않고도 기능 학습을 개선하는 아키텍처 전략을 도입하여 출시와 동시에 새로운 최첨단 벤치마크를 효과적으로 설정했습니다.

YOLOv7 대해 자세히 알아보기

아키텍처 혁신

YOLOv7 설계의 핵심은 확장된 효율적인 레이어 집계 네트워크(E-ELAN)입니다. 이 새로운 백본 아키텍처는 최단 및 최장 그라데이션 경로를 제어하여 그라데이션 흐름을 방해하지 않으면서도 효과적으로 특징을 학습합니다. 그래디언트 경로를 최적화함으로써 네트워크는 효율성을 유지하면서 더 심층적인 학습 기능을 달성합니다.

또한 YOLOv7 훈련 중에 "공짜 가방" 전략을 사용합니다. 이는 추론 엔진 단계에서 계산 비용을 추가하지 않고 정확도를 향상시키는 최적화 방법입니다. 이 기법에는 개별 모듈을 하나의 별개의 모듈로 병합하여 배포하는 모델 재파라미터화와 보조 헤드 감독을 위한 거칠고 미세한 리드 유도 손실이 포함됩니다.

강점과 약점

  • 강점: YOLOv7 뛰어난 속도 대 정확도 비율을 제공하므로 GPU에서 실시간 추론에 매우 효과적입니다. 앵커 기반 접근 방식은 다음과 같은 표준 데이터 세트에 맞게 잘 조정되어 있습니다. COCO.
  • 약점: 앵커 기반 탐지기로서, 미리 정의된 앵커 박스 구성이 필요하므로 객체 가로세로 비율이 비정상적인 사용자 지정 데이터 세트에는 최적이 아닐 수 있습니다. 매우 다양한 하드웨어 제약 조건에서 모델을 효율적으로 확장하는 것도 최신 반복에 비해 복잡할 수 있습니다.

PP-YOLOE+: 닻을 내리지 않는 도전자

PP-YOLOE+는 패들감지 제품군의 일부로 바이두에서 개발한 PP-YOLOE의 발전된 버전입니다. 탐지 파이프라인을 간소화하고 개발자가 조정해야 하는 하이퍼파라미터의 수를 줄이는 것을 목표로 하는 앵커 프리 아키텍처로 차별화됩니다.

PP-YOLOE+에 대해 자세히 알아보세요.

아키텍처 혁신

PP-YOLOE+는 앵커가 없는 검출기 메커니즘을 채택하여 앵커 박스 클러스터링이 필요하지 않습니다. 이 제품은 CSPRepResNet 백본과 간소화된 헤드 설계를 활용합니다. 성능의 핵심은 분류 및 로컬라이제이션 품질의 정렬을 기반으로 양성 샘플을 동적으로 할당하는 작업 정렬 학습(TAL)입니다.

이 모델에는 고품질 예제의 학습에 우선순위를 두도록 설계된 특수 손실 함수인 VariFocal Loss도 통합되어 있습니다. "+" 버전에는 목과 머리 구조가 개선되어 피처 피라미드를 최적화하여 다중 규모 감지를 향상시킵니다.

강점과 약점

  • 강점: 앵커가 없는 디자인으로 훈련 설정이 간단하고 다양한 물체 모양에 대한 일반화가 향상됩니다. 다양한 크기(s, m, l, x)로 잘 확장되며 PaddlePaddle 프레임워크에 매우 최적화되어 있습니다.
  • 약점: PaddlePaddle 생태계에 대한 의존도가 높기 때문에, PaddlePaddle 생태계를 구축한 팀과 PyTorch 또는 TensorFlow 에코시스템에 구축된 팀과 마찰을 일으킬 수 있습니다. 중국 외 지역의 커뮤니티 지원 및 타사 도구는 일반적으로 글로벌 YOLO 커뮤니티에 비해 덜 광범위합니다.

성능 비교

이러한 모델을 비교할 때는 평균 평균 정밀도(mAP)과 추론 지연 시간 사이의 균형을 살펴보는 것이 중요합니다. 아래 표는 COCO 데이터 세트의 주요 메트릭을 강조합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

분석

관찰된 바와 같이, YOLOv7l은 6.84ms의 TensorRT 속도로 51.4%의 mAP 달성하여 인상적인 효율성을 보여줍니다. 반면, PP-YOLOE+l은 이보다 약간 높은 52.9%의 mAP 달성하지만 8.36ms의 느린 속도와 훨씬 더 높은 매개 변수(52.2M 대 36.9M)를 사용합니다. 이는 비슷한 정확도 계층에서 파라미터 사용 및 추론 속도에서 YOLOv7 뛰어난 효율성을 강조합니다. PP-YOLOE+x는 정확도의 한계를 뛰어넘는 반면, 동급 YOLO 모델에 비해 거의 두 배에 달하는 파라미터를 사용해야 합니다.

효율성의 중요성

메모리와 컴퓨팅이 제한된 엣지 AI 배포의 경우, YOLO 아키텍처의 낮은 파라미터 수와 FLOP은 종종 더 무거운 대안에 비해 더 시원하게 작동하고 전력 소비를 낮추는 것으로 해석됩니다.

Ultralytics 이점: 왜 현대화해야 할까요?

YOLOv7 PP-YOLOE+가 유능한 모델이지만, 컴퓨터 비전 분야는 빠르게 변화하고 있습니다. 다음과 같은 최신 Ultralytics 모델을 채택하고 있습니다. YOLO11와 같은 최신 울트라트래틱스 모델을 도입하면 원시 메트릭을 뛰어넘는 뚜렷한 이점을 얻을 수 있습니다.

1. 간소화된 사용자 경험

Ultralytics 사용 편의성을 우선시합니다. 다른 프레임워크에서 종종 요구되는 복잡한 구성 파일과 종속성 관리와 달리, Ultralytics 모델은 몇 줄의 Python 사용할 수 있습니다. 따라서 개발자의 진입 장벽이 낮아지고 모델 배포 주기가 빨라집니다.

2. 통합 에코시스템 및 다양성

최신 Ultralytics 모델은 객체 감지에만 국한되지 않습니다. 기본적으로 단일 프레임워크 내에서 다양한 작업을 지원합니다:

이러한 다용도성을 통해 팀은 여러 컴퓨터 비전 작업을 하나의 라이브러리로 표준화하여 유지 관리를 간소화할 수 있습니다.

3. 교육 및 메모리 효율성

Ultralytics 모델은 메모리 효율성을 위해 설계되었습니다. 일반적으로 구형 아키텍처나 다음과 같은 트랜스포머 기반 모델에 비해 트레이닝 중에 더 적은 VRAM을 필요로 합니다. RT-DETR. 따라서 표준 소비자 GPU에서 더 큰 배치 크기를 훈련할 수 있으므로 더 많은 연구자가 고성능 모델을 생성할 수 있습니다.

4. 코드 예제: 현대적인 방법

최신 Ultralytics 모델로 추론을 실행하는 것은 직관적입니다. 아래는 사전 학습된 모델을 로드하고 예측을 실행하는 데 필요한 코드 줄 수가 얼마나 적은지 보여주는 YOLO11 사용한 실행 가능한 완전한 예제입니다.

from ultralytics import YOLO

# Load the YOLO11n model (nano version for speed)
model = YOLO("yolo11n.pt")

# Run inference on a local image
# This automatically downloads the model weights if not present
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for result in results:
    boxes = result.boxes  # Boxes object for bbox outputs
    result.show()  # Display results on screen
    result.save(filename="result.jpg")  # Save results to disk

5. 잘 관리된 생태계

Ultralytics 선택한다는 것은 활기찬 커뮤니티에 합류한다는 것을 의미합니다. 개발자는 잦은 업데이트, 광범위한 문서, 그리고 Ultralytics HUB와 같은 MLOps 도구와의 통합을 통해 AI 프로젝트의 전체 수명 주기 동안 지원을 받을 수 있습니다.

결론

모두 YOLOv7PP-YOLOE+는 모두 물체 감지 분야에 큰 기여를 해왔습니다. YOLOv7 효율적인 E-ELAN 아키텍처를 통해 GPU 하드웨어에서 고속 추론을 제공하는 데 탁월합니다. PP-YOLOE+는 특히 PaddlePaddle 에코시스템 내에서 강력한 앵커가 필요 없는 대안을 제공합니다.

하지만 최첨단 성능과 탁월한 사용 편의성이 균형을 이루는 미래 지향적인 솔루션을 찾는 개발자에게는 최고의 선택입니다, Ultralytics YOLO11 을 추천합니다. 포괄적인 에코시스템으로의 통합, 멀티모달 작업 지원, 뛰어난 효율성 덕분에 2025년 이후 확장 가능한 컴퓨터 비전 애플리케이션을 구축하는 데 이상적인 플랫폼입니다.

다른 모델 살펴보기

이러한 비교를 통해 물체 감지 환경에 대한 이해의 폭을 넓혀보세요:


댓글