Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ 대 EfficientDet#

적절한 아키텍처를 선택하는 것은 강력한 컴퓨터 비전 애플리케이션을 구축하는 데 있어 매우 중요한 단계입니다. 본 기술 가이드에서는 널리 알려진 두 가지 객체 탐지 모델인 **PP-YOLOE+**와 EfficientDet 간의 장단점을 살펴봅니다. 각 아키텍처를 분석하고 성능 지표를 검토하며, 이상적인 배포 시나리오를 탐색할 것입니다.

두 모델 모두 해당 분야에 상당한 기여를 했지만, 본 가이드에서는 Ultralytics YOLO26과 같은 현대적인 대안이 어떻게 훨씬 뛰어난 메모리 효율성, 더 빠른 추론 속도, 그리고 매우 간소화된 개발자 경험을 제공하는지도 논의할 것입니다.

Link to this section아키텍처 개요: PP-YOLOE+#

PP-YOLOE+는 PaddlePaddle 생태계 내의 서버측 GPU에서 성능을 최적화하기 위해 특별히 구축된 오리지널 PP-YOLO의 진화된 버전입니다. 이 모델은 앵커 프리(anchor-free) 패러다임에 중점을 두고 기본 아키텍처에 여러 개선 사항을 도입했습니다.

PP-YOLOE+에 대해 더 알아보기

PP-YOLOE+는 CSPRepResNet 백본과 ET-head(Efficient Task-aligned head)를 특징으로 하며, 분류를 위해 varifocal loss에, 바운딩 박스 회귀를 위해 distribution focal loss에 크게 의존합니다. 앵커 프리 탐지기 설계로의 전환은 후처리 파이프라인을 간소화하는 데 기여했으며, 출시 당시 매우 경쟁력 있는 성능을 보여주었습니다.

통합 이점

이미 Baidu의 PaddlePaddle 프레임워크를 깊이 활용하고 있는 팀들은 PP-YOLOE+를 인스턴스 세그멘테이션과 같은 작업에 도입하기 쉽다고 느끼지만, 최신 도구에서 볼 수 있는 폭넓은 멀티 프레임워크 지원은 부족합니다.

Link to this section아키텍처 개요: EfficientDet#

EfficientDet은 신경망 아키텍처 탐색과 복합 스케일링 원리에 크게 의존하여 객체 탐지에 대해 근본적으로 다른 접근 방식을 취합니다.

EfficientDet에 대해 자세히 알아보기

EfficientDet의 핵심은 양방향 특징 피라미드 네트워크(BiFPN)입니다. 기존의 FPN과 달리, BiFPN은 학습 가능한 가중치를 도입하여 서로 다른 입력 특징의 중요도를 학습함으로써 다중 스케일 특징 융합을 쉽고 빠르게 수행할 수 있게 합니다. EfficientNet 백본과 결합된 EfficientDet은 네트워크 너비, 깊이 및 해상도를 동시에 체계적으로 확장합니다.

FLOPs 측면에서 이론적으로 매우 효율적이지만, EfficientDet 모델은 복잡한 메모리 액세스 패턴으로 인해 엣지 디바이스에서 이론적 효율성을 실제 속도로 변환하는 데 어려움을 겪을 수 있으며, 이는 YOLO 기반 모델의 낮은 메모리 요구 사항과는 극명한 대조를 이룹니다.

Link to this section성능 분석 및 벤치마크#

아래 표는 COCO와 같은 표준 데이터셋에서의 주요 지표를 비교합니다. 평균 정밀도(mAP)와 추론 속도를 비교하면 파레토 프론티어를 명확하게 확인할 수 있습니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

보시는 바와 같이, PP-YOLOE+는 일반적으로 고사양 GPU에서 mAP 수치가 더 잘 확장되는 경향이 있는 반면, EfficientDet은 파라미터 수를 최소화하는 데 중점을 둡니다. 그러나 두 모델 모두 최첨단 엣지 AI에 필요한 현대적인 실시간 성능에는 미치지 못합니다.

Link to this section활용 사례 및 권장 사항#

PP-YOLOE+와 EfficientDet 사이의 선택은 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

Link to this sectionPP-YOLOE+를 선택해야 하는 경우#

PP-YOLOE+는 다음과 같은 경우 강력한 선택지입니다:

  • PaddlePaddle 생태계 통합: Baidu의 PaddlePaddle 프레임워크 및 도구로 구축된 기존 인프라를 보유한 조직.
  • Paddle Lite 엣지 배포: Paddle Lite 또는 Paddle 추론 엔진에 최적화된 추론 커널을 사용하는 하드웨어에 배포하는 경우.
  • 고정밀 서버 측 탐지: 프레임워크 종속성이 문제가 되지 않는 강력한 GPU 서버에서 최대 탐지 정확도를 우선시하는 시나리오.

Link to this sectionEfficientDet을 선택해야 할 때#

EfficientDet은 다음 경우에 권장됩니다:

  • Google Cloud 및 TPU 파이프라인: EfficientDet의 네이티브 최적화가 지원되는 Google Cloud Vision API 또는 TPU 인프라와 깊게 통합된 시스템.
  • 컴파운드 스케일링 연구: 네트워크 깊이, 너비 및 해상도 스케일링의 균형 잡힌 효과를 연구하는 데 중점을 둔 학술적 벤치마킹.
  • TFLite를 통한 모바일 배포: Android 또는 임베디드 Linux 장치를 위해 TensorFlow Lite 내보내기가 특별히 필요한 프로젝트.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this section현대적인 대안: Ultralytics YOLO26#

PP-YOLOE+와 EfficientDet이 중요한 역사적 이정표를 나타내지만, 최첨단 정확도, 낮은 메모리 소비 및 간소화된 사용자 경험을 추구하는 개발자라면 Ultralytics YOLO26을 고려해야 합니다.

YOLO26은 객체 탐지에 있어 획기적인 도약을 이루었으며, 다음과 같은 몇 가지 중요한 혁신을 도입했습니다:

  • 엔드투엔드 NMS-Free 설계: YOLOv10의 돌파구를 기반으로 하는 YOLO26은 추론 중에 비최대 억제(NMS)를 기본적으로 제거합니다. 이는 결과적으로 지연 시간을 크게 낮추고 복잡한 후처리 병목 현상을 해결합니다.
  • MuSGD 옵티마이저: LLM 학습 혁신에서 영감을 받은 YOLO26은 하이브리드 SGD와 Muon 옵티마이저를 활용합니다. 이는 학습 안정성을 획기적으로 개선하고 수렴 시간을 단축합니다.
  • 극한의 속도: YOLO26은 YOLO11과 같은 이전 세대와 비교하여 최대 43% 더 빠른 CPU 추론을 제공하며, 배터리 구동형 또는 CPU 전용 엣지 디바이스를 위한 최고의 선택입니다.
  • 고급 손실 함수(Advanced Loss Functions): ProgLoss와 STAL의 통합은 소형 객체 인식 성능을 크게 향상시키며, 이는 드론 분석로봇 공학과 같은 작업에 필수적입니다.
멀티태스킹 다재다능성

단순 탐지에 집중하는 EfficientDet과 달리, YOLO26은 자세 추정, 이미지 분류, 그리고 회전 바운딩 박스(OBB)를 모두 동일한 관리형 생태계 내에서 기본적으로 처리합니다.

Link to this section사용 편의성 및 생태계 통합#

EfficientDet과 같은 레거시 모델의 가장 큰 단점 중 하나는 학습 파이프라인과 자동화된 머신 러닝 설정의 복잡성입니다. 반면, Ultralytics Platform은 타의 추종을 불허하는 개발자 경험을 제공합니다.

Ultralytics를 사용하면 몇 줄의 코드만으로 모델을 배포할 수 있으며, 이는 구형 프레임워크에서 요구하는 장황한 설정과 극명한 대비를 이룹니다.

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100)

# Run inference on a test image natively without NMS overhead
predictions = model("https://ultralytics.com/images/bus.jpg")

다른 대안을 찾는 사용자들을 위해 RT-DETR이나 레거시 모델인 YOLOv8과 같은 아키텍처도 Ultralytics 생태계 내에서 사용할 수 있어 원활한 교체 및 테스트가 가능합니다.

Link to this section결론#

PP-YOLOE+는 Paddle 생태계 내 특정 서버 배포에 여전히 강력한 선택지이며, EfficientDet은 자동화된 아키텍처 설계 분야에서 흥미로운 연구 대상으로 남아 있습니다. 그러나 실시간 추론, 간편한 배포, 최소한의 메모리 요구 사항을 필요로 하는 현대적인 애플리케이션의 경우, Ultralytics YOLO26이 가장 매력적인 성능 균형을 제공합니다. 기본적으로 NMS가 필요 없는 설계와 압도적으로 빠른 CPU 성능 덕분에 AI 인프라를 미래에 대비할 수 있는 확실한 선택이 됩니다.

댓글