모델 비교: 프로젝트에 가장 적합한 객체 탐지 모델 선택

올바른 신경망 아키텍처를 선택하는 것은 모든 성공적인 컴퓨터 비전 프로젝트의 핵심입니다. Ultralytics 모델 비교 허브에 오신 것을 환영합니다! 이 페이지에서는 최신 Ultralytics YOLO26과 YOLO11, YOLOv10, RT-DETR, EfficientDet과 같은 주요 아키텍처 간의 트레이드오프를 상세히 분석한 기술 자료를 제공합니다.

애플리케이션이 엣지 AI의 밀리초 단위 지연 시간을 요구하든, 의료 영상에 필요한 고충실도 정밀도를 요구하든, 이 가이드는 정보에 입각한 선택을 하는 데 필요한 데이터 기반의 통찰력을 제공합니다. 저희는 평균 정밀도(mAP), 추론 속도, 파라미터 효율성 및 배포 용이성을 기준으로 모델을 평가합니다.

인터랙티브 성능 벤치마크

속도와 정확도 간의 관계를 시각화하는 것은 객체 탐지의 "파레토 프런티어(Pareto frontier)", 즉 특정 속도 제약 조건 내에서 최고의 정확도를 제공하는 모델을 식별하는 데 필수적입니다. 아래 차트는 표준 COCO와 같은 데이터셋에서의 주요 지표를 비교합니다.

이 차트는 다양한 모델 간의 트레이드오프를 빠르게 평가할 수 있도록 주요 성능 지표를 시각화합니다. 이러한 지표를 이해하는 것은 특정 배포 제약 조건에 부합하는 모델을 선택하는 데 기본이 됩니다.

빠른 의사 결정 가이드

어디서부터 시작해야 할지 모르시겠나요? 이 의사 결정 트리를 사용하여 귀하의 하드웨어 및 성능 요구 사항에 가장 적합한 아키텍처를 좁혀보십시오.

graph TD
    A[Start: Define Project Needs] --> B{Deployment Hardware?}
    B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
    B -- "Cloud / GPU" --> D{Accuracy vs Speed?}

    C -- "Extreme Speed (Real-time)" --> E[YOLO26n / YOLO26s]
    C -- "Balanced Legacy" --> F[YOLO11s / YOLOv8s]

    D -- "Max Accuracy (SOTA)" --> G[YOLO26x / YOLO26l]
    D -- "Balanced Performance" --> H[YOLO26m / YOLO11m]

    A --> I{Specialized Features?}
    I -- "NMS-Free Inference" --> J[YOLO26 / YOLOv10]
    I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO26 / YOLO11]
    I -- "Video Analytics" --> L[YOLO26 + Tracking]

현재 환경: YOLO26과 그 너머

객체 탐지 분야는 빠르게 변화하고 있습니다. 구형 모델들도 레거시 지원을 위해 여전히 의미가 있지만, 새로운 아키텍처는 가능한 것의 한계를 넓히고 있습니다.

Ultralytics YOLO26

2026년 1월에 출시된 YOLO26은 최신 상태의 기술(SOTA) 모델이며 모든 신규 프로젝트에 권장되는 시작점입니다. 이 모델은 비최대 억제(NMS) 후처리가 필요 없는 종단간(End-to-End) NMS-Free 디자인을 포함한 획기적인 아키텍처 혁신을 도입하여, 더 빠르고 예측 가능한 추론 시간을 제공합니다. YOLO26은 이전 세대 대비 CPU에서 최대 43% 더 빠르며, 엣지 배포에 이상적입니다.

주요 혁신 사항은 다음과 같습니다:

  • NMS-Free End-to-End: 후처리가 필요 없는 간소화된 배포
  • DFL 제거: ONNX, TensorRT, CoreML로의 간소화된 내보내기
  • MuSGD 옵티마이저: LLM 학습에서 영감을 받은 안정적인 수렴을 위한 하이브리드 SGD/Muon 옵티마이저
  • ProgLoss + STAL: 향상된 소형 객체 탐지 성능
왜 YOLO26을 선택해야 할까요?

YOLO26은 CNN의 효율성과 Transformer와 유사한 종단간 기능을 결합한 Ultralytics 엔지니어링의 정점입니다. 이 모델은 탐지, 세그멘테이션, 자세 추정, 분류, OBB 등 모든 작업을 지원하며, 그 어느 때보다 작고 빠르며 배포하기 쉽습니다.

Ultralytics YOLO11

YOLO11은 여전히 매우 뛰어난 성능의 모델로, YOLOv8 대비 파라미터를 22% 줄이면서도 탐지 정확도를 향상했습니다. 검증된 안정성이 필요하거나 기존 YOLO11 파이프라인을 사용하는 사용자에게 전적으로 지원되며 권장됩니다.

커뮤니티 모델: YOLO12 및 YOLO13에 대한 참고 사항

커뮤니티 토론이나 저장소에서 YOLO12 또는 YOLO13에 대한 언급을 접할 수 있습니다.

프로덕션 주의 사항

현재 저희는 프로덕션 환경에서 YOLO12나 YOLO13 사용을 권장하지 않습니다.

  • YOLO12: 학습 불안정성, 과도한 메모리 소비, 그리고 현저히 느린 CPU 추론 속도를 유발하는 어텐션 레이어를 사용합니다.
  • YOLO13: 벤치마크 결과, YOLO11 대비 정확도 향상이 미미하면서도 모델 크기는 더 크고 느린 것으로 나타났습니다. 보고된 결과들에서 재현성 문제가 확인되었습니다.


Watch: YOLO Models Comparison: Ultralytics YOLO11 vs. YOLOv10 vs. YOLOv9 vs. Ultralytics YOLOv8

상세 모델 비교

백본 선택, 헤드 디자인, 손실 함수 등 구체적인 아키텍처 차이를 이해하려면 심층 기술 비교를 살펴보십시오. 쉽게 접근할 수 있도록 모델별로 정리해 두었습니다:

YOLO26 vs

YOLO26은 NMS-Free 종단간 탐지, MuSGD 옵티마이저, 최대 43% 빠른 CPU 추론 속도를 갖춘 최신 Ultralytics 모델입니다. 엣지 배포에 최적화되어 있으며 최첨단 정확도를 달성합니다.

YOLO11 vs

YOLO11은 최첨단 연구를 바탕으로 이전 모델의 성공을 이어갑니다. 더 나은 특징 추출과 최적화된 효율성을 위해 개선된 백본 및 넥(neck) 아키텍처를 특징으로 합니다.

YOLOv10 vs

칭화대학교에서 개발한 YOLOv10은 지연 시간 변동을 줄이기 위해 비최대 억제(NMS) 단계를 제거하는 데 중점을 두었으며, 계산 오버헤드를 줄이면서 최고 수준의 성능을 제공합니다.

YOLOv9 vs

YOLOv9은 심층 신경망의 정보 손실 문제를 해결하기 위해 프로그래밍 가능한 기울기 정보(PGI)와 일반화된 효율적 레이어 집계 네트워크(GELAN)를 도입했습니다.

YOLOv8 vs

Ultralytics YOLOv8은 고급 백본 및 넥 아키텍처와 최적의 정확도-속도 트레이드오프를 위한 앵커 프리(anchor-free) 분할 헤드를 갖추어 여전히 매우 인기 있는 선택입니다.

YOLOv7 vs

YOLOv7은 "trainable bag-of-freebies"와 모델 재파라미터화(re-parameterization)를 도입하여, 추론 비용을 증가시키지 않으면서 학습 과정을 최적화하는 데 중점을 두었습니다.

YOLOv6 vs

Meituan의 YOLOv6는 산업용 애플리케이션을 위해 설계되었으며, 양방향 컨캐터네이션(Bi-directional Concatenation, BiC) 모듈과 앵커 기반 학습 전략을 특징으로 합니다.

YOLOv5 vs

Ultralytics YOLOv5는 사용 편의성, 안정성 및 속도로 유명합니다. 광범위한 장치 호환성이 필요한 프로젝트에 있어 여전히 강력한 선택지입니다.

RT-DETR vs

RT-DETR (Real-Time Detection Transformer)은 비전 Transformer를 활용하여 실시간 성능과 함께 높은 정확도를 달성하며, 글로벌 컨텍스트 이해에 뛰어납니다.

PP-YOLOE+ vs

Baidu가 개발한 PP-YOLOE+는 효율성과 정확도의 균형을 맞추기 위해 태스크 정렬 학습(Task Alignment Learning, TAL)과 디커플드 헤드(decoupled head)를 사용합니다.

DAMO-YOLO vs

Alibaba Group에서 개발한 DAMO-YOLO는 신경망 구조 검색(Neural Architecture Search, NAS)과 효율적인 RepGFPN을 사용하여 정적 벤치마크에서의 정확도를 극대화합니다.

YOLOX vs

Megvii에서 개발한 YOLOX는 앵커 프리(anchor-free) 진화 모델로, 디커플드 헤드와 SimOTA 레이블 할당 전략으로 잘 알려져 있습니다.

EfficientDet vs

Google Brain의 EfficientDet은 복합 스케일링(compound scaling)과 BiFPN을 사용하여 매개변수 효율성을 최적화하며, 다양한 제약 조건에 맞는 모델(D0-D7) 라인업을 제공합니다.

이 색인은 새로운 모델이 출시되고 벤치마크가 개선됨에 따라 지속적으로 업데이트됩니다. 다음 컴퓨터 비전 프로젝트에 가장 적합한 모델을 찾기 위해 이 리소스를 활용해 보시기 바랍니다. 개인 라이선스가 포함된 엔터프라이즈급 솔루션을 찾고 계시다면 당사의 라이선스 페이지를 방문해 주십시오. 즐거운 비교 되시길 바랍니다!

댓글