Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 대 EfficientDet#

컴퓨터 비전 프로젝트에 최적의 아키텍처를 선택하려면 속도, 정확도 및 배포 타당성 간의 절충안에 대한 깊은 이해가 필요합니다. 이 비교 페이지는 두 가지 서로 다른 객체 탐지 모델인 YOLOv6-3.0과 EfficientDet에 대한 심층적인 분석을 제공합니다. 두 모델 모두 이 분야에 크게 기여했지만, 현대적인 엣지 배포와 빠른 프로토타이핑에는 Ultralytics 플랫폼과 같은 더욱 통합된 프레임워크가 더 유리한 경우가 많습니다.

다음은 이러한 모델 간의 성능 차이를 시각화한 대화형 차트로, 각 모델의 지연 시간 및 정확도 프로필을 이해하는 데 도움을 줍니다.

Link to this sectionYOLOv6-3.0: 산업용 처리량#

YOLOv6-3.0은 산업용 애플리케이션에 맞게 최적화된 고성능 단일 스테이지 객체 탐지 프레임워크로 Meituan에서 특별히 설계했습니다. 이 모델은 GPU 하드웨어에서의 처리량을 극대화하는 데 중점을 두어, 고속 제조 라인 및 오프라인 비디오 분석을 위한 강력한 후보입니다.

  • 저자: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, Xiangxiang Chu
  • 조직: Meituan
  • 날짜: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Link to this section아키텍처 주요 특징#

YOLOv6-3.0 아키텍처는 서로 다른 스케일 간의 특징 융합을 개선하기 위해 BiC(Bi-directional Concatenation) 모듈에 의존합니다. 높은 추론 속도를 보장하기 위해 GPU 실행에 최적화된 EfficientRep 백본을 활용합니다. 또한, 훈련 단계에서는 앵커 기반 및 앵커 프리 탐지기의 장점을 결합한 AAT(Anchor-Aided Training) 전략을 채택하면서도, 추론 파이프라인에서는 지연 시간을 줄이기 위해 앵커 프리 방식을 유지합니다.

Link to this section강점 및 약점#

YOLOv6-3.0은 전용 GPU 하드웨어를 사용할 수 있는 환경에서 빛을 발하며, TensorRT를 사용하여 매우 빠른 실시간 추론을 제공합니다. 그러나 특정 하드웨어 최적화에 대한 높은 의존성으로 인해 CPU 전용 엣지 AI 디바이스에서는 성능이 최적화되지 않을 수 있습니다. 또한 일부 양자화를 지원하기는 하지만, 최신 Ultralytics 프레임워크에서 볼 수 있는 전반적인 단순성이 부족합니다.

YOLOv6에 대해 더 알아보기

Link to this sectionEfficientDet: 확장 가능한 AutoML 아키텍처#

Google Research에서 개발한 EfficientDet은 근본적으로 다른 접근 방식을 취합니다. 저자들은 네트워크를 수동으로 설계하는 대신 AutoML(Automated Machine Learning)을 활용하여 파라미터, FLOPs 및 정확도의 균형을 맞추는 확장 가능한 아키텍처를 설계했습니다.

Link to this section아키텍처 주요 특징#

EfficientDet은 쉽고 빠른 다중 스케일 특징 융합을 가능하게 하는 BiFPN(Bi-directional Feature Pyramid Network)을 도입했습니다. 해상도, 깊이, 너비를 모든 백본, 특징 네트워크 및 박스/클래스 예측 네트워크에 대해 균일하게 조정하는 복합 스케일링 방법과 결합하여, EfficientDet 모델은 매우 컴팩트한 d0부터 거대한 d7까지 다양합니다.

Link to this section강점 및 약점#

EfficientDet은 파라미터 효율성이 매우 높습니다. 이전 객체 탐지기에 비해 비교적 적은 파라미터로도 뛰어난 mAP(mean Average Precision)를 달성합니다. 그러나 이 아키텍처는 레거시 TensorFlow 생태계에 깊이 뿌리박고 있습니다. 이로 인해 복잡한 의존성 관리, 느린 훈련 주기, 최적화된 PyTorch 구현에 비해 훈련 중 더 높은 메모리 요구 사항이 발생합니다. 또한 최신 GPU에서의 추론 속도가 현대적인 YOLO 아키텍처보다 상당히 느립니다.

EfficientDet에 대해 자세히 알아보기

Link to this section상세 성능 비교#

아래 표는 다양한 지표에 걸쳐 YOLOv6-3.0과 EfficientDet의 기술 사양을 대조합니다. YOLOv6-3.0이 GPU 속도에서 압도적인 반면, EfficientDet은 상당한 지연 시간을 감수하면서도 더 높은 mAP까지 확장된다는 점에 주목하십시오.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
지연 시간 대 처리량

모델을 비교할 때 FLOPs 및 파라미터 수가 항상 실제 지연 시간과 완벽하게 일치하지는 않는다는 점을 기억하십시오. YOLOv6-3.0은 TensorRT에 최적화되어 하위 단계의 EfficientDet 모델보다 FLOPs가 높음에도 불구하고 밀리초 단위의 속도를 달성합니다.

Link to this sectionUltralytics 생태계의 이점#

YOLOv6-3.0과 EfficientDet은 각각 특정 니즈를 충족하지만, 현대의 컴퓨터 비전 프로젝트는 다재다능함, 사용 편의성 및 잘 관리된 생태계를 요구합니다. 바로 이 지점에서 Ultralytics YOLO 모델이 진가를 발휘합니다.

Link to this section사용 편의성과 학습 효율성#

복잡한 TensorFlow 구성을 탐색해야 하는 EfficientDet과 달리, Ultralytics 모델은 직관적인 PyTorch 기반으로 구축되었습니다. Ultralytics 플랫폼은 전체 머신 러닝 라이프사이클을 단순화하는 간소화된 API를 제공합니다. Ultralytics 모델을 훈련하는 데 필요한 CUDA 메모리가 훨씬 적어 실험을 가속화하고 컴퓨팅 비용을 절감합니다.

Link to this section비교할 수 없는 범용성#

YOLOv6-3.0과 EfficientDet은 주로 객체 탐지에 국한되어 있습니다. 반면, 현대적인 Ultralytics 아키텍처는 본질적으로 멀티모달입니다. 단일 인터페이스를 통해 인스턴스 세그멘테이션, 포즈 추정, 이미지 분류회전된 바운딩 박스(OBB) 작업을 위한 모델을 훈련할 수 있습니다.

Link to this sectionUltralytics YOLO26 소개#

최고의 성능 균형을 추구하는 개발자들에게 Ultralytics YOLO26은 패러다임의 전환을 의미합니다. 2026년 1월에 출시된 이 모델은 YOLOv6와 EfficientDet을 모두 능가하는 몇 가지 획기적인 혁신을 도입했습니다:

  • 종단 간 NMS-Free 설계: YOLO26은 NMS(Non-Maximum Suppression) 후처리의 필요성을 기본적으로 제거하여, 지연 시간 변동을 크게 낮추고 엣지 디바이스에서의 배포 로직을 단순화합니다.
  • MuSGD 옵티마이저: LLM 훈련에서 영감을 받은 이 하이브리드 옵티마이저는 안정적인 훈련과 매우 빠른 수렴을 보장합니다.
  • 최대 43% 더 빠른 CPU 추론: DFL(Distribution Focal Loss)의 제거로, YOLO26은 레거시 모델에 비해 CPU 및 저전력 IoT 디바이스에서 훨씬 더 효율적입니다.
  • ProgLoss + STAL: 이러한 고급 손실 함수는 작은 객체 인식에서 엄청난 개선을 제공하여, YOLO26을 드론 및 항공 이미지 애플리케이션에 이상적으로 만듭니다.

YOLO26에 대해 자세히 알아보기

Link to this section활용 사례 및 권장 사항#

YOLOv6와 EfficientDet 중 어떤 것을 선택할지는 특정 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

Link to this sectionYOLOv6을 선택해야 하는 경우#

YOLOv6은 다음과 같은 경우에 강력한 선택지입니다:

  • 산업용 하드웨어 인식 배포: 모델의 하드웨어 인식 설계와 효율적인 재파라미터화가 특정 타겟 하드웨어에서 최적화된 성능을 제공하는 시나리오.
  • 빠른 단일 스테이지 탐지: 통제된 환경에서 실시간 비디오 처리를 위해 GPU에서의 원시 추론 속도를 우선시하는 애플리케이션.
  • Meituan 생태계 통합: 이미 Meituan의 기술 스택 및 배포 인프라 내에서 작업 중인 팀.

Link to this sectionEfficientDet을 선택해야 할 때#

EfficientDet은 다음 경우에 권장됩니다:

  • Google Cloud 및 TPU 파이프라인: EfficientDet의 네이티브 최적화가 지원되는 Google Cloud Vision API 또는 TPU 인프라와 깊게 통합된 시스템.
  • 컴파운드 스케일링 연구: 네트워크 깊이, 너비 및 해상도 스케일링의 균형 잡힌 효과를 연구하는 데 중점을 둔 학술적 벤치마킹.
  • TFLite를 통한 모바일 배포: Android 또는 임베디드 Linux 장치를 위해 TensorFlow Lite 내보내기가 특별히 필요한 프로젝트.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this section구현 예시: YOLO26 학습#

다음 코드는 Ultralytics 생태계의 단순성을 보여줍니다. 최첨단 모델을 훈련하는 것은 가중치를 로드하고 데이터를 가리키는 것만큼이나 쉽습니다.

from ultralytics import YOLO

# Load the highly optimized YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on a dataset with automatic hyperparameter handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model to check mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Run inference on a test image seamlessly
prediction = model("https://ultralytics.com/images/bus.jpg")

Link to this section참고할 만한 다른 모델#

더 넓은 컴퓨터 비전 모델 환경을 탐색 중이라면 다음 대안을 고려해 보십시오:

  • YOLO11: YOLO26의 매우 성공적인 전신으로, 강력한 다중 작업 기능과 광범위한 커뮤니티 지원을 제공합니다.
  • YOLOv10: NMS-free 훈련을 도입한 최초의 YOLO 아키텍처로, 현대적인 종단 간 탐지의 길을 열었습니다.
  • RT-DETR: 기존 CNN보다 Transformer 기반 아키텍처와 어텐션 메커니즘을 선호하는 시나리오를 위한 모델입니다.

Link to this section결론#

YOLOv6-3.0은 뛰어난 산업용 GPU 처리량을 제공하고 EfficientDet은 확장 가능한 파라미터 효율적 네트워크를 구축하는 데 있어 AutoML의 잠재력을 보여주지만, 두 모델 모두 배포 용이성과 현대적인 다중 작업 범용성 측면에서 한계를 보입니다.

모바일 엣지 배포부터 클라우드 기반 분석에 이르기까지, 대다수의 실제 애플리케이션에서 Ultralytics 생태계는 타의 추종을 불허하는 성능 균형을 제공합니다. YOLO26을 채택함으로써 개발자는 최첨단 NMS-free 추론, 작은 객체를 위한 고급 손실 함수, 프로토타입에서 프로덕션까지의 경로를 극적으로 가속화하는 통합되고 잘 문서화된 훈련 파이프라인을 활용할 수 있습니다.

댓글