Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 대 EfficientDet#

computer vision 프로젝트에 최적의 신경망을 선택하려면 사용 가능한 아키텍처에 대한 깊은 이해가 필요합니다. 이 가이드는 Ultralytics YOLO11과 Google의 EfficientDet 간의 심층적인 기술적 비교를 제공합니다. 아키텍처 차이점, performance metrics, 학습 효율성 및 이상적인 배포 시나리오를 살펴보고 machine learning 워크로드에 대한 정보에 입각한 결정을 내릴 수 있도록 도움을 드립니다.

Link to this section모델 배경 및 사양#

두 모델 모두 딥러닝 분야에 큰 영향을 미쳤지만, 서로 다른 설계 철학과 AI 개발 시대에서 비롯되었습니다.

Link to this sectionYOLO11 세부 정보#

저자: Glenn Jocher 및 Jing Qiu 조직: Ultralytics 날짜: 2024-09-27 GitHub: https://github.com/ultralytics/ultralytics 문서: https://docs.ultralytics.com/models/yolo11/

YOLO11에 대해 더 알아보기

Link to this sectionEfficientDet 세부 정보#

저자: Mingxing Tan, Ruoming Pang 및 Quoc V. Le 조직: Google 날짜: 2019-11-20 Arxiv: https://arxiv.org/abs/1911.09070 GitHub: https://github.com/google/automl/tree/master/efficientdet 문서: https://github.com/google/automl/tree/master/efficientdet#readme

EfficientDet에 대해 자세히 알아보기

생태계 이점

컴퓨터 비전 모델을 사용할 때는 모델 자체만큼이나 주변 생태계도 중요합니다. Ultralytics 생태계는 광범위한 문서, 활발한 커뮤니티 지원, 그리고 ONNXTensorRT와 같은 형식으로의 원활한 내보내기 기능을 제공하여 타의 추종을 불허하는 개발자 경험을 선사합니다.

Link to this section아키텍처 혁신#

Link to this sectionEfficientDet: BiFPN 및 Compound Scaling#

2019년 말에 도입된 EfficientDet은 계산 비용을 최소화하면서 정확도를 극대화하는 것을 목표로 했습니다. 이는 주로 두 가지 메커니즘을 통해 달성됩니다. 첫째, 깊이, 너비 및 해상도를 응집력 있게 조정하는 EfficientNet 백본을 사용합니다. 둘째, 쉽고 빠른 다중 스케일 특징 융합을 가능하게 하는 양방향 특징 피라미드 네트워크(BiFPN)를 도입했습니다.

당시에는 매우 효율적이었지만, TensorFlow AutoML 라이브러리에 대한 의존성 때문에 EfficientDet은 경직될 수 있습니다. 연구자들은 현대적인 모듈형 PyTorch 기반 프레임워크와 비교할 때 모델 가지치기 및 사용자 정의 수정이 어렵다고 느끼는 경우가 많습니다.

Link to this sectionYOLO11: 향상된 특징 추출 및 범용성#

YOLO11은 객체 탐지 아키텍처의 중요한 도약을 상징합니다. 이전 모델의 성공을 바탕으로 정교해진 C3k2 블록과 개선된 공간 피라미드 풀링(Spatial Pyramid Pooling) 모듈을 도입했습니다. 이러한 향상된 기능은 뛰어난 특징 추출으로 이어져 YOLO11이 복잡한 시각적 패턴을 매우 선명하게 포착할 수 있게 합니다.

A major advantage of YOLO11 is its versatility. While EfficientDet is strictly an object detection model, YOLO11 natively supports instance segmentation, image classification, pose estimation, and oriented bounding boxes (OBB). Furthermore, YOLO11 boasts incredibly low memory requirements during both training and inference, making it vastly superior to older models and bulky vision transformers when deploying to resource-constrained edge AI environments.

Link to this section성능 및 벤치마크#

평균 정밀도(mAP)로 측정되는 정확도와 추론 속도 간의 균형은 실제 배포에서 결정적인 요소입니다. 아래 표는 표준 COCO 데이터셋에서 두 모델 제품군 모두의 원시 성능을 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

보시다시피 YOLO11은 매우 유리한 성능 균형을 달성합니다. YOLO11x는 가장 높은 전체 정확도(54.7 mAP)를 달성하며, 더 작은 YOLO11 변형 모델은 TensorRT를 사용하는 T4에서 1.5ms까지 낮은 GPU 추론 속도로 압도적인 성능을 보여줍니다.

Link to this section학습 효율성 및 생태계#

Ultralytics 모델의 정의적인 특징 중 하나는 사용 편의성입니다. EfficientDet 모델을 학습하려면 종종 복잡한 TensorFlow 그래프 구성을 탐색하고 복잡한 의존성 체인을 관리해야 합니다. 이와 극명하게 대조적으로, YOLO11은 깔끔하고 매우 현대적인 PyTorch 기반 위에 구축되었습니다.

이러한 잘 관리된 생태계 덕분에 개발자는 단 몇 줄의 코드로 패키지를 설치하고, 사전 학습된 모델을 로드하며, 사용자 지정 데이터셋에 대한 학습을 시작할 수 있습니다.

Link to this sectionPython 코드 예시#

다음은 Ultralytics API의 단순함을 보여주는 완전 실행 가능한 예제입니다. 이 스크립트는 사전 학습된 YOLO11 모델을 다운로드하고, 학습시키며, 빠른 예측을 실행합니다.

from ultralytics import YOLO

# Initialize a pretrained YOLO11 nano model
model = YOLO("yolo11n.pt")

# Train the model efficiently using the integrated PyTorch engine
# Training efficiency is high, requiring less VRAM than legacy models
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, device="cpu")

# Run real-time inference on a sample image
prediction = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the output bounding boxes
prediction[0].show()

Link to this section미래를 향하여: YOLO26의 이점#

YOLO11은 매우 강력하지만, 새로운 그린필드 프로젝트를 시작하는 팀은 2026년 1월에 출시된 Ultralytics YOLO26을 강력히 고려해야 합니다. YOLO26은 배포 단순성과 엣지 성능의 패러다임 변화를 상징합니다.

YOLO26의 주요 혁신은 다음과 같습니다:

  • 엔드투엔드 NMS-프리 설계: 후처리 중 비최대 억제(NMS)를 제거함으로써 YOLO26은 고속 로봇 공학 및 자율 주행에 필수적인 일관된 초저지연성을 보장합니다.
  • 최대 43% 더 빠른 CPU 추론: 전용 GPU가 없는 배포의 경우, YOLO26은 표준 프로세서에서 처리량을 최대화하도록 특별히 최적화되었습니다.
  • MuSGD 옵티마이저: Moonshot AI의 Kimi K2에서 영감을 받은 이 하이브리드 옵티마이저는 LLM 학습 안정성을 컴퓨터 비전에 도입하여 더 빠른 수렴을 가능하게 합니다.
  • ProgLoss + STAL: 이러한 개선된 손실 함수는 위성 이미지 분석 및 드론 영상에서 종종 골칫거리인 작은 객체 인식을 획기적으로 향상시킵니다.
  • DFL 제거: Distribution Focal Loss를 제거하여 엣지 장치로의 모델 내보내기 프로세스를 간소화했습니다.
탐색해 볼 대체 모델

프로젝트에 매우 구체적인 요구 사항이 있는 경우, 트랜스포머 기반 탐지를 위한 RT-DETR 모델이나 많은 레거시 기업 배포에서 여전히 주요 제품으로 사용되는 널리 채택된 YOLOv8을 벤치마킹하는 것도 좋습니다.

Link to this section활용 사례 및 권장 사항#

YOLO11과 EfficientDet 중에서 선택하는 것은 구체적인 프로젝트 요구 사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

Link to this sectionYOLO11을 선택해야 할 때#

YOLO11은 다음에 강력히 추천합니다:

  • 프로덕션 엣지 배포: 신뢰성과 활발한 유지 관리가 가장 중요한 Raspberry Pi 또는 NVIDIA Jetson과 같은 디바이스에서의 상업용 애플리케이션.
  • 다중 작업 비전 애플리케이션: 단일 통합 프레임워크 내에서 detection, segmentation, pose estimationOBB가 필요한 프로젝트.
  • 신속한 프로토타이핑 및 배포: 간소화된 Ultralytics Python API를 사용하여 데이터 수집에서 프로덕션 단계까지 빠르게 이동해야 하는 팀.

Link to this sectionEfficientDet을 선택해야 할 때#

EfficientDet은 다음 경우에 권장됩니다:

  • Google Cloud 및 TPU 파이프라인: EfficientDet의 네이티브 최적화가 지원되는 Google Cloud Vision API 또는 TPU 인프라와 깊게 통합된 시스템.
  • 컴파운드 스케일링 연구: 네트워크 깊이, 너비 및 해상도 스케일링의 균형 잡힌 효과를 연구하는 데 중점을 둔 학술적 벤치마킹.
  • TFLite를 통한 모바일 배포: Android 또는 임베디드 Linux 장치를 위해 TensorFlow Lite 내보내기가 특별히 필요한 프로젝트.

Link to this sectionUltralytics (YOLO26)를 선택해야 할 때#

대부분의 신규 프로젝트에서 Ultralytics YOLO26은 성능과 개발자 경험의 최상의 조합을 제공합니다:

  • NMS 미사용 엣지 배포: 비최대 억제 후처리의 복잡성 없이 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 가속이 없는 디바이스에서, 최대 43% 더 빠른 YOLO26의 CPU 추론 속도가 결정적인 이점을 제공합니다.
  • 소형 객체 탐지: aerial drone imagery 또는 IoT 센서 분석과 같이 ProgLoss와 STAL이 작은 객체에 대한 정확도를 크게 높여주는 어려운 시나리오.

Link to this section결론#

EfficientDet은 객체 탐지에서 Compound Scaling의 실현 가능성을 입증한 선구적인 아키텍처였습니다. 그러나 AI 연구의 빠른 속도는 더 뛰어나고, 통합하기 쉬우며, 더 빠르게 실행되는 모델들을 탄생시켰습니다.

강력한 다중 작업 기능, 놀라운 GPU 추론 속도, 그리고 업계에서 가장 개발자 친화적인 API를 갖춘 YOLO11은 현대적인 비전 파이프라인을 위한 확실한 승자입니다. 기술의 최첨단을 지향하는 분들, 특히 엣지 우선 배포를 고려하는 분들에게 YOLO26으로의 업그레이드는 NMS-프리 속도와 타의 추종을 불허하는 정확도의 궁극적인 조합을 제공합니다.

댓글