콘텐츠로 건너뛰기

YOLO26 대YOLO: 실시간 객체 탐지기의 기술적 비교

최첨단 컴퓨터 비전 모델을 선택할 때는 추론 속도, 정확도, 배포 용이성 간의 최적 균형을 찾는 것이 핵심입니다. 본 종합 가이드에서는 비전 AI 분야에서 두드러진 두 모델인 Ultralytics YOLO 비교합니다. 두 아키텍처 모두 실시간 객체 탐지의 한계를 넓히고 있지만, 그 기반 설계 철학과 의도된 사용 사례는 크게 다릅니다.

건축적 혁신과 디자인

Ultralytics : 에지 우선 비전 표준

글렌 조커(Glenn Jocher)와 징 치우(Jing Qiu)가 개발한 Ultralytics 에서 개발되어 2026년 1월 14일에 출시된 YOLO26은 YOLO 거대한 도약을 상징합니다. 이 모델은 에지 컴퓨팅을 위해 처음부터 설계되어 최첨단 LLM 훈련 방식과 고급 비전 아키텍처를 완벽하게 결합합니다.

YOLO26의 주요 아키텍처적 혁신은 다음과 같습니다:

  • 엔드투엔드 NMS 프리 설계: 선구적인 연구를 바탕으로 YOLOv10의 선구적인 연구를 바탕으로, YOLO26은 본질적으로 엔드투엔드(end-to-end)입니다. 후처리 단계에서 비최대 억제(NMS)를 완전히 제거함으로써, 결정론적 지연 시간을 보장하고 배포 파이프라인을 대폭 간소화합니다.
  • DFL 제거: 분포 초점 손실(DFL)을 제거하면 모델 그래프가 간소화됩니다. 이로 인해 ONNX와 같은 배포 프레임워크로 내보내기가 용이해집니다. ONNXTensorRT 으로의 내보내기를 훨씬 원활하게 하며 저전력 에지 장치와의 호환성을 향상시킵니다.
  • MuSGD 최적화기: Moonshot AI의 Kimi K2에서 영감을 받은 이 알고리즘은 확률적 경사 하강법(SGD)과 뮤온(Muon)의 하이브리드로, 대규모 언어 모델(LLM) 훈련의 혁신을 컴퓨터 비전 분야에 도입하여 놀라울 정도로 안정적인 훈련과 빠른 수렴을 실현합니다.
  • ProgLoss + STAL: 이 고급 손실 함수들은 소형 물체 인식에서 현저한 개선을 제공하며, 이는 드론 기반 항공 이미지 분석 및 정교한 로봇 공학 파이프라인에 필수적인 요소입니다.

YOLO26에 대해 더 알아보기

YOLO: 대규모 신경망 구조 탐색

알리바바 그룹의 쉬셴저(Xianzhe Xu), 장이치(Yiqi Jiang), 천웨이화(Weihua Chen), 황이룬(Yilun Huang), 장위안(Yuan Zhang), 쑨시위(Xiuyu Sun)가 개발한YOLO (2022년 11월 23일 공개)는 자동화된 아키텍처 발견에 중YOLO . 이 연구는 arXiv 논문에서 상세히 설명된 바와 같이, 신경망 아키텍처 검색(NAS)을 활용하여 엄격한 지연 시간 예산 하에서 최적의 백본을 찾습니다.

YOLO 주요 아키텍처 특징은YOLO :

  • MAE-NAS 백본: 다목적 진화적 탐색을 활용하여 정확도와 목표 배치 속도의 균형을 맞춘 백본을 자동으로 설계합니다.
  • 효율적인 RepGFPN: 다양한 규모에 걸쳐 특징 융합을 최적화하는 견고한 헤비넥 설계로, 복잡한 시각적 장면 처리 능력이 매우 뛰어납니다.
  • ZeroHead: 최종 예측 계층에서의 계산 오버헤드를 최소화하기 위해 설계된 극도로 단순화된 감지 헤드.

DAMO-YOLO에 대해 자세히 알아보세요.

적합한 아키텍처 선택하기

YOLO NAS 기반 아키텍처는 특정 사전 정의된 하드웨어 제약 조건에 탁월하지만, YOLO26의 NMS 없는 설계와 DFL 제거는 다양한 에지 및 클라우드 환경 전반에 걸쳐 훨씬 더 다용도적이고 예측 가능한 선택지를 제공합니다.

성능 및 지표 비교

표준 COCO 훈련된 모델 변형들을 직접 비교하면 뚜렷한 성능 프로파일이 드러난다. 아래 표는 정확도(mAP), 속도, 계산 자원의 발자국(매개변수 및 FLOPs) 간의 상충 관계를 요약한다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

성능 분석

데이터 분석 결과, 현대적 애플리케이션에서는 성능 균형이 YOLO26 쪽으로 크게 기울어집니다. 나노 변형(YOLO26n)은 단 240만 개의 매개변수로 매우 가벼우며, GPU 1.7ms라는 놀라운 속도를 제공합니다. 또한 YOLO26은 전용 GPU 없는 에지 디바이스에서 최대 43% 더 빠른 CPU 제공하도록 특별히 설계되어, 이 분야의 확실한 챔피언으로 자리매김했습니다.

순수 mAP 측면에서 DAMO-YOLO가 YOLO26n을 약간 앞서는 반면, 이는 매개변수 수가 거의 4배(850만 개)에 달하는 대가를 치르며 달성됩니다. 더 큰 변종으로 갈수록 YOLO26은YOLO 작은 메모리 사용량과 낮은 CUDA 메모리 사용량, 그리고 훨씬 빠른 TensorRT 유지합니다.

생태계, 사용성 및 교육 효율성

기계 학습 모델의 진정한 힘은 단순한 지표 수치에 있는 것이 아니라, 개발자와 연구자가 얼마나 쉽게 활용할 수 있는가에 있다.

Ultralytics 이점

Ultralytics 선택하면 고도로 정제된 개발자 중심 생태계에 접근할 수 있습니다. 데이터 증강, 하이퍼파라미터 튜닝, 강력한 실험 추적과 같은 복잡한 워크플로가 직관적인 명령어로 추상화됩니다.

또한 YOLO26은 타의 추종을 불허하는 다용도성을 제공합니다.YOLO 순수한 객체 탐지기에YOLO 반면, YOLO26은 다양한 분야에서 즉시 사용 가능한 포괄적이고 작업별 개선 사항을 제공합니다:

  • 인스턴스 분할: 특수한 의미적 분할 손실 함수와 다중 스케일 프로토타이핑 활용.
  • 자세 추정: 고급 잔차 로그우도 추정(RLE) 활용
  • 방향성 경계 상자(OBB): 까다로운 경계 문제를 완벽하게 해결하기 위해 특수한 각도 손실 함수를 통합합니다.
  • 이미지 분류: 빠르고 가벼운 글로벌 이미지 라벨링을 위해.

학습 방법론

YOLO 훈련은YOLO 대규모 "교사" 모델이 소규모 "학생" 모델을 훈련시키는 복잡한 증류 과정을 수반합니다. 이 기법은 한계 정확도 향상을 이끌어내지만, 방대한 GPU 더 긴 훈련 주기를 요구합니다.

반대로 YOLO26의 메모리 요구량은 상당히 낮습니다. MuSGD 최적화기를 기반으로 하는 YOLO26은 일반 소비자용 하드웨어에서도 빠르고 효율적으로 학습합니다. PyTorch를 사용하여 YOLO26 모델을 얼마나 쉽게 훈련할 수 있는지 살펴보겠습니다. PyTorch기반 Ultralytics Python 사용하여 YOLO26 모델을 얼마나 쉽게 훈련시킬 수 있는지 보여드리겠습니다:

from ultralytics import YOLO

# Initialize the natively end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the optimized, NMS-free model
model.export(format="onnx")

다른 모델 살펴보기

Ultralytics 내에서 다른 현대적 아키텍처를 탐색하는 데 관심이 있다면, 매우 뛰어난 성능을 자랑하는 YOLO11 는 기존 파이프라인에 대한 탁월한 선택지로 남아 있습니다. 또는 트랜스포머 기반 아키텍처에 관심이 있는 연구자들은 RT-DETR 모델을 살펴볼 수 있습니다.

실제 응용 분야

이러한 아키텍처 중에서 선택하는 것은 궁극적으로 배포 환경에 달려 있습니다.

엣지 AI 및 IoT 기기

스마트 리테일 카메라, 자동화 농업 모니터링 장비 또는 로봇 공학 분야에서는 컴퓨팅 자원이 극도로 제한됩니다. 이러한 환경에서는 YOLO26이 확실한 선택입니다. 43% 더 빠른 CPU , 완전한 NMS 파이프라인, 그리고 작은 매개변수 크기를 통해 라즈베리 파이와 같은 에지 디바이스에서도 중요한 정확도를 저하시키지 않고 원활하게 실행됩니다.

고속 제조 및 품질 관리

고속 제조 자동화 라인에서 빠르게 이동하는 컨베이어 벨트의 결함을 감지하려면 최소한의 결정론적 지연 시간이 필요합니다.YOLO 특정 GPU 적절히 작동할YOLO 있지만, 기존 NMS 인한 변동 지연 시간은 로봇 액추에이터의 동기화를 방해할 수 있습니다. YOLO26의 엔드투엔드 특성은 일관되고 예측 가능한 프레임 처리 시간을 보장하여 고속 산업용 로봇 시스템에 완벽하게 통합될 수 있도록 합니다.

드론 및 항공 촬영 이미지

고고도에서 미세한 대상물을 탐지하는 것은 매우 어려운 것으로 알려져 있다. YOLO26에 ProgLoss와 STAL을 통합함으로써 소형 물체 인식 능력이 획기적으로 향상되었다. 야생동물 추적이나 무인항공기(UAV)를 통한 교통 정체 분석 등 어떤 상황에서든 YOLO26은YOLO 포함한 기존 아키텍처가 자주 놓치는 더 작은 픽셀 영역의 물체들을 꾸준히 식별해낸다.

사용 사례 및 권장 사항

YOLO26과YOLO 사이의 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라YOLO .

YOLO26을 선택해야 할 때

YOLO26은 다음에 대한 강력한 선택입니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

YOLO 선택해야 할 때

YOLO 다음에 권장YOLO :

  • 고처리량 비디오 분석: 고정된 NVIDIA GPU 높은 FPS의 비디오 스트림을 처리하며, 배치 1 처리량이 주요 지표입니다.
  • 산업용 제조 라인: 전용 하드웨어에서 엄격한 GPU 제약이 적용되는 시나리오, 예를 들어 조립 라인에서의 실시간 품질 검사.
  • 신경망 구조 탐색 연구: 자동화된 구조 탐색(MAE-NAS)과 효율적인 재매개변수화 백본이 탐지 성능에 미치는 영향 연구.

결론

YOLO 특정 하드웨어 대상에 대한 신경망 아키텍처 검색(Neural Architecture Search)의 역량을 보여주는 흥미로운 연구 사례로YOLO 있지만, Ultralytics 현대 AI 실무자에게 더 우수하고 다재다능한 솔루션으로 자리매김하고 있습니다. 엔드투엔드 NMS 프리 아키텍처, 현저히 낮은 메모리 요구량, 하이브리드 MuSGD 최적화기, 그리고 완벽하게 관리되는 생태계를 갖춘 YOLO26은 개발자들이 그 어느 때보다 빠르고 안정적으로 최첨단 비전 시스템을 구축하고 배포할 수 있도록 지원합니다.


댓글