콘텐츠로 건너뛰기

YOLO Ultralytics YOLOv8: 포괄적인 기술 비교

실시간 컴퓨터 비전 분야는 연구자와 엔지니어들이 속도와 정확성의 한계를 끊임없이 확장해 나가면서 지속적으로 변화하고 있습니다. 이 여정에서 두 가지 중요한 이정표는 YOLO Ultralytics YOLOv8입니다. 두 모델 모두 지연 시간과 평균 정밀도(mAP) 간의 균형을 최적화하는 것을 목표로 하지만, 객체 탐지 문제를 해결하기 위한 근본적으로 다른 아키텍처와 철학적 접근 방식을 취합니다.

이 포괄적인 기술 분석은 각 기술의 기반 아키텍처, 훈련 방법론 및 실제 적용 사례를 비교하여 여러분의 다음 인공지능 프로젝트에 적합한 도구를 선택하는 데 도움을 드릴 것입니다.

모델 계보 및 사양

이러한 딥러닝 모델의 기원을 이해하는 것은 그 설계 목표와 배포 생태계에 관한 귀중한 맥락을 제공한다.

YOLO

저자: 쉬셴저(Xianzhe Xu), 장이치(Yiqi Jiang), 천웨이화(Weihua Chen), 황이룬(Yilun Huang), 장위안(Yuan Zhang), 쑨시위(Xiuyu Sun)
소속:알리바바 그룹(Alibaba Group)
날짜: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:YOLO

DAMO-YOLO에 대해 자세히 알아보세요.

Ultralytics YOLOv8

저자: Glenn Jocher, Ayush Chaurasia, Jing Qiu
소속:Ultralytics
날짜: 2023-01-10
GitHub:ultralytics
문서:YOLOv8

8에 대해 자세히 알아보기

아키텍처 혁신

두 아키텍처의 성능 특성은 각각의 고유한 구조적 결정에서 비롯된다.

YOLO 최적의 네트워크 구조를 자동으로 발견하기 위해 신경망 구조 탐색(NAS)에 크게YOLO . 이는 낮은 지연 시간으로 높은 성능을 제공하는 백본을 탐색하는 MAE-NAS라는 개념을 도입합니다. 또한 효율적인 RepGFPN(재매개변수화된 일반화된 피라미드 특징 네트워크)을 활용하여 서로 다른 공간적 규모에 걸친 특징 융합을 향상시킵니다.

훈련 성능 향상을 위해 알리바바 팀은 제로헤드(ZeroHead) 설계와 정렬형 OTA(AlignedOTA) 레이블 할당 방식을 도입했습니다. 또한 복잡한 지식 증류(knowledge distillation) 프로세스에 크게 의존하여, 무거운 교사 모델이 가벼운 학생 모델을 지도함으로써 학술 벤치마크에서 더 높은 정확도 지표를 이끌어냈습니다.

YOLOv8: 간소화되고 다재다능한

Ultralytics YOLOv8 개발자 중심 접근 방식을 Ultralytics . 이는 앵커 기반 설계에서 벗어나 YOLOv5 에서 앵커 프리 아키텍처로 전환하여 경계 상자 예측 횟수를 크게 줄이고 추론을 가속화했습니다. C2f(2개의 컨볼루션으로 구성된 크로스 스테이지 부분 병목) 모듈의 도입은 과도한 계산 오버헤드 없이도 기울기 흐름과 특징 표현을 개선했습니다.

경계 상자를 엄격하게 표적화하는 모델과 달리, YOLOv8 처음부터 다중 모달을 위해 YOLOv8 . 통합된 PyTorch 코드베이스는 인스턴스 세그멘테이션, 포즈 추정, 이미지 분류를 기본적으로 지원하여 엔지니어들이 서로 다른 저장소를 조합하는 수고를 덜어줍니다.

효율적인 훈련

Ultralytics 본질적으로 중량급 트랜스포머 기반 아키텍처에 비해 훈련 중 더 적은 메모리를 필요로 하여, 일반 소비자용 GPU에서도 최첨단 성능을 발휘합니다.

성능 대결

원시 지표를 비교할 때는 이론적 성능이 하드웨어 성능으로 어떻게 구현되는지 분석하는 것이 중요합니다. 아래 표는 모델 크기별 성능 저하를 보여줍니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

YOLO 증류 기법 덕분에 높은 매개변수-정확도 비율을YOLO , YOLOv8 더 넓은 모델 크기 범위(나노부터 초대형까지)를 YOLOv8 . YOLOv8 모델은 가장자리 최적화의 모범 사례로, 적은 자원을 소비하면서도 매우 실용적인 정밀도를 제공합니다.

에코시스템 및 개발자 경험

학술 논문과 실제 운영 가능한 시스템 사이의 진정한 차별화 요소는 생태계이다.

YOLO 방대한 지식 증류 파이프라인에 의존하는 특성상 맞춤형 훈련이 번거로울 수 있습니다. 교사 모델 생성, 지식 전이, NAS 기반 백본 튜닝에는 높은 CUDA 고급 구성이 필요하여 민첩한 엔지니어링 팀의 작업 속도를 저하시키는 경우가 많습니다.

반대로, Ultralytics 사용 편의성을 중시합니다. Ultralytics 통해 개발자는 간단한 API, 포괄적인 문서, 강력한 실험 추적 통합 기능을 이용할 수 있습니다. 통합된 Python 복잡한 파이프라인 구축을 매우 쉽게 만들어 줍니다.

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

이 간소화된 워크플로우는 OpenVINO로의 원활한 내보내기와 결합되어 OpenVINOTensorRT으로의 원활한 내보내기를 통해 로컬 프로토타이핑부터 클라우드 또는 엣지 배포까지 마찰 없는 경로를 보장합니다.

실제 적용 사례와 이상적인 사용 사례

이러한 아키텍처 중에서 선택하는 것은 종종 환경의 운영 제약 조건에 따라 결정됩니다.

YOLO 분야

YOLO 신경망 구조 탐색을 연구하는 학술 환경이나 복잡한 반복 매개변수화 전략을 재현하려는 연구자들에게 탁월한YOLO . 또한 제조 라인에서의 고속 결함 탐지와 같이 고도로 통제된 산업용 애플리케이션에서도 뛰어난 성능을 발휘할 수 있습니다. 단, 팀이 다단계 훈련을 처리할 수 있는 컴퓨팅 자원을 보유한 경우에 한합니다.

왜 Ultralytics 생산 환경에서 Ultralytics

상업적 프로젝트의 압도적 다수에서 Ultralytics 탁월한 성능 균형을 제공합니다.

  • 스마트 리테일: YOLOv8 다중 작업 기능을 활용하여 재고 관리를 위한 경계 상자 탐지 및 고객 행동 분석을 위한 자세 추정 모두를 처리합니다.
  • 농업: 인스턴스 분할 기술을 활용하여 트랙터 실시간 영상에서 detect 식물 경계와 잡초를 detect .
  • 항공 촬영 이미지: 방향성 경계 상자(OBB)를 활용하여 드론이나 위성에서 촬영한 track 차량 및 선박을 정확하게 track 하기.

기타 주목할 만한 모델들

더 넓은 지형을 탐색 중이라면, 다음을 비교해 보는 것도 흥미로울 수 있습니다. YOLOv10 또는 YOLO11 를 비교해 보는 것도 흥미로울 수 있습니다.

미래 대비: YOLO26 등장

YOLOv8 여전히 기초 모델로 YOLOv8 있지만, 해당 분야는 계속 발전해 왔습니다. 모든 새로운 발전에 대해, YOLO26 이 권장 표준입니다. 2026년 1월에 출시된 이 모델은 Ultralytics 획기적인 도약을 상징합니다.

YOLO26은 NMSNon-Maximum Suppression) NMS 원활하게 작동하는 종단 간(end-to-end) 설계를 최초로 구현하여 기존 NMS 병목 현상을 완전히 제거했습니다. 이러한 구조적 혁신으로 CPU 속도가 최대 43% 향상되어, 엣지 컴퓨팅 및 IoT 하드웨어 분야에서 절대적인 성능을 발휘하는 핵심 솔루션으로 자리매김했습니다.

또한 YOLO26은 대규모 언어 모델(LLM) 훈련 기법에서 영감을 받은 하이브리드 방식인 MuSGD 최적화기를 도입하여 더 빠른 수렴과 매우 안정적인 훈련 루프를 보장합니다. 새로운 ProgLoss + STAL 알고리즘과 결합된 YOLO26은 소형 물체 인식에서 획기적인 개선을 보여, 배포 환경이 단순히 빠를 뿐만 아니라 타협 없는 정확성을 보장합니다.

YOLO26에 대해 더 알아보기


댓글