YOLOv8 YOLO11: 실시간 객체 감지의 진화
올바른 컴퓨터 비전 아키텍처를 선택하는 것은 AI 프로젝트의 속도, 정확성, 확장성에 영향을 미치는 중요한 결정입니다. 이 가이드에서는 다음 간의 심층적인 기술 비교를 제공합니다. Ultralytics YOLOv8과 2023년에 출시되어 널리 채택된 업계 표준인 Ultralytics YOLO11는 뛰어난 효율성과 성능을 위해 설계된 YOLO 시리즈의 최신 버전입니다. 아키텍처 차이점, 벤치마크 지표, 이상적인 사용 사례를 분석하여 필요에 가장 적합한 모델을 선택할 수 있도록 도와드립니다.
Ultralytics YOLOv8
저자 저자: 글렌 조처, 아유시 차우라시아, 징 치우
조직:Ultralytics
날짜: 2023-01-10
GitHubultralytics
Docsyolov8
2023년 초에 출시된 YOLOv8 물체 감지의 역사에서 중요한 이정표가 되었습니다. 단일 저장소 내에서감지, 인스턴스 분할, 포즈 추정, 이미지 분류등 여러 컴퓨터 비전 작업을 지원하는 통합 프레임워크를 도입했습니다. YOLOv8 앵커 기반 감지 방식에서 앵커 없는 접근 방식으로 전환하여 설계를 간소화하고 다양한 물체 형태에 대한 일반화를 개선했습니다.
아키텍처 및 주요 기능
YOLOv8 C3 모듈을 대체했습니다. YOLOv5 의 C2f 모듈 (두 개의 컨볼루션이 있는 교차 단계 부분 병목 현상)로 대체했습니다. 이러한 변화는 가벼운 설치 공간을 유지하면서 그라디언트 흐름과 기능 통합을 개선했습니다. 또한 이 아키텍처는 객체, 분류, 회귀 작업을 분리하여 정확도를 높이는 디커플링 헤드가 특징입니다.
강점과 약점
- 강점:
- 성숙한 에코시스템: 방대한 커뮤니티 튜토리얼, 통합 및 배포 가이드가 지원됩니다.
- 다목적성: 기본적으로 표준 감지와 함께 OBB(오리엔티드 바운딩 박스) 및 분류를 지원합니다.
- 검증된 안정성: 오랜 track 있는 모델을 필요로 하는 프로덕션 환경에 적합한 안전한 선택입니다.
- 약점:
- 속도 효율성: 빠르긴 하지만 CPU 추론 속도와 매개변수 효율성에서 YOLO11 성능이 떨어집니다.
- 컴퓨팅 요구 사항: 더 큰 배리언트(L, X)는 최적화된 YOLO11 비해 더 많은 VRAM과 FLOP을 요구합니다.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
Ultralytics YOLO11
저자 저자: Glenn Jocher 및 Jing Qiu
조직:Ultralytics
날짜: 2024-09-27
GitHubultralytics
Docsyolo11
YOLO11 은 Ultralytics 모델 제품군의 최첨단을 대표합니다. 실시간 추론을 재정의하도록 설계된 이 제품은 YOLOv8 성공을 기반으로 하되 아키텍처를 대폭 개선했습니다. YOLO11 정확도를 극대화하는 동시에 계산 비용을 최소화하는 데 중점을 두어 엣지 디바이스에서 클라우드 서버에 이르는 최신 AI 애플리케이션을 위한 최고의 선택이 될 것입니다.
아키텍처 및 주요 기능
YOLO11 C3k2 블록과 C2PSA (공간 주의가 있는 교차 단계 부분) 모듈이 도입되었습니다. 이러한 구성 요소는 모델의 복잡한 피처 추출 및 오클루전 처리 능력을 향상시켜 이전 반복 작업보다 더 효과적으로 오클루전을 처리할 수 있도록 지원합니다. 이 아키텍처는 속도에 최적화되어 CPU에서 훨씬 빠른 처리 시간을 제공하며, 이는 GPU 리소스를 사용할 수 없는 엣지 AI 배포에 중요한 요소입니다.
이 모델은 Ultralytics 통합 인터페이스 특성을 유지하여 개발자가 워크플로를 변경하지 않고도 OBB 또는 세분화와 같은 작업 간에 전환할 수 있도록 합니다.
강점과 약점
- 강점:
- 뛰어난 효율성: YOLOv8 최대 22% 적은 파라미터로 더 높은 mAP 달성하여 모델 크기와 스토리지 요구 사항을 줄입니다.
- 더 빠른 추론: 최신 하드웨어에 특별히 최적화되어 CPU GPU 백엔드 모두에서 더 빠른 속도를 제공합니다.
- 향상된 특징 추출: 새로운 백본은 작은 물체를 감지하고 복잡한 장면에서 성능을 향상시킵니다.
- 메모리 사용량 감소: 다음과 같은 트랜스포머 기반 모델에 비해 트레이닝 시 CUDA 메모리가 덜 필요합니다. RT-DETR과 같은 트랜스포머 기반 모델에 비해 CUDA 메모리를 적게 사용하므로 더 많은 하드웨어에서 훈련할 수 있습니다.
- 약점:
- 최신 릴리스: 최신 모델인 특정 틈새 타사 도구는 지원을 완전히 업데이트하는 데 시간이 걸릴 수 있지만, 핵심 Ultralytics 에코시스템은 첫날부터 이를 지원합니다.
from ultralytics import YOLO
# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
정면 성능 비교
아래 비교는 YOLO11 효율성 향상을 강조합니다. YOLOv8 여전히 강력한 경쟁자이지만, YOLO11 계산 복잡성(FLOPs)이 감소하고 추론 속도가 빨라지면서 지속적으로 더 높은 정확도mAP를 제공합니다. 이는 특히 '나노' 및 '스몰' 모델에서 두드러지게 나타나는데, YOLO11n은 39.5 mAP 달성하는 동시에 YOLOv8n 37.3에 비해 훨씬 빠르게 실행됩니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
메트릭 분석
YOLO11 속도와 정확도의 트레이드오프에서 분명한 이점을 보여줍니다. 예를 들어, YOLO11l 모델은 약 42% 더 적은 매개 변수를 사용하고 CPU 36% 더 빠르게 실행하면서 정확도(+0. mAP)는 YOLOv8l 능가합니다.
에코시스템 및 사용 편의성
두 모델 모두 최첨단 기술을 누구나 이용할 수 있도록 하여 AI를 대중화하도록 설계된 강력한 Ultralytics 에코시스템의 이점을 누릴 수 있습니다.
- 통합 API: YOLOv8 YOLO11 간 전환은 다음에서 모델 문자열을 변경하는 것만큼 간단합니다.
yolov8n.pt에서yolo11n.pt. 코드 리팩토링이 필요하지 않습니다. - 훈련 효율성: Ultralytics 데이터 세트와 사전 학습된 가중치를 자동으로 다운로드하여 데이터 수집에서 모델 학습에 이르는 파이프라인을 간소화합니다.
- 배포의 다양성: 두 모델 모두 원클릭 내보내기를 통해 ONNX, TensorRT, CoreML, TFLite 같은 포맷으로 내보낼 수 있어 Raspberry Pis, 휴대폰, 클라우드 인스턴스 등 다양한 하드웨어에 쉽게 배포할 수 있습니다.
- 잘 관리됩니다: 잦은 업데이트를 통해 최신 버전의 PyTorch 및 CUDA 호환성을 보장하며, Discord 및 GitHub의 활발한 커뮤니티가 이를 뒷받침합니다.
결론 및 권장 사항
동안 YOLOv8 은 레거시 시스템을 유지 관리하는 데 적합한 신뢰할 수 있고 성능이 뛰어난 모델로 남아 있습니다, YOLO11 은 모든 신규 개발을 위한 확실한 권장 모델입니다.
- 다음과 같은 경우 YOLO11 선택하세요: 최고의 정확도, 빠른 추론 속도(특히 CPU)가 필요하거나 메모리와 스토리지가 중요한 리소스 제약이 있는 에지 디바이스에 배포하는 경우. 아키텍처 개선으로 상용 애플리케이션을 위한 미래 지향적인 기반을 제공합니다.
- 다음과 같은 경우 YOLOv8 선택하세요: 기존 파이프라인이 v8 특정 동작에 맞게 크게 조정되었거나 최신 아키텍처로 업데이트할 수 없는 엄격한 프로젝트 요구 사항의 제약을 받고 있는 경우.
다른 아키텍처를 탐색하는 데 관심이 있는 사용자를 위해 다음과 같은 모델에 대해서도 설명하는 Ultralytics 문서가 있습니다. YOLOv9, YOLOv10및 RT-DETR. 모델 비교 페이지에서 더 광범위한 비교를 확인할 수 있습니다.