YOLOv7 YOLO11: 실시간 레거시에서 최첨단 효율성까지
컴퓨터 비전 모델의 환경을 탐색하려면 기존 아키텍처와 최신 최신 기술(SOTA) 혁신 간의 미묘한 차이를 이해해야 합니다. 이 가이드에서는 YOLO 시리즈의 중요한 이정표인 YOLOv7 다음을 포괄적으로 비교합니다. Ultralytics YOLO11와 뛰어난 성능과 다용도로 설계된 최첨단 모델인 울트라트래픽스 YOLO11을 비교합니다.
개발자와 연구자가 객체 감지부터 복잡한 인스턴스 세분화까지 다양한 작업에 최적의 도구를 선택할 수 있도록 아키텍처의 차이점, 벤치마크 지표, 실제 적용 사례를 살펴봅니다.
YOLOv7: 효율적인 아키텍처의 벤치마크
2022년 7월에 출시된 YOLOv7 훈련 효율성과 추론 속도 사이의 균형을 크게 개선했습니다. 정확도 저하 없이 파라미터 수를 줄이는 아키텍처 최적화에 집중하여 이전 탐지기의 성능을 능가하도록 설계되었습니다.
저자들: 저자: 왕치엔야오, 알렉세이 보흐코브스키, 홍위안 마크 리아오
조직:대만 학술원 정보과학연구소
날짜: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docsultralytics
건축 하이라이트
YOLOv7 확장된 효율적인 레이어 집계 네트워크(E-ELAN)를 도입했습니다. 이 아키텍처는 모델이 최단 및 최장 경사 경로를 제어하여 훈련 중 수렴을 강화함으로써 더욱 다양한 특징을 학습할 수 있도록 합니다. 또한 모델 재파라미터화 및 동적 라벨 할당과 같은 일련의 최적화 전략인 '훈련 가능한 공짜 백'을 활용하여 추론 비용을 늘리지 않고도 정확도를 향상시켰습니다.
오픈 소스 커뮤니티에서는 주로 객체 감지 모델이지만, 포즈 추정을 위해 YOLOv7 확장하는 방법을 모색해 왔습니다. 그러나 이러한 구현은 통합 프레임워크에서 볼 수 있는 원활한 통합이 부족한 경우가 많습니다.
장점과 한계
YOLOv7 그 자체로 존경받습니다:
- 견고한 성능: 출시와 동시에 실시간 탐지기의 새로운 기준을 수립하여 COCO 데이터 세트에서 우수한 성능을 발휘했습니다.
- 아키텍처 혁신: E-ELAN의 도입은 네트워크 설계에 대한 후속 연구에 영향을 미쳤습니다.
하지만 최신 워크플로에서는 여러 가지 문제에 직면해 있습니다:
- 복잡성: 교육 파이프라인은 복잡할 수 있으며 최신 표준에 비해 상당한 수동 구성이 필요할 수 있습니다.
- 제한된 활용성: 기본적으로 분류 또는 OBB(방향성 바운딩 박스) 와 같은 작업을 기본적으로 지원하지 않습니다.
- 리소스 사용량: YOLOv7x와 같은 대규모 변종을 학습하려면 상당한 GPU 메모리가 필요하므로 하드웨어가 제한된 연구자에게는 병목 현상이 발생할 수 있습니다.
Ultralytics YOLO11: 속도, 정확성 및 사용 편의성의 재정의
Ultralytics YOLO11 은 다양한 컴퓨터 비전 작업에서 SOTA 성능을 제공하도록 설계된 유명한 YOLO 계보의 최신 진화 버전입니다. 지속적인 개선의 유산을 바탕으로 구축된 YOLO11 실제 배포 시 효율성을 극대화하는 정교한 아키텍처를 제공합니다.
저자 저자: Glenn Jocher 및 Jing Qiu
조직:Ultralytics
날짜: 2024-09-27
GitHubultralytics
Docsyolo11
고급 아키텍처 및 다용도성
YOLO11 C3k2 블록을 사용하는 현대화된 백본과 향상된 SPPF 모듈을 사용하여 다양한 규모의 특징을 보다 효과적으로 캡처합니다. 이러한 설계를 통해 이전 모델 및 경쟁사 모델에 비해 정확도가 향상되었을 뿐만 아니라 파라미터와 FLOPs 측면에서 훨씬 더 가벼운 모델을 구현할 수 있습니다.
YOLO11 가장 큰 특징은 기본 멀티태스킹 지원입니다. 사용자는 단일 프레임워크 내에서 여러 작업을 수행할 수 있습니다:
- 감지: 감지: 경계 상자가 있는 개체 식별.
- 세분화: 정밀한 모양 분석을 위한 픽셀 수준 마스킹.
- 분류: 전체 이미지에 클래스 레이블을 할당합니다.
- 포즈 추정: 인체의 키포인트 감지.
- OBB: 항공 이미지에 필수적인 회전된 물체를 감지하는 기능입니다.
통합 에코시스템
Ultralytics YOLO11 데이터 세트 관리, 코드 없는 교육 및 원클릭 배포를 위한 플랫폼인 Ultralytics HUB와 원활하게 통합됩니다. 이러한 통합으로 MLOps 수명 주기가 크게 빨라집니다.
개발자가 YOLO11 선택하는 이유
- 사용 편의성: 사용자 중심 설계를 통해 YOLO11 단 몇 줄의 Python 코드 또는 간단한 CLI.
- 잘 관리된 에코시스템: 활발한 커뮤니티와 Ultralytics 팀의 지원을 받는 이 모델은 자주 업데이트되어 최신 버전과의 호환성을 보장합니다. PyTorch 버전 및 하드웨어 가속기와의 호환성을 보장합니다.
- 성능 균형: 추론 속도와 평균 정밀도(mAP) 간의 탁월한 절충점을 달성하여 엣지 디바이스와 클라우드 서버 모두에 이상적입니다.
- 메모리 효율성: YOLO11 모델은 일반적으로 이전 아키텍처나 트랜스포머 기반 모델에 비해 트레이닝 시 CUDA 메모리를 덜 필요로 하므로 배치 크기를 늘리거나 적당한 하드웨어에서 트레이닝할 수 있습니다.
성능 비교: 기술 벤치마크
다음 표는 YOLOv7 YOLO11 성능 차이를 보여줍니다. 이 데이터는 최신 최적화를 통해 YOLO11 훨씬 적은 계산 비용으로 뛰어난 정확도를 달성할 수 있는 방법을 보여줍니다.
| 모델 | 크기 (픽셀) | mAPval 50-95 | 속도 CPU ONNX (ms) | 속도 T4 TensorRT10 (ms) | 파라미터 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
분석:
- 효율성: YOLO11m은 거의 절반의 파라미터 (20.1억 대 36.9억)와 훨씬 적은 FLOP을 사용하면서도 YOLOv7l의 정확도(51.5 대 51.4 mAP)와 일치합니다.
- 속도: 실시간 애플리케이션의 경우, YOLO11n은 T4 GPU 1.5ms의 클럭으로 훨씬 더 빠르기 때문에 고FPS 동영상 처리에 적합합니다.
- 정확도: 가장 큰 모델인 YOLO11x는 경쟁력 있는 파라미터 수를 유지하면서 정확도(54.7 대 53.1 mAP)에서 YOLOv7x를 능가합니다.
실제 사용 사례
농업 및 환경 모니터링
정밀 농업에서 작물의 질병을 감지하거나 성장을 모니터링하려면 드론이나 현장 센서와 같이 제한된 전력으로 작동하는 장치에서 실행할 수 있는 모델이 필요합니다.
- YOLO11: 경량 아키텍처(특히 YOLO11n/s)로 라즈베리 파이 또는 NVIDIA Jetson 장치에 배포할 수 있어 실시간 작물 상태 모니터링이 가능합니다.
- YOLOv7: 정확하지만 연산 요구량이 높기 때문에 배터리로 구동되는 엣지 디바이스에서는 활용도가 제한됩니다.
스마트 제조 및 품질 관리
자동화된 육안 검사 시스템은 제조 라인의 미세한 결함을 detect 위해 높은 정밀도를 필요로 합니다.
- YOLO11: 세분화 및 OBB를 수행하는 모델의 기능은 여기서 매우 중요합니다. 예를 들어 컨베이어 벨트에서 회전하는 부품을 감지하려면 OBB가 필수적인데, 이 기능은 YOLO11 기본적으로 지원되지만 YOLOv7 사용자 정의 구현이 필요합니다.
- YOLOv7: 표준 바운딩 박스 감지에는 적합하지만 큰 수정 없이 복잡한 기하학적 결함을 감지하는 데는 적합하지 않습니다.
감시 및 보안
보안 시스템은 여러 개의 비디오 스트림을 동시에 처리하는 경우가 많습니다.
- YOLO11: 빠른 추론 속도를 통해 단일 서버가 더 많은 스트림을 병렬로 처리할 수 있어 인프라 비용을 절감할 수 있습니다.
- YOLOv7: 효과적이지만 프레임당 지연 시간이 길어 단일 장치가 처리할 수 있는 총 채널 수가 줄어듭니다.
구현 및 교육 효율성
Ultralytics 에코시스템의 뛰어난 기능 중 하나는 간소화된 개발자 환경입니다. 아래는 시작하는 방법을 비교한 것입니다.
코드의 단순성
Ultralytics YOLO11 복잡한 상용구 코드를 추상화하여 '배터리 포함'으로 설계되었습니다.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
반면, 오래된 리포지토리는 리포지토리를 복제하고, 구성 파일을 수동으로 조정하고, 학습 및 추론을 위해 복잡한 셸 스크립트를 실행해야 하는 경우가 많습니다.
내보내기 유연성
YOLO11 배포를 위해 다음과 같은 다양한 포맷으로 원클릭 내보내기를 지원합니다. ONNX, TensorRT, CoreML, TFLite 등 다양한 포맷으로 내보낼 수 있습니다. 이러한 유연성 덕분에 어떤 환경에서도 모델을 프로덕션에 바로 사용할 수 있습니다.
결론 결론: 확실한 승자
동안 YOLOv7 은 컴퓨터 비전 역사에서 존경할 만한 모델로 남아 있습니다, Ultralytics YOLO11 은 미래를 대표합니다. 개발자와 연구자에게 YOLO11 매력적인 패키지를 제공합니다:
- 우수한 지표: 더 높은 mAP 더 빠른 추론 속도.
- 풍부한 에코시스템: Ultralytics HUB, 광범위한 문서 및 커뮤니티 지원에 액세스하세요.
- 다용도성: 감지, 세분화, 포즈, 분류, OBB를 위한 단일 프레임워크.
- 미래 대비: 지속적인 업데이트와 유지보수로 새로운 하드웨어 및 소프트웨어 라이브러리와의 호환성을 보장합니다.
새로운 프로젝트의 경우, 효율성과 사용 편의성을 활용하여 YOLO11 의 효율성과 사용 편의성을 활용하는 것이 최소한의 마찰로 최첨단 결과물을 얻을 수 있는 권장 경로입니다.
다른 모델 살펴보기
추가 비교에 관심이 있다면 문서에서 관련 페이지를 살펴보세요:
- YOLO11 vs YOLOv8
- YOLO11 vs YOLOv10
- YOLOv7 vs RT-DETR
- YOLOv7 vs YOLOv5
- 살펴보기 YOLOv9 아키텍처를 살펴보세요.