YOLO11 대 YOLOv7: 상세 기술 비교

컴퓨터 비전 분야는 실시간 객체 탐지가 AI 애플리케이션의 핵심으로 자리 잡으며 빠르게 진화하고 있습니다. 프로젝트에 적합한 아키텍처를 선택하려면 속도, 정확도, 배포 용이성 사이의 복잡한 균형을 고려해야 합니다. 이 가이드에서는 두 가지 주요 아키텍처인 Ultralytics YOLO11YOLOv7을 종합적으로 기술 비교합니다.

모델 배경 및 기술 세부 정보

두 모델 모두 딥러닝 커뮤니티에 상당한 영향을 미쳤지만, 서로 다른 개발 철학과 시대적 배경을 가지고 있습니다.

YOLO11 세부 정보:
저자: Glenn Jocher 및 Jing Qiu
조직: Ultralytics
날짜: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolo11/

YOLO11에 대해 더 알아보기

YOLOv7 세부 정보:
저자: Chien-Yao Wang, Alexey Bochkovskiy, 및 Hong-Yuan Mark Liao
조직: 대만 중앙연구원 정보과학연구소
날짜: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
문서: https://docs.ultralytics.com/models/yolov7/

YOLOv7에 대해 자세히 알아보기

아키텍처 차이점

내부 메커니즘을 분석할 때, 두 탐지기 모두 최첨단 개념을 활용하지만 구조적 기반은 다릅니다.

YOLOv7은 E-ELAN(Extended Efficient Layer Aggregation Networks) 개념을 도입했습니다. 이 아키텍처는 연구 논문에서 보고된 바와 같이, 원본 그래디언트 경로를 훼손하지 않으면서 네트워크의 학습 능력을 지속적으로 향상하도록 설계되었습니다. YOLOv7은 구조적 재파라미터화와 훈련 중 강력한 "bag-of-freebies" 방법론에 크게 의존하여, 추론 비용을 높이지 않으면서 COCO 데이터셋에서의 전반적인 정확도를 향상합니다.

반면, YOLO11은 고도로 최적화된 Ultralytics 아키텍처를 기반으로 합니다. 이 모델은 더 적은 파라미터로 더욱 정교한 특징 추출 파이프라인을 강조하여 훈련 중 메모리 사용량을 낮춥니다. YOLO11은 더 적은 계산 자원(FLOPs)을 사용하면서도 더 무거운 모델의 탐지 정확도와 대등하거나 그 이상의 성능 균형을 달성합니다. 나아가 YOLO11은 본질적으로 다양한 작업을 지원하여 현대 컴퓨터 비전 애플리케이션에 매우 다재다능한 선택지입니다.

메모리 효율성

Ultralytics YOLO 모델의 두드러진 특징 중 하나는 다른 최첨단 모델과 비교하여 훈련 중 메모리 요구 사항이 낮다는 점이며, 이를 통해 개발자는 소비자용 PyTorch 하드웨어에서도 강력한 네트워크를 훈련할 수 있습니다.

성능 및 메트릭 비교

실제 활용 가능성을 정확히 가늠하려면 mAP(mean Average Precision), 추론 속도, 모델 파라미터 및 계산 복잡성(FLOPs)과 같은 지표를 평가하는 것이 필수적입니다. 다음 표는 YOLO11 스케일링 변형 모델과 더 큰 YOLOv7 모델을 비교한 것입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

살펴본 바와 같이, YOLO11x와 같은 모델은 YOLOv7x의 53.1 mAP보다 높은 54.7 mAP를 달성하면서도 훨씬 더 적은 파라미터(56.9M 대 71.3M)를 사용합니다. 이는 YOLO11의 뛰어난 아키텍처 효율성을 보여줍니다.

훈련 효율성 및 생태계 사용 편의성

이 두 아키텍처를 구분 짓는 가장 결정적인 특징 중 하나는 개발자 경험과 주변 생태계입니다.

YOLOv7은 근본적으로 학술 연구용 저장소입니다. 모델을 훈련하려면 복잡한 환경 설정, 수동으로 의존성 관리, 긴 명령줄 인수 사용이 필요한 경우가 많습니다. 최첨단 실험을 지원하지만, YOLOv7 GitHub 저장소 코드를 맞춤형 프로덕션 환경에 적용하는 것은 시간이 많이 걸릴 수 있습니다.

YOLO11은 사용 편의성을 완전히 재정의합니다. 이 모델은 원활한 엔드 투 엔드 워크플로우를 제공하는 포괄적이고 잘 관리되는 생태계인 Ultralytics 플랫폼에 완전히 통합되어 있습니다. 데이터 주석 및 로컬 훈련부터 배포에 이르기까지, 통합된 Python API와 간편한 명령줄 인터페이스가 전체 프로세스를 간소화합니다.

코드 비교

YOLO11로 객체 탐지 모델을 훈련하는 데는 단 몇 줄의 코드만 필요하므로, 진입 장벽이 크게 낮아집니다:

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model effortlessly using the unified API
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Quickly export to ONNX format
model.export(format="onnx")

이와 대조적으로, 일반적인 YOLOv7 훈련 명령은 다음과 같으며 경로, 구성 파일 및 bash 스크립트를 주의 깊게 설정해야 합니다:

python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'

YOLO11은 또한 엄청난 범용성을 제공합니다. YOLOv7은 탐지 이외의 작업(포즈 또는 세그멘테이션 등)을 지원하기 위해 완전히 다른 코드베이스를 사용하거나 무거운 수정이 필요한 반면, YOLO11은 단일 통합 프레임워크를 통해 객체 탐지, 인스턴스 세그멘테이션, 이미지 분류, 포즈 추정OBB(지향 경계 상자) 탐지를 처리합니다.

간편한 내보내기

YOLO11을 TensorRTOpenVINO와 같은 형식으로 내보내는 데는 단 하나의 명령만 필요하며, 기존 모델에서 발생하는 일반적인 연산자 지원 문제를 해결합니다.

실제 애플리케이션 및 이상적인 사용 사례

YOLOv7과 YOLO11 중 어떤 것을 선택할지는 프로젝트 범위와 배포 제약 조건에 전적으로 달려 있습니다.

YOLOv7을 고려해야 할 때:

  • 기존 모델 벤치마킹: 그래디언트 경로 설계를 탐구하는 학술 연구원은 YOLOv7을 기준 모델로 사용하여 최신 컨볼루션 신경망을 평가할 수 있습니다.
  • 기존 맞춤형 파이프라인: YOLOv7만의 고유한 경계 상자 디코딩 로직을 중심으로 특별히 구축된, 무겁게 커스터마이징된 C++ 또는 CUDA 파이프라인을 보유한 팀.

YOLO11을 선택해야 할 때:

  • 상업용 프로덕션: 스마트 리테일 또는 의료 진단 분야의 애플리케이션은 YOLO11의 관리되는 코드베이스와 높은 안정성 덕분에 큰 이점을 얻습니다.
  • 자원 제약 환경: YOLO11n의 경량화된 특성은 ONNX를 통한 모바일 및 엣지 장치 배포에 매우 적합합니다.
  • 멀티태스킹 프로젝트: 단일 애플리케이션에서 사람을 식별하고, 골격(포즈)을 매핑하고, 들고 있는 객체를 세그멘테이션해야 하는 경우 YOLO11은 통합된 솔루션을 제공합니다.

최첨단 기술: YOLO26으로의 전환

YOLO11은 매우 강력한 선택지이지만 인공지능 분야의 혁신은 멈추지 않습니다. 오늘 새로운 프로젝트를 시작하는 엔지니어라면 **Ultralytics YOLO26**을 탐색하는 것을 강력히 추천합니다.

2026년 1월에 출시된 YOLO26은 엔드 투 엔드 NMS-Free 설계를 도입하여 NMS(비최대 억제) 후처리와 관련된 지연 시간 병목 현상을 완전히 제거했습니다. 또한, YOLO26은 LLM 훈련 방법론에서 영감을 받은 혁신적인 MuSGD 옵티마이저를 통합하여 더 빠른 수렴을 보장합니다. ProgLoss + STAL을 통한 타겟 손실 개선과 DFL 제거로 인해 CPU 추론 속도가 최대 43% 향상된 YOLO26은 엣지 컴퓨팅을 위해 특별히 최적화되었으며 비전 AI의 현재 정점을 나타냅니다.

YOLO26에 대해 더 알아보기

특수한 대체 구조에 관심이 있는 사용자는 트랜스포머 기반의 RT-DETR 또는 동적 오픈 보캐블러리 YOLO-World 모델을 탐색하는 것도 다양한 컴퓨터 비전 배포에 유익한 결과를 가져올 수 있습니다.

댓글