Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 대 YOLOv7#

컴퓨터 비전 분야는 실시간 객체 탐지가 AI 애플리케이션의 핵심으로 자리 잡으며 매우 빠르게 발전하고 있습니다. 프로젝트에 적합한 아키텍처를 선택하려면 속도, 정확도, 배포 용이성 사이의 복잡한 균형을 고려해야 합니다. 이 가이드에서는 두 가지 주요 아키텍처인 Ultralytics YOLO11YOLOv7을 종합적으로 기술 비교합니다.

Link to this section모델 배경 및 기술 세부 정보#

두 모델 모두 딥러닝 커뮤니티에 상당한 영향을 미쳤지만, 각각 다른 개발 철학과 시대적 배경을 가지고 있습니다.

YOLO11 세부 정보:
저자: Glenn Jocher 및 Jing Qiu
조직: Ultralytics\n날짜: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
문서: https://docs.ultralytics.com/models/yolo11/

YOLO11에 대해 더 알아보기

YOLOv7 세부 정보:
저자: Chien-Yao Wang, Alexey Bochkovskiy 및 Hong-Yuan Mark Liao
조직: 대만 중앙연구원 정보과학연구소\n날짜: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
문서: https://docs.ultralytics.com/models/yolov7/

YOLOv7에 대해 더 알아보기

Link to this section아키텍처 차이점#

내부 메커니즘을 분석해 보면 두 탐지기 모두 최첨단 개념을 활용하고 있지만, 구조적 기반은 다릅니다.

YOLOv7은 E-ELAN(Extended Efficient Layer Aggregation Networks) 개념을 도입했습니다. 이 아키텍처는 연구 논문에서 보고된 바와 같이 원래의 그래디언트 경로를 손상하지 않으면서 네트워크의 학습 능력을 지속해서 향상하도록 설계되었습니다. YOLOv7은 구조적 재매개변수화와 훈련 중 강력한 "bag-of-freebies" 방법론에 크게 의존하며, 추론 비용을 높이지 않으면서 COCO 데이터셋에서의 전반적인 정확도를 개선합니다.

반면, YOLO11은 고도로 최적화된 Ultralytics 아키텍처를 기반으로 구축되었습니다. 이는 더 적은 파라미터로 정교해진 특징 추출 파이프라인을 강조하여 훈련 중 메모리 사용량을 낮춥니다. YOLO11은 더 적은 계산 자원(FLOPs)을 사용하면서도 더 무거운 모델의 탐지 정확도와 같거나 그 이상의 성능 균형을 달성합니다. 나아가 YOLO11은 더 다양한 작업을 본질적으로 지원하므로 현대적인 컴퓨터 비전 애플리케이션을 위한 매우 다재다능한 선택지입니다.

메모리 효율성

Ultralytics YOLO 모델의 두드러진 특징 중 하나는 다른 최첨단 모델에 비해 훈련 중 메모리 요구량이 낮다는 점이며, 이를 통해 개발자는 일반적인 PyTorch 하드웨어에서도 강력한 네트워크를 훈련할 수 있습니다.

Link to this section성능 및 지표 비교#

실제 환경에서의 유효성을 정확히 측정하려면 mAP(mean Average Precision), 추론 속도, 모델 파라미터, 계산 복잡도(FLOPs)와 같은 지표를 평가하는 것이 필수적입니다. 다음 표는 YOLO11 스케일링 변형 모델과 대형 YOLOv7 모델을 비교한 결과입니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

확인할 수 있듯이, YOLO11x와 같은 모델은 YOLOv7x의 53.1 mAP보다 높은 54.7 mAP를 달성하면서도 파라미터 수는 훨씬 적습니다(56.9M 대 71.3M). 이는 YOLO11의 뛰어난 아키텍처 효율성을 보여줍니다.

Link to this section훈련 효율성 및 생태계 사용 편의성#

이 두 아키텍처를 구분 짓는 가장 결정적인 특성 중 하나는 개발자 경험과 그를 둘러싼 생태계입니다.

YOLOv7은 기본적으로 학술 연구용 저장소입니다. 모델을 훈련하려면 복잡한 환경 설정, 수동 의존성 관리, 긴 명령줄 인자 사용이 필요한 경우가 많습니다. 최신 실험을 지원하지만, YOLOv7 GitHub 저장소 코드를 사용자 정의 프로덕션 환경에 맞게 조정하는 것은 시간이 많이 걸릴 수 있습니다.

YOLO11은 사용 편의성을 완전히 재정의합니다. Ultralytics 플랫폼에 완전히 통합되어, 원활한 엔드 투 엔드 워크플로우를 제공하는 포괄적이고 잘 관리되는 생태계를 갖추고 있습니다. 데이터 어노테이션부터 로컬 훈련 및 배포에 이르기까지, 통합된 Python API와 간편한 명령줄 인터페이스가 전체 프로세스를 간소화합니다.

Link to this section코드 비교#

YOLO11을 사용하여 객체 탐지 모델을 훈련하는 데는 단 몇 줄의 코드만 필요하며, 진입 장벽을 크게 낮춰줍니다:

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model effortlessly using the unified API
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Quickly export to ONNX format
model.export(format="onnx")

반면, 일반적인 YOLOv7 훈련 명령은 경로, 설정 파일, bash 스크립트를 세심하게 설정해야 하며 다음과 같이 복잡합니다:

python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'

YOLO11은 또한 엄청난 범용성을 제공합니다. YOLOv7은 탐지 이외의 작업(예: 포즈 또는 세그먼테이션)을 지원하려면 완전히 다른 코드베이스를 사용하거나 대대적인 수정이 필요하지만, YOLO11은 객체 탐지, 인스턴스 세그먼테이션, 이미지 분류, 포즈 추정, 그리고 OBB(Oriented Bounding Box) 탐지를 하나의 통합된 프레임워크를 통해 모두 처리합니다.

간편한 내보내기(Export)

YOLO11을 TensorRTOpenVINO와 같은 형식으로 내보내는 작업은 단일 명령만으로 가능하며, 기존 모델에서 발생하던 일반적인 운영자 지원 문제를 해결합니다.

Link to this section실제 애플리케이션 및 이상적인 사용 사례#

YOLOv7과 YOLO11 중 무엇을 선택할지는 프로젝트 범위와 배포 제약 조건에 따라 전적으로 달라집니다.

YOLOv7을 고려해야 할 때:

  • 레거시 모델 벤치마킹: 그래디언트 경로 설계를 연구하는 학술 연구원들은 최신 CNN(합성곱 신경망)을 평가하기 위한 기준으로 YOLOv7을 사용할 수 있습니다.
  • 기존 사용자 정의 파이프라인: YOLOv7 고유의 바운딩 박스 디코딩 로직을 중심으로 특별히 구축된, 고도로 사용자 정의된 C++ 또는 CUDA 파이프라인을 보유한 팀.

YOLO11을 선택해야 하는 경우:

  • 상업용 프로덕션: 스마트 리테일 또는 의료 진단 분야의 애플리케이션은 유지 관리되는 코드베이스와 높은 안정성을 제공하는 YOLO11을 통해 큰 혜택을 얻습니다.
  • 자원 제약 환경: YOLO11n의 가벼운 설치 공간은 ONNX를 통해 모바일 및 에지 장치에 배포하는 데 매우 적합합니다.
  • 멀티태스크 프로젝트: 단일 애플리케이션에서 사람을 식별하고, 골격을 매핑(포즈)하며, 들고 있는 객체를 세그먼테이션해야 하는 경우, YOLO11은 통합된 솔루션을 제공합니다.

Link to this section최첨단 기술: YOLO26으로 나아가기#

YOLO11이 매우 견고한 선택지이지만, 인공지능의 혁신은 멈추지 않습니다. 오늘 새로운 프로젝트를 시작하는 엔지니어라면 **Ultralytics YOLO26**을 살펴보는 것을 강력히 추천합니다.

2026년 1월에 출시된 YOLO26은 NMS-Free 설계를 도입하여 NMS(Non-Maximum Suppression) 후처리 과정과 관련된 지연 시간 병목 현상을 완전히 제거했습니다. 또한 YOLO26은 LLM 훈련 방법론에서 영감을 받은 혁신적인 MuSGD Optimizer를 통합하여 더 빠른 수렴을 보장합니다. ProgLoss + STAL을 통한 최적화된 손실 개선과 DFL 제거로 CPU 추론 속도가 최대 43% 향상된 YOLO26은 에지 컴퓨팅에 최적화되었으며 비전 AI의 현재 정점을 대표합니다.

YOLO26에 대해 자세히 알아보기

특수한 대체 구조에 관심이 있는 사용자는 Transformer 기반의 RT-DETR이나 동적 오픈 어휘 YOLO-World 모델을 살펴보는 것도 다양한 컴퓨터 비전 배포에 유익한 결과를 가져올 수 있습니다.

댓글