콘텐츠로 건너뛰기

YOLOX와 YOLOv7: 자세한 기술 비교

객체 감지 모델의 환경을 탐색하려면 아키텍처의 뉘앙스와 성능 트레이드오프에 대한 깊은 이해가 필요합니다. 이 가이드에서는 YOLOX와 YOLOv7과 컴퓨터 비전 분야에 큰 영향을 미친 두 가지 아키텍처를 포괄적으로 비교합니다. 구조적 혁신, 벤치마크 메트릭, 실제 적용 사례를 살펴보고 프로젝트에 가장 적합한 것을 결정하는 데 도움을 드립니다. 두 모델 모두 출시 당시에는 최첨단 발전을 대표했지만, 오늘날 개발자들은 통합 워크플로와 최첨단 성능을 위해 종종 Ultralytics 에코시스템을 찾습니다.

정면 성능 비교

모델을 선택할 때 평균 평균 정밀도mAP와 추론 지연 시간 사이의 균형이 결정적인 요소인 경우가 많습니다. YOLOX는 나노부터 X까지 확장성이 뛰어난 모델 제품군을 제공하며, 앵커가 없는 설계를 통해 단순성을 강조합니다. 반대로 YOLOv7 고급 아키텍처 최적화를 사용하여 실시간 애플리케이션의 속도-정확도 절충을 극대화하는 데 중점을 둡니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

데이터는 뚜렷한 강점을 보여줍니다. YOLOXnano는 매우 가볍기 때문에 리소스가 극도로 제한된 환경에 이상적입니다. 그러나 고성능 시나리오의 경우, YOLOv7x는 뛰어난 정확도(53.1% mAP)와 효율성을 보여주며, T4 GPU에서 훨씬 적은 부동 소수점 연산(FLOPs)과 빠른 추론 시간으로 YOLOXx보다 더 높은 정밀도를 구현할 수 있습니다.

YOLOX: 앵커 프리 디자인을 통한 단순성

욜록스는 앵커 기반 메커니즘을 버리고 앵커가 없는 접근 방식을 채택함으로써 YOLO 시리즈의 패러다임 전환을 알렸습니다. 이러한 설계 선택은 훈련 프로세스를 간소화하고 도메인별 휴리스틱 최적화가 필요한 수동 앵커 박스 튜닝의 필요성을 제거합니다.

아키텍처 및 주요 혁신

YOLOX는 분리된 헤드 구조를 통합하여 분류와 회귀 작업을 분리합니다. 이러한 분리를 통해 모델은 물체의 종류와 위치를 인식하기 위한 고유한 특징을 학습할 수 있어 더 빠른 수렴과 정확도 향상으로 이어집니다. 또한 YOLOX는 양성 샘플을 실측 물체와 동적으로 일치시키는 고급 라벨 할당 전략인 SimOTA를 사용하여 혼잡한 장면에서 모델의 견고성을 향상시킵니다.

앵커 프리 대 앵커 기반

기존의 YOLO 모델( YOLO 이전)은 미리 정의된 '앵커 박스'를 사용해 객체 치수를 예측했습니다. YOLOX의 앵커 프리 방식은 픽셀 위치에서 직접 경계 상자를 예측하여 하이퍼파라미터의 수를 줄이고 모델을 다양한 데이터 세트에 더 일반화할 수 있게 합니다.

사용 사례 및 제한 사항

YOLOX는 광범위한 하이퍼파라미터 튜닝 없이 다양한 하드웨어 플랫폼에 걸쳐 모델 배포를 간소화해야 하는 시나리오에서 탁월한 성능을 발휘합니다. 경량 버전(나노/소형)은 모바일 애플리케이션에 널리 사용됩니다. 그러나 더 큰 규모에서의 최고 성능은 YOLOv7 같은 최신 아키텍처와 YOLO11와 같은 더 복잡한 피처 집계 네트워크를 활용하는 최신 아키텍처가 최고 성능을 능가합니다.

YOLOX에 대해 자세히 알아보세요

YOLOv7: "공짜 가방" 강자

YOLOX 이후 1년 만에 출시된 YOLOv7 "훈련 가능한 공짜 가방"을 통해 추론 결과를 향상시키기 위해 훈련 프로세스를 최적화하는 것을 목표로 하는 일련의 아키텍처 개혁을 도입했습니다.

아키텍처 및 주요 혁신

YOLOv7 핵심은 확장된 효율적인 계층 집계 네트워크(E-ELAN)입니다. 이 아키텍처는 네트워크가 최단 및 최장 경사 경로를 제어하여 더욱 다양한 특징을 학습할 수 있게 함으로써 매우 심층적인 네트워크에 대한 효과적인 수렴을 보장합니다. 또한, YOLOv7 연결 기반 모델을 위해 특별히 설계된 모델 확장 기술을 활용하여 모델 깊이와 폭을 증가시켜도 성능 저하 없이 선형적으로 성능이 향상되도록 보장합니다.

또한 YOLOv7 훈련 중에 보조 헤드를 효과적으로 사용하여 배포 중에 계산 비용을 추가하지 않고도 주 감지 헤드의 정확도를 향상시키는 기술인 거친 감독에서 세밀한 감독을 제공합니다.

사용 사례 및 제한 사항

탁월한 속도 대 정확도 비율을 자랑하는 YOLOv7 밀리초 단위가 중요한 실시간 비디오 분석 및 엣지 컴퓨팅 작업에서 최고의 경쟁자입니다. 이 제품은 표준 GPU 하드웨어(예: V100 및 T4)에서 가능한 작업의 한계를 뛰어넘었습니다. 하지만 아키텍처의 복잡성으로 인해 표준 객체 감지 이외의 맞춤형 작업을 위해 수정하거나 미세 조정하기가 어려울 수 있습니다.

YOLOv7 대해 자세히 알아보기

Ultralytics 이점: 왜 현대화해야 할까요?

YOLOX와 YOLOv7 여전히 유능한 도구이지만, 컴퓨터 비전 분야는 빠르게 변화하고 있습니다. 현대의 개발자와 연구자들은 점점 더 다음과 같은 모델을 갖춘 Ultralytics 에코시스템을 선호하고 있습니다. YOLO11YOLOv8 의 포괄적인 지원, 통합된 디자인, 사용 편의성으로 인해 점점 더 많은 개발자와 연구자들이 울트라틱스 에코시스템을 선호하고 있습니다.

간소화된 개발자 환경

구형 모델의 가장 큰 장애물 중 하나는 코드베이스의 파편화입니다. Ultralytics 모든 모델 버전에서 일관되게 작동하는 통합 Python API와 CLI 제공함으로써 이 문제를 해결합니다. 코드 한 줄로 감지, 세분화 또는 분류 간에 전환할 수 있습니다.

from ultralytics import YOLO

# Load a model (YOLO11 or YOLOv8)
model = YOLO("yolo11n.pt")  # or "yolov8n.pt"

# Run inference on an image
results = model("path/to/image.jpg")

# Export to ONNX for deployment
model.export(format="onnx")

Ultralytics 애널리틱스 모델의 주요 이점

  • 다목적성: 주로 탐지에 초점을 맞춘 YOLOX 및 YOLOv7 달리, Ultralytics 모델은 인스턴스 세분화, 포즈 추정, 분류OBB(지향 객체 탐지)를 즉시 지원합니다.
  • 잘 관리된 에코시스템: 잦은 업데이트를 통해 최신 버전의 PyTorch, CUDA 및 Python 호환성을 보장합니다. 활발한 커뮤니티와 상세한 설명서를 통해 환경 문제를 디버깅하는 데 소요되는 시간을 줄일 수 있습니다.
  • 성능 균형: YOLO11 같은 모델은 최신의 최첨단 모델로, YOLOX와 YOLOv7 뛰어난 정확도와 짧은 지연 시간을 제공합니다. 엣지 디바이스에서 클라우드 서버에 이르기까지 다양한 하드웨어에서 실시간 추론에 최적화되어 있습니다.
  • 트레이닝 효율성: Ultralytics 모델은 더 빠르게 수렴하도록 설계되어 귀중한 GPU 시간을 절약할 수 있습니다. 사전 학습된 가중치를 다양한 작업에 쉽게 사용할 수 있으므로 전이 학습이 간단합니다.
  • 메모리 요구 사항: 이 모델은 효율성을 위해 설계되어 일반적으로 트랜스포머 기반 대안(예: RT-DETR)에 비해 훈련 및 추론 중에 더 적은 VRAM을 필요로 하므로 일반 소비자급 하드웨어에서 사용할 수 있습니다.

YOLO11에 대해 자세히 알아보세요

결론

YOLOX와 YOLOv7 모두 컴퓨터 비전의 역사에서 중요한 위치를 차지하고 있습니다. YOLOX는 앵커 없는 접근 방식을 대중화하여 소형 장치에서 쉽게 이해하고 배포할 수 있는 간소화된 파이프라인을 제공합니다. YOLOv7 은 성능의 한계를 뛰어넘어 효율적인 아키텍처 설계로 속도와 정확도를 크게 향상시킬 수 있다는 것을 증명했습니다.

하지만 오늘날 프로덕션급 AI 시스템을 구축하는 경우, 권장 사항은 Ultralytics YOLO 제품군에 집중되어 있습니다. 와 YOLO11를 사용하면 MLOps의 복잡성을 처리하는 다목적의 강력하고 사용자 친화적인 플랫폼에 액세스할 수 있으므로 실제 문제 해결에 집중할 수 있습니다.

다른 비교 살펴보기

모델 선택에 더 많은 정보를 얻으려면 다음과 같은 관련 비교를 살펴보세요:


댓글