콘텐츠로 건너뛰기

YOLOX 대 YOLOv5: 심층적 아키텍처 및 성능 비교

적절한 객체 탐지 모델 선택은 컴퓨터 비전 프로젝트의 성공을 좌우하는 중대한 결정입니다. 본 가이드는 AI 분야에서 핵심적인 두 모델, 메그비(Megvii)의 YOLOX와 Ultralytics YOLOv5의 포괄적인 기술적 비교를 제공합니다. 두 모델의 아키텍처, 성능 지표, 훈련 생태계를 분석함으로써 개발자와 연구자들이 특정 배포 환경에 적합한 선택을 할 수 있도록 돕고자 합니다.

모델 소개

두 모델 모두 실시간 객체 탐지 기술이 급속히 발전하던 시기에 등장했으나, 성능을 달성하기 위해 서로 다른 아키텍처 철학을 채택했다.

YOLOX: 앵커 프리 접근 방식

메그비(Megvii) 의 연구원 정거(Zheng Ge), 송타오 리우(Songtao Liu), 펑 왕(Feng Wang), 자밍 리(Zeming Li), 지안 쑨(Jian Sun)이 2021년 7월 18일 발표한 YOLOX는 기존 앵커 박스(anchor box)에서 벗어남으로써 중대한 변화를 가져왔다. 아카이브 기술 보고서에 기록된 바와 같이, YOLOX는 앵커 프리 설계와 분리형 헤드, SimOTA 라벨 할당 전략을 통합했습니다. 이 설계는 학술 연구와 산업적 적용 간의 격차를 해소하는 것을 목표로 하며, 표준 데이터셋에서 강력한 성능을 제공합니다.

YOLOX에 대해 자세히 알아보세요

YOLOv5: 생산용 비전 AI의 표준

글렌 조커(Glenn Jocher)가 저술하고 Ultralytics 가 2020년 6월 Ultralytics 공개한 YOLOv5 배포된 컴퓨터 비전 분야의 업계 표준으로 YOLOv5 자리매김했습니다. PyTorch 네이티브로 구축된 이 모델은 비교할 수 없는 사용 편의성, 탁월한 훈련 속도, 그리고 정교하게 다듬어진 저장소를 제공함으로써 최첨단 AI를 대중화했습니다. YOLOv5 아키텍처는 속도, 정확도, 배포 용이성의 완벽한 균형에 초점을 맞춰, 에지 디바이스부터 대규모 클라우드 배포에 이르기까지 모든 분야에서 선호되는 솔루션이 되었습니다.

5에 대해 자세히 알아보기

아키텍처의 차이점

이러한 네트워크 간의 핵심적인 기계적 차이점을 이해하면 다양한 작업에서 서로 다른 성능을 보이는 이유를 명확히 알 수 있다.

앵커 프리 대 앵커 기반

가장 두드러진 차이점은 YOLOX의 앵커 프리 메커니즘입니다. YOLOv5 같은 기존 모델은 경계 상자를 예측하기 위해 미리 정의된 앵커 박스에 YOLOv5 , 이는 최적의 앵커 크기를 결정하기 위해 훈련 데이터셋에 대한 클러스터링 분석을 필요로 합니다. YOLOX는 이를 제거하고 각 공간 위치에서 경계 상자 좌표를 직접 예측합니다. 앵커 프리 접근법은 설계 매개변수와 경험적 조정의 수를 줄이지만, YOLOv5 정교한 앵커 기반 접근법은 자동 앵커 기능의 도움으로 즉시 사용 가능한 상태에서 놀라울 정도로 안정적이고 예측 가능한 훈련 수렴을 보장합니다.

분리형 헤드 대 결합형 헤드

YOLOX는 분리형 헤드를 채택하여 분류와 회귀 작업을 별개의 신경망 분기로 분리합니다. 저자들은 이 방식이 공간적 특징 학습과 의미적 특징 학습 간의 상충을 해결한다고 주장했습니다. 반면 YOLOv5 초기 버전에서 계산 효율을 극대화하고 추론 지연 시간을 줄이는 고도로 최적화된 결합형 헤드를 YOLOv5 , 이는 실시간 에지 컴퓨팅에 매우 중요합니다.

아키텍처 진화

YOLOX가 2021년 분리형 헤드를 선도한 반면, Ultralytics 모델들에서 분리형 아키텍처를 채택하고 완성도를 높였습니다. YOLOv8 과 최첨단 YOLO26과 같은 후속 모델에서 분리형 아키텍처를 채택하고 완성하여 두 가지 장점을 결합했습니다.

라벨 할당 전략

YOLOX는 라벨 할당에 SimOTA를 활용하며, 이는 지상 진실 객체와 예측 간의 매칭을 최적 수송 문제로 공식화합니다. 이러한 동적 할당은 복잡한 장면 처리 능력을 향상시킵니다. YOLOv5 강력한 형태 규칙 기반 할당 방식을 YOLOv5 고품질 양성 샘플이 손실 함수에 지속적으로 공급되도록 보장하며, 이는 전설적인 훈련 안정성에 기여합니다.

성능 및 벤치마크

속도와 정확도 사이의 절충은 이러한 아키텍처에 대한 궁극적인 시험이다. 아래 표는 표준 벤치마크에서 다양한 모델 크기의 성능을 보여준다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOX는 특히 대형 변형 모델에서 경쟁력 있는 mAP 달성하지만, YOLOv5 전반적으로 TensorRT 속도에서 탁월한 우위를 YOLOv5 . 예를 들어 YOLOv5s 모델은 뛰어난 속도 대비 정확도 비율을 제공하여, 매 밀리초가 중요한 실시간 애플리케이션에 매우 적합합니다.

Ultralytics : 교육 및 사용 편의성

연구에서 생산으로 전환할 때 모델을 둘러싼 생태계는 종종 모델 자체만큼 중요합니다. 여기서 Ultralytics 장점이 뚜렷이 드러납니다.

간소화된 사용자 경험

YOLOv5 "초보자도 쉽게 전문가처럼" 사용할 수 있는 개발자 경험으로 널리 인정받고 YOLOv5 . Python CLI 단 한 줄의 코드로 모델을 로드, 훈련 및 배포할 CLI . 반면 Megvii GitHub 저장소에서 YOLOX를 실행하려면 환경 변수를 수동으로 더 많이 설정해야 하며, 복잡한 Python 설정과 학술 연구 코드베이스에서 흔히 볼 수 있는 가파른 학습 곡선이 필요합니다.

훈련 효율성과 메모리 요구 사항

CUDA Ultralytics 훈련 중 메모리 사용량을 최소화하도록 세심하게 설계되었습니다. YOLOv5 RT-DETR 이나 최적화되지 않은 연구용 모델과 비교해 CUDA 메모리 사용량이 현저히 적습니다. 이를 통해 개발자는 소비자용 하드웨어에서도 더 큰 배치 크기로 훈련할 수 있어 반복적인 개발 주기를 가속화할 수 있습니다.

작업 전반에 걸친 다양한 활용성

YOLOX는 순수한 객체 탐지 프레임워크이지만, Ultralytics YOLOv5 발전시켜 다양한 비전 작업을 YOLOv5 . 기본적으로 동일한 API 구문을 사용하여 이미지 분류, 인스턴스 분할 및 객체 탐지를 수행할 수 있습니다.

지속적인 혁신

포즈 추정이나 방향성 바운딩 박스(OBB) 탐지와 같은 더욱 고급 작업이 필요한 경우, 최신 Ultralytics 아키텍처로 업그레이드할 것을 적극 권장합니다. 이 아키텍처는 최첨단 정확도로 이러한 모든 기능을 기본적으로 지원합니다.

코드 비교

사용성 차이는 코드를 통해 가장 잘 보여집니다.

YOLOv5 활용한 훈련:

from ultralytics import YOLO

# Load a pretrained YOLOv5s model
model = YOLO("yolov5su.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Display results
results[0].show()

YOLOX를 이용한 훈련:(수동 저장소 복제, setup.py 설치 및 복잡한 CLI 필요)

# Example YOLOX training command
python tools/train.py -f exps/default/yolox_s.py -d 1 -b 64 --fp16 -o

Ultralytics 마찰을 제거하여 구성 파일 디버깅 대신 데이터셋과 애플리케이션 로직에 집중할 수 있게 합니다. 또한 내장된 통합 기능을 통해 실험 추적이 원활하게 이루어집니다. Weights & BiasesComet 통합을 통해 실험 추적이 원활하게 이루어집니다.

이상적인 사용 사례와 실제 적용 사례

이러한 모델들 사이에서 선택하는 것은 프로젝트의 운영 환경에 달려 있습니다.

YOLOX가 뛰어난 점

YOLOX는 연구자들이 앵커 프리 패러다임이나 레이블 할당 전략을 명시적으로 연구하는 학술 환경에서 여전히 강력한 후보로 남아 있습니다. 또한 혼잡한 장면 탐지가 절대적인 주요 지표이고 가장 빠른 배포 속도는 부차적인 시나리오에서도 유용합니다.

YOLOv5 장점

YOLOv5 실용적 배포 분야에서 확실한 YOLOv5 .

  • 고속 제조: 조립 라인 결함 검출을 위해, YOLOv5 에지 GPU 상에서 최소한의 추론 지연 시간은 벨트 속도를 늦추지 않고 제품을 검사할 수 있도록 보장합니다.
  • 드론 및 항공 촬영: 효율적인 메모리 사용량 덕분에 드론에 탑재된 경량 보조 컴퓨터에서도 실행 가능하여 농업 모니터링 및 야생동물 추적 등의 작업에 활용됩니다.
  • 스마트 리테일: 자동화된 계산대에서 재고 관리에 이르기까지, YOLOv5 TensorRTONNX 로 손쉽게 내보내 수천 대의 매장 카메라에 대규모 배포할 수 있습니다.

미래를 내다보며: YOLO26의 장점

YOLOv5 전설적인 YOLOv5 , AI 분야는 빠르게 발전하고 YOLOv5 . 오늘 새로운 프로젝트를 시작하신다면, 최신 세대의 Ultralytics 검토하시길 강력히 권장합니다.

2026년 출시, Ultralytics 는 획기적인 발전을 이루었습니다. 엔드투엔드 NMS 프리(NMS-Free) 설계를 특징으로 하여, 비최대 억제(NMS) 후처리 과정이 완전히 불필요해져 배포 로직을 획기적으로 단순화했습니다. 분포 초점 손실(DFL)을 제거하고 최첨단 MuSGD 최적화기를 활용함으로써, YOLO26은 이전 세대 대비 최대 43% 빠른 CPU 달성하는 동시에, 특히 새로운 ProgLoss + STAL 손실 함수 덕분에 소형 물체에서 더 높은 정확도를 유지합니다.

YOLOv5 검증된 신뢰성을 선택하든 YOLOv5 YOLO26의 최첨단 성능을 YOLOv5 Ultralytics 컴퓨터 비전 솔루션을 개념 단계에서 생산 단계까지 원활하게 구현할 수 있는 최적의 도구를 제공합니다. AI 파이프라인의 잠재력을 최대한 발휘하려면 포괄적인 Ultralytics 꼭 살펴보시기 바랍니다.


댓글