콘텐츠로 건너뛰기

YOLOv5 YOLOX: 포괄적인 기술 비교

실시간 컴퓨터 비전의 진화 과정에는 수많은 이정표가 있었으며, 다양한 아키텍처가 속도와 정확성의 한계를 넓혀왔습니다. 이 분야에서 매우 영향력 있는 두 모델은 YOLOv5YOLOX입니다. 둘 다 객체 탐지에서 뛰어난 성능으로 유명하지만, 근본적으로 다른 아키텍처 접근법을 취합니다.

이 가이드는 두 모델의 아키텍처, 성능 지표, 훈련 방법론 및 이상적인 배포 시나리오를 비교 분석하여 개발자와 연구자가 비전 AI 프로젝트에 적합한 도구를 선택할 수 있도록 심층적인 기술 분석을 제공합니다.

모델 개요 및 아키텍처 차이점

Ultralytics YOLOv5

Ultralytics에서 소개한, YOLOv5 뛰어난 성능, 사용 편의성, 메모리 효율성의 탁월한 균형 덕분에 빠르게 업계 표준이 되었습니다. PyTorch 프레임워크에 기반하여 앵커 기반 아키텍처를 YOLOv5 . 미리 정의된 바운딩 박스 형태를 활용해 객체 위치를 예측하므로 표준 객체 탐지 작업에 매우 효과적입니다.

YOLOv5 가장 큰 장점 중 하나는 잘 관리된 YOLOv5 . 방대한 문서, 놀라울 정도로 간단한 Python , 그리고 Ultralytics 플랫폼과의 원활한 통합을 자랑합니다. 이를 통해 개발자는 데이터셋 라벨링에서 훈련, 그리고 다음과 같은 형식으로의 내보내기에 이르기까지 원활하게 전환할 수 있습니다. ONNX , TensorRT과 같은 형식으로의 내보내기에 이르기까지 원활하게 전환할 수 있습니다.

5에 대해 자세히 알아보기

에코시스템 이점

Ultralytics YOLO 일반적으로 복잡한 트랜스포머 기반 대안들에 비해 훈련 중 훨씬 적은 GPU 필요로 합니다. 이러한 낮은 메모리 사용량은 소비자용 하드웨어로 작업하는 연구자들에게 YOLOv5 접근하기 쉽게 만듭니다.

메그비 YOLOX

메그비 연구진이 개발한 YOLOX는 앵커 박스 없는 설계를 도입함으로써 YOLO 새로운 방향을 제시했습니다. 앵커 박스를 제거함으로써 YOLOX는 탐지 헤드를 단순화하고, 훈련 과정에서 수동 조정이 필요한 휴리스틱 매개변수의 수를 크게 줄였습니다.

YOLOX는 또한 분리된 헤드를 통합하여 분류 및 회귀 작업을 서로 다른 네트워크 분기로 분리하고 SimOTA 레이블 할당 전략을 활용합니다. 이러한 혁신은 학술 연구와 산업적 응용 간의 격차를 해소하여, YOLOX가 특히 객체 규모가 매우 다양한 환경에서 효과적입니다.

YOLOX에 대해 자세히 알아보세요

성과 및 지표

컴퓨터 비전 모델을 평가할 때 평균 정밀도(mAP)와 추론 속도 간의 균형은 매우 중요합니다. 두 모델 모두 다양한 하드웨어 제약 조건에 맞출 수 있도록 다양한 크기(나노부터 엑스트라 라지까지)를 제공합니다.

모델크기
(픽셀)
mAPval
50-95
속도
CPU ONNX
(ms)
속도
T4 TensorRT10
(ms)
파라미터
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

YOLOXx가 약간 더 높은 정점 정확도(51.1 mAP)를 달성하는 반면, YOLOv5 CPU GPU 전반에 걸쳐 훨씬 더 견고하고 철저히 검증된 배포 파이프라인을 YOLOv5 . YOLOv5 TensorRT 엣지 컴퓨팅 장치에 대한 심층 최적화를 YOLOv5 , 이를 실시간 영상 분석을 위한 매우 신뢰할 수 있는 선택지로 만듭니다.

학습 방법론 및 사용성

이 두 아키텍처 간 개발자 경험은 상당히 다릅니다.

YOLOX 접근법

YOLOX 훈련에는 일반적으로 원본 저장소 복제, 특정 종속성 관리, 복잡한 명령줄 스크립트 실행이 필요합니다. 혼합 정밀도 훈련 및 MegEngine을 통한 다중 노드 설정과 같은 고급 기능을 지원하지만, 신속한 프로토타이핑이 필요한 개발자에게는 학습 곡선이 가파를 수 있습니다.

Ultralytics 이점

반면, Ultralytics 매우 간소화된 사용자 경험을 최우선으로 Ultralytics . ultralytics Python 통해 개발자는 최소한의 보일러플레이트 코드로 모델을 로드, 훈련 및 검증할 수 있습니다. Ultralytics 복잡한 데이터 증강, 하이퍼파라미터 진화 및 학습률 스케줄링을 Ultralytics 처리합니다.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

또한 YOLOv5 다용도성은 표준 객체 탐지를 넘어, 동일한 통합 API 내에서 이미지 분류인스턴스 분할에 대한 강력한 지원을 제공합니다.

간소화된 배포

훈련이 완료되면 YOLOv5 CoreML, TFLite 또는 OpenVINO 내보내는 것은 실행하는 것만큼 OpenVINO . model.export(format="onnx")이로 인해 연구 중심 저장소에서 흔히 요구되는 제3자 변환 스크립트가 필요 없어집니다.

실제 응용 분야

이러한 모델 중 선택하는 것은 배포 환경과 기술적 요구 사항에 따라 달라집니다:

  • 소매 및 재고 관리: NVIDIA 과 같은 에지 디바이스에서 실시간 제품 인식이 필요한 애플리케이션을 위해, YOLOv5 는 특히 적합합니다. 최소한의 메모리 사용량과 빠른 TensorRT 속도로 프레임 드롭 없이 다중 카메라 추적이 가능합니다.
  • 학술 연구 및 맞춤형 아키텍처:YOLOX는 연구계에서 높은 평가를 받고 있습니다. 분리된 헤드와 앵커 없는 특성 덕분에, 새로운 레이블 할당 전략을 실험하려는 엔지니어나 기존 앵커 박스가 일반화되지 않는 데이터셋을 다루는 연구자들에게 탁월한 기준 모델이 됩니다.
  • 농업용 인공지능: 드론을 통한 과일 탐지나 잡초 식별과 같은 정밀 농업 작업에 있어, Ultralytics 활용한 YOLOv5 손쉬운 훈련 및 배포는 해당 분야 전문가들이 심층적인 머신러닝 엔지니어링 배경 없이도 인공지능 솔루션을 구현할 수 있게 합니다.

사용 사례 및 권장 사항

YOLOv5 YOLOX 중 선택은 특정 프로젝트 요구사항, 배포 제약 조건 및 생태계 선호도에 따라 달라집니다.

5 선택해야 할 때

YOLOv5 다음과 같은 경우에 강력한 YOLOv5 :

  • 검증된 생산 시스템: YOLOv5 오랜 안정성 track , 방대한 문서화, 그리고 대규모 커뮤니티 지원이 가치 있게 여겨지는 기존 배포 환경.
  • 자원 제약 훈련: GPU 제한된 환경에서 YOLOv5 효율적인 훈련 파이프라인과 낮은 메모리 요구사항이 유리합니다.
  • 다양한 내보내기 형식 지원: ONNX, TensorRT, CoreML, 그리고 TFLite.

욜록스를 선택해야 할 때

YOLOX는 다음에 권장됩니다:

  • 앵커 프리 탐지 연구: 새로운 탐지 헤드나 손실 함수를 실험하기 위한 기준으로 YOLOX의 깔끔한 앵커 프리 아키텍처를 활용한 학술 연구.
  • 초경량 에지 디바이스: 마이크로컨트롤러 또는 레거시 모바일 하드웨어에 배포할 때 YOLOX-Nano 변형의 극히 작은 메모리 사용량(0.91M 매개변수)이 핵심적인 요소입니다.
  • SimOTA 라벨 할당 연구: 최적 수송 기반 라벨 할당 전략과 훈련 수렴에 미치는 영향을 조사하는 연구 프로젝트들.

Ultralytics YOLO26)를 선택해야 할 때

대부분의 신규 프로젝트에 대해 Ultralytics 성능과 개발자 경험의 최적 조합을 제공합니다:

  • NMS 에지 배포: 복잡한 비최대 억제(NMS) 후처리 없이도 일관되고 낮은 지연 시간의 추론이 필요한 애플리케이션.
  • CPU 전용 환경: 전용 GPU 없는 장치에서, YOLO26의 최대 43% 빠른 CPU 성능이 결정적인 이점을 제공합니다.
  • 소형 물체 탐지: 항공 드론 영상이나 IoT 센서 분석과 같은 까다로운 시나리오에서 ProgLoss와 STAL이 미세한 물체의 정확도를 크게 향상시킵니다.

비전 AI의 미래: YOLO26의 등장

YOLOv5 YOLOX 모두 컴퓨터 비전 역사에서 확고한 위치를 차지했지만, 해당 분야는 빠르게 발전하고 있습니다. 오늘날 새로운 프로젝트를 시작하는 개발자들에게 Ultralytics 자사의 최신 주력 모델인 YOLO26을 Ultralytics 검토할 것을 권장합니다.

2026년 1월 출시된 YOLO26은 성능과 사용성 모두에서 획기적인 발전을 이루었습니다. 획기적인 엔드투엔드 NMSNon-Maximum Suppression) 프리 설계를 도입하여 비최대 억제 후처리 과정을 완전히 제거했습니다. 이를 통해 지연 시간 변동성을 크게 줄이고 저전력 기기에서의 배포 로직을 단순화했습니다.

또한 YOLO26은 LLM 훈련 혁신에서 영감을 받은 SGD Muon)의 하이브리드인 새로운 MuSGD 최적화기를활용하여 놀라울 정도로 안정적이고 빠른 수렴을 달성합니다. DFL 제거 (간소화된 내보내기와 향상된 에지/저전력 장치 호환성을 위해 Distribution Focal Loss 제거)를 통해 YOLO26은 최대 43% 더 빠른 CPU 달성하여 현대적인 에지 컴퓨팅, 로봇 공학 및 IoT 애플리케이션을 위한 궁극적인 모델로서의 입지를 공고히 합니다. 또한 ProgLoss + STAL은 IoT, 로봇 공학 및 항공 이미지에 중요한 소형 물체 인식에서 주목할 만한 개선을 가져온 향상된 손실 함수를 제공합니다. 이전 세대에 관심이 있는 사용자는 다음을 살펴볼 수도 있습니다. YOLO11을 살펴볼 수 있으나, YOLO26이 확실한 최첨단 선택지임은 부인할 수 없습니다.

결론

YOLOv5 YOLOX는 모두 놀라운 물체 탐지 능력을 제공합니다. YOLOX는 2021년 앵커 프리 설계가 기존 방법을 능가할 수 있음을 입증하며 아키텍처의 한계를 뛰어넘었습니다. 그러나 YOLOv5 는 비교할 수 없는 사용 편의성, 광범위한 생태계, 그리고 훈련 중 낮은 메모리 요구 사항 덕분에 여전히 지배적인 위치를 유지하고 있습니다.

상업적 애플리케이션의 대다수에게 Ultralytics 원시 데이터셋에서 배포된 생산 모델까지 가장 빠른 경로를 제공합니다. 검증된 YOLOv5 최첨단 YOLO26으로 YOLOv5 개발자들은 비전 AI를 접근성 높고 효율적이며 고성능으로 구현하도록 설계된 프레임워크의 혜택을 누릴 수 있습니다.


댓글