Link to this sectionYOLOX против YOLOv6-3.0#
Эволюция computer vision во многом определялась стремительным развитием серии YOLO. Выбор правильной архитектуры для развертывания часто сводится к поиску баланса между «сырой» пропускной способностью, простотой архитектуры и эффективностью обучения. Двумя важными вехами на этом пути стали акцент на исследованиях без использования анкоров в YOLOX и высокооптимизированная промышленная пропускная способность YOLOv6-3.0.
В этом техническом сравнении мы разберем архитектурные различия, показатели производительности и идеальные сценарии использования, а также представим возможности нового поколения Ultralytics YOLO26 для разработчиков, которым нужно лучшее решение для развертывания на граничных устройствах и в облаке.
Link to this sectionYOLOX: объединяя научные исследования и индустрию#
Разработанная исследователями Megvii, модель YOLOX была представлена как серьезный шаг в сторону упрощения архитектуры YOLO за счет полного отказа от анкоров (anchor-free).
- Авторы: Чжэн Гэ, Сунтао Лю, Фэн Ван, Земин Ли, Цзянь Сунь
- Организация: Megvii
- Дата: 2021-07-18
- Arxiv: 2107.08430
- GitHub: Megvii-BaseDetection/YOLOX
Link to this sectionАрхитектурные особенности#
YOLOX успешно внедрила концепцию без анкоров в семейство YOLO. Исключив использование предопределенных anchor boxes, модель значительно сокращает количество параметров проектирования и эвристической настройки, необходимых при обучении. Это делает YOLOX высокоадаптивной к различным пользовательским наборам данных без ручного пересчета анкоров.
Кроме того, YOLOX представила архитектуру с разделенной «головой» (decoupled head). Разделив задачи классификации и регрессии на разные ветви, модель решает внутренний конфликт между определением того, что это за объект, и где он находится. В сочетании со стратегией назначения меток SimOTA, YOLOX достигает более быстрой сходимости и улучшенной mean average precision (mAP).
Детекторы без анкоров, такие как YOLOX, часто лучше работают с пользовательскими наборами данных с необычными соотношениями сторон объектов, так как они не полагаются на фиксированные априорные ограничивающие рамки, которые могут не подходить для новых данных.
Link to this sectionYOLOv6-3.0: промышленный тяжеловес#
Разработанная отделом Vision AI компании Meituan, модель YOLOv6-3.0 бескомпромиссно спроектирована для обеспечения максимальной промышленной пропускной способности, особенно на графических процессорах NVIDIA с использованием аппаратных ускорителей, таких как TensorRT.
- Авторы: Chuyi Li, Lulu Li, Yifei Geng и др.
- Организация: Meituan
- Дата: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
Link to this sectionОптимизация для развертывания#
YOLOv6-3.0 фокусируется на максимальном использовании GPU. Она внедряет модуль двунаправленной конкатенации (BiC) в шее сети (neck) для улучшения слияния признаков при сохранении высокой скорости вывода. Хотя фаза вывода полностью свободна от анкоров, YOLOv6-3.0 использует инновационную стратегию обучения с поддержкой анкоров (AAT), чтобы воспользоваться стабильностью анкоров на этапе обучения.
Бэкбон построен с использованием дружественной к аппаратному обеспечению архитектуры EfficientRep, намеренно разработанной для минимизации затрат на доступ к памяти и максимизации вычислительной плотности на современных ускорителях. Это делает YOLOv6 исключительно сильным кандидатом для серверной видеоаналитики.
Link to this sectionСравнение производительности#
Сравнивая эти модели, разработчикам приходится сопоставлять «сырую» точность со скоростью вывода и количеством параметров. В следующей таблице показана производительность обоих семейств моделей при различных размерах.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Хотя YOLOv6-3.0 демонстрирует превосходный mAP и отличную скорость TensorRT для более крупных вариантов, YOLOX остается весьма конкурентоспособной благодаря своей простоте и надежной работе на устаревшем оборудовании.
Link to this sectionСценарии использования и рекомендации#
Выбор между YOLOX и YOLOv6 зависит от твоих конкретных требований к проекту, ограничений при развертывании и предпочтений в экосистеме.
Link to this sectionКогда выбирать YOLOX#
YOLOX — сильный выбор для:
- Исследований безъякорного обнаружения: академических исследований, использующих чистую безъякорную архитектуру YOLOX как базу для экспериментов с новыми головами детекции или функциями потерь.
- Сверхлегких Edge-устройств: развертывания на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый вес варианта YOLOX-Nano (0.91 млн параметров).
- Изучения назначения меток SimOTA: исследовательских проектов, анализирующих стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.
Link to this sectionКогда выбирать YOLOv6#
YOLOv6 рекомендуется для:
- Промышленного внедрения с учетом оборудования: сценарии, где аппаратная ориентированность модели и эффективная репараметризация обеспечивают оптимизированную производительность на конкретном целевом оборудовании.
- Быстрого одноэтапного обнаружения: приложения, где приоритетом является чистая скорость вывода на GPU для обработки видео в реальном времени в контролируемых условиях.
- Интеграции в экосистему Meituan: команды, которые уже работают в рамках технологического стека и инфраструктуры развертывания Meituan.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionПреимущество Ultralytics#
Хотя и Megvii, и Meituan предоставляют мощные исследовательские репозитории, развертывание этих моделей в продакшене часто требует значительных инженерных усилий. Интегрированная Ultralytics ecosystem устраняет эти препятствия, предлагая унифицированный API с обширной документацией.
Используя пакет Ultralytics, ты получаешь доступ к непревзойденному пользовательскому опыту. Это включает встроенную auto-augmentation, высокоэффективное управление памятью во время обучения (значительно снижающее требования к VRAM по сравнению с архитектурами Transformer, такими как RTDETR) и простые конвейеры экспорта в такие форматы, как ONNX и OpenVINO.
В отличие от специализированных моделей, архитектуры Ultralytics по своей сути универсальны и «из коробки» поддерживают Object Detection, Instance Segmentation, Pose Estimation, классификацию изображений и Oriented Bounding Boxes (OBB).
Link to this sectionПредставляем YOLO26: идеальное решение для граничных вычислений (Edge)#
Командам, начинающим новые проекты в области компьютерного зрения, мы настоятельно рекомендуем обновиться до недавно выпущенной Ultralytics YOLO26. Опираясь на успехи YOLO11 и YOLOv8, YOLO26 привносит кардинальные инновации:
- End-to-End NMS-Free Design: First explored in YOLOv10, YOLO26 natively eliminates the need for Non-Maximum Suppression (NMS) post-processing. This guarantees deterministic, ultra-low latency inference critical for real-time robotics.
- Оптимизатор MuSGD: Вдохновленный методами обучения LLM, такими как Kimi K2 от Moonshot AI, YOLO26 использует оптимизатор MuSGD (гибрид SGD и Muon) для достижения невероятно стабильной динамики обучения и более быстрой сходимости.
- Up to 43% Faster CPU Inference: By removing Distribution Focal Loss (DFL) and streamlining the network head, YOLO26 is heavily optimized for edge devices relying on CPU execution, drastically outperforming YOLOv6 in edge scenarios.
- ProgLoss + STAL: Эти передовые формулы потерь обеспечивают значительные улучшения в small object detection, что делает YOLO26 идеальной для анализа аэрофотоснимков и микроскопического контроля дефектов.
Link to this sectionПример унифицированного обучения#
Используя Python API от Ultralytics, обучение современных моделей требует всего несколько строк кода. Тот же чистый интерфейс применяется, тестируешь ли ты устаревшую модель YOLO или разворачиваешь передовой фреймворк YOLO26.
from ultralytics import YOLO
# Load the next-generation YOLO26 model (NMS-free, optimized for edge)
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset
# The ecosystem handles downloading, caching, and auto-batching natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model and print mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")
# Export the model for edge deployment
model.export(format="onnx")Для еще более удобного взаимодействия управляй своими данными, отслеживай эксперименты и обучай модели в облаке, используя платформу Ultralytics Platform, не требующую написания кода.
Link to this sectionРекомендации по сценариям использования#
При выборе между этими архитектурами учитывай свои конкретные аппаратные ограничения и требования проекта:
- Выбирай YOLOX, если ты проводишь академические исследования стратегий назначения меток или тебе нужна чистая, понятная базовая архитектура без анкоров для внесения собственных модификаций.
- Выбирай YOLOv6-3.0, если ты разворачиваешь решение на промышленной серверной стойке с мощными GPU NVIDIA (например, A100 или T4), где ты можешь использовать большие размеры пакетов (batch size) и оптимизации TensorRT для одновременной обработки сотен видеопотоков.
- Choose YOLO26 for the vast majority of modern applications. If you are building Edge AI applications for IoT devices, drones, or mobile phones, YOLO26's native NMS-free design, CPU optimizations, and comprehensive ecosystem support make it the undisputed best choice for bridging the gap between training and production.