Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 против YOLOv6-3.0#

Область компьютерного зрения постоянно развивается, и новые модели обнаружения объектов непрерывно расширяют границы скорости и точности. Двумя важными вехами на этом пути стали YOLOv7 и YOLOv6-3.0. Обе модели представили уникальные архитектурные инновации, разработанные для максимизации пропускной способности и точности в реальных задачах. Эта страница содержит подробный технический анализ обеих архитектур, сравнивая их производительность, методологии обучения и оптимальные сценарии использования, чтобы помочь тебе принять обоснованное решение для твоего следующего проекта в области искусственного интеллекта.

Link to this sectionYOLOv7: Пионер «наборов бесплатных улучшений»#

Выпущенная в середине 2022 года, YOLOv7 представила несколько инновационных стратегий для оптимизации архитектуры сети без увеличения стоимости логического вывода. Она была в значительной степени сосредоточена на обучаемых "bag-of-freebies" для повышения точности при сохранении производительности в реальном времени.

Link to this sectionОсновные особенности архитектуры#

YOLOv7 характеризуется своей сетью агрегации эффективных слоев Extended Efficient Layer Aggregation Network (E-ELAN). Эта архитектура позволяет модели изучать более разнообразные признаки, контролируя кратчайший и длиннейший градиентные пути. Кроме того, YOLOv7 использует методы структурной репараметризации во время логического вывода для объединения сверточных слоев, эффективно сокращая количество параметров и время вычислений без ущерба для изученных представлений.

Модель также имеет уникальную стратегию обучения со вспомогательной головой. Используя «ведущую голову» для окончательных прогнозов и «вспомогательную голову» для управления обучением в средних слоях, YOLOv7 достигает лучшей сходимости и более глубокого извлечения признаков, что особенно полезно при решении сложных задач обнаружения объектов.

Узнай больше о YOLOv7

Link to this sectionYOLOv6-3.0: промышленная пропускная способность#

Разработанная отделом Meituan Vision AI, YOLOv6-3.0 была явно спроектирована как «детектор объектов следующего поколения для промышленных приложений». Выпущенная в начале 2023 года, она в значительной степени сосредоточена на максимизации использования оборудования, особенно графических процессоров NVIDIA.

Link to this sectionОсновные особенности архитектуры#

YOLOv6-3.0 использует магистральную архитектуру EfficientRep, которая высоко оптимизирована для параллельной обработки на GPU. Это делает её невероятно эффективной для крупномасштабной пакетной обработки. Версия 3.0 представила модуль двунаправленной конкатенации (BiC) в шейке для улучшения слияния признаков на разных масштабах, что повышает способность модели обнаруживать объекты различных размеров.

Кроме того, YOLOv6-3.0 использует стратегию обучения с поддержкой якорей (Anchor-Aided Training, AAT). Этот инновационный подход сочетает преимущества обучения на основе якорей с логическим выводом без них, позволяя модели наслаждаться стабильностью якорей во время фазы обучения, сохраняя при этом скорость и простоту дизайна без якорей во время развертывания.

Узнай больше о YOLOv6

Link to this sectionСравнение производительности#

При оценке моделей для продакшена критически важно сбалансировать точность (mAP) со скоростью логического вывода и вычислительными затратами (FLOPs). Ниже представлено подробное сравнение стандартных вариантов обеих моделей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
Аппаратные соображения

YOLOv6-3.0 исключительно хорошо подходит для высокопроизводительных сред GPU (таких как TensorRT), в то время как YOLOv7 обеспечивает надежный баланс для систем, где приоритетом является сохранение признаков.

Link to this sectionПреимущество Ultralytics#

Хотя автономные репозитории для YOLOv7 и YOLOv6-3.0 мощны сами по себе, их использование в рамках экосистемы Ultralytics преображает опыт разработчика. Python-пакет ultralytics стандартизирует эти разнообразные архитектуры в рамках одного интуитивно понятного фреймворка.

  • Простота использования: Прошли те времена, когда требовались сложные скрипты настройки. API Ultralytics позволяет тебе загружать, обучать и развертывать модели YOLOv7 или YOLOv6 с минимальным количеством шаблонного кода. Ты можешь легко переключаться между архитектурами, просто меняя файл весов модели.
  • Хорошо поддерживаемая экосистема: Ultralytics предоставляет надежную среду с частыми обновлениями, обеспечивая нативную совместимость с последними дистрибутивами PyTorch и версиями CUDA.
  • Эффективность обучения: Конвейеры обучения глубоко оптимизированы для эффективного использования ресурсов GPU. Кроме того, модели Ultralytics YOLO обычно имеют более низкие требования к памяти во время обучения по сравнению с тяжелыми моделями на основе трансформеров (такими как RT-DETR), что позволяет использовать большие размеры пакетов на потребительском оборудовании.
  • Универсальность: Помимо стандартного обнаружения ограничивающих рамок, фреймворк Ultralytics легко поддерживает передовые задачи, такие как оценка позы и сегментация экземпляров, для совместимых семейств моделей — функция, которой часто не хватает в изолированных исследовательских репозиториях.

Link to this sectionПример кода: обучение и инференс#

Интеграция этих моделей в твой конвейер Python проста. Убедись, что твой набор данных отформатирован правильно (например, стандартный COCO), и выполни следующее:

from ultralytics import YOLO

# Load a pretrained YOLOv7 model (or 'yolov6n.pt' for YOLOv6)
model = YOLO("yolov7.pt")

# Train the model with built-in hyperparameter management
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image URL or local path
predictions = model("https://ultralytics.com/images/bus.jpg")

# Visualize the detection results
predictions[0].show()

Link to this sectionИдеальные варианты использования#

Link to this sectionКогда выбирать YOLOv7#

YOLOv7 превосходит других в сценариях, требующих высокой точности и плотного извлечения признаков.

  • Сложное наблюдение: Способность сохранять мелкозернистые детали делает её подходящей для мониторинга людных мест или обнаружения небольших аномалий в инфраструктуре умных городов.
  • Академическое бенчмаркирование: Часто используется в качестве сильного базового уровня в исследованиях благодаря своей всеобъемлющей философии дизайна «bag-of-freebies».

Link to this sectionКогда выбирать YOLOv6-3.0#

YOLOv6-3.0 — это рабочая лошадка для высокообъемных конвейеров с ускорением на GPU.

  • Промышленная автоматизация: Идеально подходит для заводских линий и обнаружения производственных дефектов, где графические процессоры серверного класса обрабатывают несколько видеопотоков одновременно.
  • Высокопроизводительная аналитика: Отлично подходит для обработки офлайн-видеоархивов, где основной целью является максимизация кадров в секунду.

Link to this sectionБудущее: YOLO26#

Хотя YOLOv7 и YOLOv6-3.0 очень функциональны, быстрый темп инноваций в области искусственного интеллекта требует еще большей эффективности. Выпущенная в январе 2026 года, Ultralytics YOLO26 представляет собой поколенческий скачок в компьютерном зрении, систематически устраняющий ограничения старых архитектур.

Если ты начинаешь новый проект, YOLO26 настоятельно рекомендуется по сравнению с предыдущими поколениями. Она внедряет несколько новаторских функций:

  • Сквозной дизайн без NMS: Основываясь на фундаментах, заложенных YOLOv10, YOLO26 нативно исключает немаксимальное подавление (NMS). Это снижает накладные расходы на постобработку, упрощая развертывание в мобильных приложениях и обеспечивая высокодетерминированный логический вывод с низкой задержкой.
  • Оптимизатор MuSGD: Вдохновленная передовыми методами обучения LLM (такими как те, что используются в Kimi K2 от Moonshot AI), YOLO26 использует гибридный оптимизатор, сочетающий SGD и Muon. Это гарантирует более стабильную динамику обучения и значительно более быструю сходимость.
  • До 43% более быстрый вывод на CPU: Стратегически удалив Distribution Focal Loss (DFL), YOLO26 достигает значительного ускорения на процессорах. Это делает её бесспорным чемпионом для периферийных сред, таких как Raspberry Pi и удаленные IoT-датчики.
  • ProgLoss + STAL: Передовые функции потерь, специально разработанные для улучшения распознавания мелких объектов, что было исторической слабостью одностадийных детекторов.

Объединяя эти инновации с мощной платформой Ultralytics, YOLO26 предлагает непревзойденную производительность, универсальность и простоту развертывания для современного инженера по машинному обучению.

Контрибьюторы

Комментарии