Перейти к содержанию

YOLOv7 YOLO26: технологический прорыв в области обнаружения объектов

Ландшафт компьютерного зрения меняется с головокружительной скоростью. В 2022 году YOLOv7 установил новый стандарт скорости и точности, представив такие архитектурные инновации, как E-ELAN. Перенесемся в январь 2026 года, когда YOLO26 переопределил современный уровень развития благодаря сквозной архитектуре, CPU и стабильности обучения, заимствованной из больших языковых моделей (LLM).

В этом руководстве представлено техническое сравнение этих двух важных этапов в истории обнаружения объектов, что поможет разработчикам выбрать подходящий инструмент для современного внедрения.

Архитектурная эволюция

Переход от YOLOv7 YOLO26 представляет собой фундаментальное изменение в подходе к проектированию нейронных сетей с целью повышения их эффективности и удобства использования.

YOLOv7: Наследие E-ELAN

YOLOv7, выпущенный 6 июля 2022 года, был разработан Чень-Яо Ваном, Алексеем Бочковским и Хонг-Юанем Марком Ляо из Института информационных наук Академии Синика.

Ее основной инновацией стала расширенная сеть эффективной агрегации слоев (E-ELAN). Эта архитектура позволяет сети изучать более разнообразные особенности, контролируя самые короткие и самые длинные пути градиента. Она также представила «набор бесплатных функций», включая запланированную перепараметризацию, которая повысила точность без увеличения затрат на вывод. Однако YOLOv7 на анкерные рамки и требует постобработки Non-Maximum Suppression (NMS), что влечет за собой изменчивость задержки и усложняет развертывание на пограничных устройствах.

Узнайте больше о YOLOv7

YOLO26: Сквозная революция

YOLO26, выпущенный Ultralytics в январе 2026 года, создан для эпохи пограничных вычислений и упрощенных операций машинного обучения.

Ключевая инновация: сквозное решение NMS

YOLO26 является нативной сквозной системой, что исключает необходимость в NMS . Этот прорыв, впервые реализованный в YOLOv10, значительно сокращает задержку вывода и упрощает процесс развертывания, обеспечивая готовность результатов модели к немедленному использованию.

YOLO26 представляет несколько важных усовершенствований:

  1. MuSGD Optimizer: вдохновленный технологиями обучения Kimi K2 и LLM от Moonshot AI, этот гибрид SGD и Muon обеспечивает беспрецедентную стабильность обучения компьютерному зрению, что приводит к более быстрой конвергенции.
  2. Удаление DFL: благодаря удалению Distribution Focal Loss (DFL) YOLO26 упрощает выходной слой. Это упрощает экспорт в такие форматы, как ONNX или TensorRT и улучшает совместимость с периферийными устройствами с низким энергопотреблением.
  3. ProgLoss + STAL: эти усовершенствованные функции потерь обеспечивают заметные преимущества в распознавании мелких объектов, что является важным требованием для изображений с дронов и датчиков IoT.

Узнайте больше о YOLO26

Анализ производительности

При сравнении исходных показателей YOLO26 демонстрирует повышение эффективности, достигнутое за четыре года исследований. Он обеспечивает более высокую точность с меньшим количеством параметров и значительно более высокую скорость вывода, особенно на процессорах.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Скорость и эффективность

YOLO26 специально оптимизирован для сред без мощных графических процессоров. Благодаря удалению сложных этапов постобработки и оптимизированным блокам он обеспечивает на 43 % более быстрое CPU по сравнению с предыдущими поколениями. Для разработчиков, развертывающих приложения на Raspberry Pi, мобильных телефонах или универсальных ЦП, YOLO26 является явным победителем.

В отличие от этого, YOLOv7 разработан в первую очередь с учетом GPU высокопроизводи GPU (в частности, V100 и A100). Хотя он по-прежнему работает быстро на CUDA , ему не хватает оптимизированной архитектуры, необходимой для современного пограничного искусственного интеллекта.

Обучение и экосистема

Разница в пользовательском опыте между двумя моделями разительна. YOLOv7 на устаревшие структуры репозиториев, которые часто требуют сложной настройки среды, ручного форматирования данных и подробных аргументов командной строки.

Преимущество Ultralytics

YOLO26 полностью интегрирован в Ultralytics , предлагая оптимизированный опыт «от нуля до героя».

  • Простота использования: Вы можете установить библиотеку через pip install ultralytics и начните обучение в считанные секунды. API является согласованным, питоническим и хорошо документированным.
  • Ultralytics : Пользователи YOLO26 могут использовать Ultralytics для управления наборами данных, автоматической аннотации и обучения в облаке одним щелчком мыши.
  • Универсальность: в то время как YOLOv7 в основном YOLOv7 на обнаружение (с некоторыми ветвями позы/сегментации), YOLO26 изначально поддерживает обнаружение объектов, сегментацию экземпляров, оценку позы, классификацию и ориентированные ограничительные рамки (OBB) в рамках одной и той же структуры.

Пример кода

Сравнивая сложность использования, Ultralytics значительно упрощает рабочий процесс.

from ultralytics import YOLO

# Load the latest YOLO26 model (nano version for speed)
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset
# No complex config files needed, just point to your data.yaml
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with NMS-free speed
# The results object contains easy-to-parse boxes and masks
results = model("path/to/image.jpg")

Идеальные варианты использования

Когда выбирать YOLOv7

YOLOv7 уважаемой моделью в академическом сообществе и может быть актуальна для:

  • Устаревшие системы: проекты, глубоко интегрированные с конкретной YOLOv7 , которые не могут быть легко перенесены.
  • Сравнительный анализ исследований: Исследователи сравнивают новые архитектуры с передовыми стандартами 2022 года.
  • Специфические GPU : сценарии, в которых специфическая структура E-ELAN обеспечивает нишевое преимущество на старом оборудовании, хотя это становится все более редким явлением.

Когда выбирать YOLO26

YOLO26 является рекомендуемым выбором практически для всех новых коммерческих и исследовательских проектов благодаря своему балансу производительности и эффективности обучения.

  • Edge Computing: идеально подходит для развертывания на мобильных (Android) или встроенных устройствах (Jetson, Raspberry Pi) благодаря компактному размеру и CPU .
  • Аналитика в реальном времени: конструкция NMS обеспечивает стабильную задержку, что крайне важно для приложений, критичных с точки зрения безопасности, таких как автономное вождение или робототехника.
  • Сложные задачи: когда ваш проект требует переключения между обнаружением, сегментацией и OBB (например, анализ аэрофотоснимков), универсальная архитектура YOLO26 показывает себя с лучшей стороны.
  • Среды с ограниченным объемом памяти: YOLO26 требует значительно меньше CUDA во время обучения по сравнению с моделями, интенсивно использующими трансформеры, или более старыми архитектурами, что позволяет использовать более крупные пакеты данных на потребительских графических процессорах.

Заключение

Если YOLOv7 поворотным моментом в истории обнаружения объектов, то YOLO26 представляет собой будущее. Объединив стабильность оптимизаторов, вдохновленных LLM (MuSGD), с оптимизированной архитектурой NMS, Ultralytics модель, которая является более быстрой, точной и значительно проще в использовании.

Для разработчиков, стремящихся создать надежные и перспективные приложения компьютерного зрения, интегрированная экосистема, обширная документация и превосходная производительность делают YOLO26 очевидным выбором.

Изучите другие модели

Если вы заинтересованы в изучении других вариантов в Ultralytics , обратите внимание на YOLO11 для задач общего назначения или RT-DETR для обнаружения на основе трансформаторов, где глобальный контекст имеет приоритет над чистой скоростью вывода.


Комментарии