YOLOv7 YOLO26: технологический прорыв в области обнаружения объектов
Ландшафт компьютерного зрения меняется с головокружительной скоростью. В 2022 году YOLOv7 установил новый стандарт скорости и точности, представив такие архитектурные инновации, как E-ELAN. Перенесемся в январь 2026 года, когда YOLO26 переопределил современный уровень развития благодаря сквозной архитектуре, CPU и стабильности обучения, заимствованной из больших языковых моделей (LLM).
В этом руководстве представлено техническое сравнение этих двух важных этапов в истории обнаружения объектов, что поможет разработчикам выбрать подходящий инструмент для современного внедрения.
Архитектурная эволюция
Переход от YOLOv7 YOLO26 представляет собой фундаментальное изменение в подходе к проектированию нейронных сетей с целью повышения их эффективности и удобства использования.
YOLOv7: Наследие E-ELAN
YOLOv7, выпущенный 6 июля 2022 года, был разработан Чень-Яо Ваном, Алексеем Бочковским и Хонг-Юанем Марком Ляо из Института информационных наук Академии Синика.
Ее основной инновацией стала расширенная сеть эффективной агрегации слоев (E-ELAN). Эта архитектура позволяет сети изучать более разнообразные особенности, контролируя самые короткие и самые длинные пути градиента. Она также представила «набор бесплатных функций», включая запланированную перепараметризацию, которая повысила точность без увеличения затрат на вывод. Однако YOLOv7 на анкерные рамки и требует постобработки Non-Maximum Suppression (NMS), что влечет за собой изменчивость задержки и усложняет развертывание на пограничных устройствах.
YOLO26: Сквозная революция
YOLO26, выпущенный Ultralytics в январе 2026 года, создан для эпохи пограничных вычислений и упрощенных операций машинного обучения.
Ключевая инновация: сквозное решение NMS
YOLO26 является нативной сквозной системой, что исключает необходимость в NMS . Этот прорыв, впервые реализованный в YOLOv10, значительно сокращает задержку вывода и упрощает процесс развертывания, обеспечивая готовность результатов модели к немедленному использованию.
YOLO26 представляет несколько важных усовершенствований:
- MuSGD Optimizer: вдохновленный технологиями обучения Kimi K2 и LLM от Moonshot AI, этот гибрид SGD и Muon обеспечивает беспрецедентную стабильность обучения компьютерному зрению, что приводит к более быстрой конвергенции.
- Удаление DFL: благодаря удалению Distribution Focal Loss (DFL) YOLO26 упрощает выходной слой. Это упрощает экспорт в такие форматы, как ONNX или TensorRT и улучшает совместимость с периферийными устройствами с низким энергопотреблением.
- ProgLoss + STAL: эти усовершенствованные функции потерь обеспечивают заметные преимущества в распознавании мелких объектов, что является важным требованием для изображений с дронов и датчиков IoT.
Анализ производительности
При сравнении исходных показателей YOLO26 демонстрирует повышение эффективности, достигнутое за четыре года исследований. Он обеспечивает более высокую точность с меньшим количеством параметров и значительно более высокую скорость вывода, особенно на процессорах.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Скорость и эффективность
YOLO26 специально оптимизирован для сред без мощных графических процессоров. Благодаря удалению сложных этапов постобработки и оптимизированным блокам он обеспечивает на 43 % более быстрое CPU по сравнению с предыдущими поколениями. Для разработчиков, развертывающих приложения на Raspberry Pi, мобильных телефонах или универсальных ЦП, YOLO26 является явным победителем.
В отличие от этого, YOLOv7 разработан в первую очередь с учетом GPU высокопроизводи GPU (в частности, V100 и A100). Хотя он по-прежнему работает быстро на CUDA , ему не хватает оптимизированной архитектуры, необходимой для современного пограничного искусственного интеллекта.
Обучение и экосистема
Разница в пользовательском опыте между двумя моделями разительна. YOLOv7 на устаревшие структуры репозиториев, которые часто требуют сложной настройки среды, ручного форматирования данных и подробных аргументов командной строки.
Преимущество Ultralytics
YOLO26 полностью интегрирован в Ultralytics , предлагая оптимизированный опыт «от нуля до героя».
- Простота использования: Вы можете установить библиотеку через
pip install ultralyticsи начните обучение в считанные секунды. API является согласованным, питоническим и хорошо документированным. - Ultralytics : Пользователи YOLO26 могут использовать Ultralytics для управления наборами данных, автоматической аннотации и обучения в облаке одним щелчком мыши.
- Универсальность: в то время как YOLOv7 в основном YOLOv7 на обнаружение (с некоторыми ветвями позы/сегментации), YOLO26 изначально поддерживает обнаружение объектов, сегментацию экземпляров, оценку позы, классификацию и ориентированные ограничительные рамки (OBB) в рамках одной и той же структуры.
Пример кода
Сравнивая сложность использования, Ultralytics значительно упрощает рабочий процесс.
from ultralytics import YOLO
# Load the latest YOLO26 model (nano version for speed)
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset
# No complex config files needed, just point to your data.yaml
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with NMS-free speed
# The results object contains easy-to-parse boxes and masks
results = model("path/to/image.jpg")
Идеальные варианты использования
Когда выбирать YOLOv7
YOLOv7 уважаемой моделью в академическом сообществе и может быть актуальна для:
- Устаревшие системы: проекты, глубоко интегрированные с конкретной YOLOv7 , которые не могут быть легко перенесены.
- Сравнительный анализ исследований: Исследователи сравнивают новые архитектуры с передовыми стандартами 2022 года.
- Специфические GPU : сценарии, в которых специфическая структура E-ELAN обеспечивает нишевое преимущество на старом оборудовании, хотя это становится все более редким явлением.
Когда выбирать YOLO26
YOLO26 является рекомендуемым выбором практически для всех новых коммерческих и исследовательских проектов благодаря своему балансу производительности и эффективности обучения.
- Edge Computing: идеально подходит для развертывания на мобильных (Android) или встроенных устройствах (Jetson, Raspberry Pi) благодаря компактному размеру и CPU .
- Аналитика в реальном времени: конструкция NMS обеспечивает стабильную задержку, что крайне важно для приложений, критичных с точки зрения безопасности, таких как автономное вождение или робототехника.
- Сложные задачи: когда ваш проект требует переключения между обнаружением, сегментацией и OBB (например, анализ аэрофотоснимков), универсальная архитектура YOLO26 показывает себя с лучшей стороны.
- Среды с ограниченным объемом памяти: YOLO26 требует значительно меньше CUDA во время обучения по сравнению с моделями, интенсивно использующими трансформеры, или более старыми архитектурами, что позволяет использовать более крупные пакеты данных на потребительских графических процессорах.
Заключение
Если YOLOv7 поворотным моментом в истории обнаружения объектов, то YOLO26 представляет собой будущее. Объединив стабильность оптимизаторов, вдохновленных LLM (MuSGD), с оптимизированной архитектурой NMS, Ultralytics модель, которая является более быстрой, точной и значительно проще в использовании.
Для разработчиков, стремящихся создать надежные и перспективные приложения компьютерного зрения, интегрированная экосистема, обширная документация и превосходная производительность делают YOLO26 очевидным выбором.
Изучите другие модели
Если вы заинтересованы в изучении других вариантов в Ultralytics , обратите внимание на YOLO11 для задач общего назначения или RT-DETR для обнаружения на основе трансформаторов, где глобальный контекст имеет приоритет над чистой скоростью вывода.