YOLO11 vs YOLO26: Эволюция ИИ для зрения следующего поколения
Быстрое развитие компьютерного зрения постоянно расширяет границы скорости, точности и эффективности развертывания. В области обнаружения объектов в реальном времени Ultralytics неизменно устанавливает стандарты. Это техническое сравнение исследует переход от весьма успешной YOLO11 к передовой YOLO26, анализируя их архитектуры, метрики производительности и идеальные сценарии развертывания.
Независимо от того, создаете ли вы системы доставки дронами или оптимизируете глобальный конвейер интеллектуального производства, понимание тонких различий между этими двумя моделями поможет вам создавать надежные, перспективные AI-решения.
Происхождение модели и экосистема
Обе модели выигрывают от всеобъемлющей экосистемы Ultralytics, характеризующейся простым API, постоянной поддержкой и активным сообществом. Они предлагают непревзойденную универсальность, естественно поддерживая обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и задачи Oriented Bounding Box (obb) из коробки.
YOLO11: Установленный стандарт
Выпущенный в конце 2024 года, YOLO11 усовершенствовал достижения предыдущих поколений, закрепив за собой место надежной рабочей лошадки для производственных сред.
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- Документация:Документация YOLO11
YOLO26: Новый рубеж
Представленный в начале 2026 года, YOLO26 представляет собой сдвиг парадигмы в области граничных вычислений и сквозной архитектуры, обеспечивая значительные улучшения в скорости обработки и простоте интеграции.
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 2026-01-14
- GitHub:https://github.com/ultralytics/ultralytics
- Документация:Документация YOLO26
Управление данными и развертываниями
Как YOLO11, так и YOLO26 полностью интегрированы с платформой Ultralytics, обеспечивая бесшовные рабочие процессы без кода для аннотации наборов данных, облачного обучения и мониторинга парка устройств.
Архитектурные инновации
В то время как YOLO11 опирается на традиционные методы постобработки, которые годами использовались в компьютерном зрении, YOLO26 представляет несколько структурных прорывов, разработанных для устранения узких мест.
Сквозной дизайн без NMS
Одним из наиболее значительных улучшений в YOLO26 является его нативная сквозная архитектура. Она устраняет постобработку Non-Maximum Suppression (NMS), концепцию, впервые примененную в YOLOv10. Обход NMS значительно упрощает конвейер развертывания и гарантирует стабильную задержку, что крайне важно для приложений реального времени, таких как алгоритмы автономного вождения.
Удаление DFL для оптимизации на периферии
YOLO26 удаляет Distribution Focal Loss (DFL). Хотя DFL был полезен в YOLO11 для точной локализации, его удаление упрощает граф экспорта сети. Это изменение обеспечивает улучшенную совместимость с маломощным оборудованием, делая YOLO26 абсолютным лидером на периферийных устройствах, таких как Raspberry Pi или NVIDIA Jetson.
Оптимизатор MuSGD
Черпая вдохновение из механизмов обучения больших языковых моделей (LLM), в частности, из Kimi K2 от Moonshot AI, YOLO26 использует революционный оптимизатор MuSGD. Этот гибрид стохастического градиентного спуска (SGD) и мюона обеспечивает исключительно стабильные циклы обучения, сходясь значительно быстрее, чем стандартные оптимизаторы AdamW, используемые в старых архитектурах.
Расширенные функции потерь
YOLO26 включает ProgLoss + STAL (прогрессивные потери и обучение выравниванию задач с учетом масштаба). Эта комбинация значительно улучшает detect мелких и плотно расположенных объектов. Кроме того, YOLO26 представляет улучшения для конкретных задач: выделенный многомасштабный прототип для семантической сегментации, оценка остаточного логарифмического правдоподобия (RLE) для сложных оценок позы человека и специализированная угловая функция потерь для смягчения проблем с границами в задачах OBB detect.
Сравнение производительности
При оценке этих моделей баланс между количеством параметров, вычислительной сложностью (FLOPs) и скоростью определяет выбор аппаратного обеспечения. YOLO26 специально ориентирован на скорость инференса на CPU, достигая до 43% более быстрого инференса на CPU по сравнению со своим предшественником.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Как показано, YOLO26 Nano (YOLO26n) значительно увеличивает точность, сокращая время инференции на CPU с 56.1 мс до 38.9 мс с использованием ONNX Runtime.
Экспорт для максимальной скорости
Чтобы выжать максимум производительности из этих моделей, экспортируйте их с использованием TensorRT на оборудовании NVIDIA или OpenVINO для CPU Intel. Без NMS-дизайн YOLO26 делает этот процесс экспорта более плавным, чем когда-либо.
Варианты использования и реальные применения
Выбор между YOLO11 и YOLO26 во многом зависит от вашей конкретной инфраструктуры и целей проекта.
Периферийные вычисления и IoT
Для приложений, ограниченных по мощности и аппаратному обеспечению, таких как мониторинг умного сельского хозяйства с помощью дронов или локальные системы охранной сигнализации, YOLO26 является бесспорным лидером. Удаление DFL и 43%-ное увеличение скорости CPU означает, что вы можете запускать сложные модели компьютерного зрения на устройствах без выделенных GPU, поддерживая при этом высокую частоту кадров.
Облачные и корпоративные решения
YOLO11 остается отличным выбором для корпоративных решений, где масштабные серверные фермы уже оптимизированы под его тензорные структуры. Он идеально подходит для облачной видеоаналитики и крупномасштабных конвейеров обработки медиа, которые уже глубоко интегрированы с его специфическими выходными форматами.
Сложная многозадачность
Если ваш проект требует высокой точности для мелких объектов—например, detect дефектов на печатной плате или track удаленных транспортных средств на аэрофотоснимках—реализация ProgLoss + STAL в YOLO26 обеспечивает заметное повышение полноты и точности для этих сложных пограничных случаев.
Эффективность обучения и требования к памяти
Основным преимуществом фреймворка Ultralytics является его невероятно низкое потребление памяти во время обучения. В отличие от массивных визуальных трансформеров, таких как RT-DETR или более старый YOLOv8, которые могут потреблять огромное количество памяти CUDA, как YOLO11, так и YOLO26 оптимизированы для эффективного обучения на потребительском оборудовании.
Интеграция оптимизатора MuSGD в YOLO26 дополнительно улучшает этот процесс, обеспечивая более быстрый поиск оптимальных весов моделью, что сокращает общее количество вычислительных часов GPU и затраты на облачные вычисления.
Вот простой пример, демонстрирующий, как легко обучать новейшую модель YOLO26 с использованием нативного Python API:
from ultralytics import YOLO
# Initialize the YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Run a quick validation to verify the mAP metrics
metrics = model.val()
# Export the trained model to ONNX for fast CPU inference
model.export(format="onnx")
Изучение альтернативных архитектур
Хотя YOLO26 представляет собой вершину обнаружения в реальном времени, изучение других моделей в документации Ultralytics может быть полезным. Для пользователей, привязанных к устаревшим средам, более ранние архитектуры, такие как YOLOv5, по-прежнему обеспечивают надежную производительность. Для возможностей zero-shot, когда предварительное определение классов невозможно, YOLO-World предлагает обнаружение с открытым словарем, основанное на текстовых подсказках.
Заключение
Переход от YOLO11 к YOLO26 — это не просто инкрементальное обновление; это структурное переосмысление того, как модели обнаружения объектов в реальном времени работают в производственной среде. Отказываясь от сложных этапов постобработки и оптимизируя выполнение в первую очередь на периферийных устройствах, YOLO26 выделяется как лучший выбор для современных разработчиков. Поддерживаемая надежной экосистемой Ultralytics и всеобъемлющей документацией, модернизация до YOLO26 гарантирует более быстрое развертывание, стабильное обучение и SOTA точность практически для любой задачи компьютерного зрения.