Link to this sectionYOLOv7 против YOLOv10#
Область компьютерного зрения стала свидетелем выдающихся достижений за последние несколько лет, причем семейство моделей YOLO (You Only Look Once) стало лидером в области обнаружения объектов в реальном времени. Выбор подходящей архитектуры для твоих проектов по компьютерному зрению требует глубокого понимания доступных вариантов. В этом подробном техническом сравнении мы рассмотрим ключевые различия между двумя знаковыми архитектурами: YOLOv7 и YOLOv10.
Link to this sectionВведение в модели#
Обе эти модели представляют собой важные вехи в истории искусственного интеллекта, однако они используют принципиально разные подходы к решению задач обнаружения объектов.
Link to this sectionYOLOv7: Пионер «наборов бесплатных улучшений»#
Выпущенная 6 июля 2022 года исследователями Чиен-Яо Ваном, Алексеем Бочковским и Хон-Юань Марком Ляо из Института информационных наук Academia Sinica, YOLOv7 представила сдвиг парадигмы в способах оптимизации нейронных сетей. Оригинальное исследование, подробно описанное в их академической работе и размещенное в их официальном репозитории GitHub, было в значительной степени сосредоточено на архитектурной перепараметризации и обучаемом «наборе бесплатных инструментов» (bag-of-freebies).
YOLOv7 использует расширенную сеть агрегации эффективных слоев (E-ELAN), чтобы направлять сеть при изучении разнообразных признаков, не разрушая при этом исходный путь градиента. Это делает ее надежным выбором для академических исследовательских тестов и систем, которые сильно зависят от стандартных высокопроизводительных GPU.
Link to this sectionYOLOv10: Обнаружение в реальном времени от начала до конца#
Разработанная Ао Ваном и его командой в Университете Цинхуа, YOLOv10 была выпущена 23 мая 2024 года. Как подробно описано в ее публикации arxiv и репозитории GitHub Университета Цинхуа, эта модель устраняет давнее «узкое место» в обнаружении объектов: немаксимальное подавление (NMS).
YOLOv10 внедрила согласованные двойные назначения для обучения без использования NMS, фундаментально изменив конвейер постобработки. Применяя целостную стратегию проектирования моделей, ориентированную на эффективность и точность, YOLOv10 снижает вычислительную избыточность. Это приводит к созданию архитектуры, уникально адаптированной для периферийных устройств, требующих крайне низкой задержки.
Link to this sectionСравнение производительности и метрик#
При анализе производительности модели крайне важно оценивать компромиссы между точностью, скоростью и вычислительной нагрузкой. В следующей таблице показано, как разные размеры этих моделей соотносятся друг с другом.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Link to this sectionАнализ компромиссов#
Приведенные выше показатели выявляют явный разрыв поколений. Хотя YOLOv7x обеспечивает очень высокий mAPval в 53,1%, для этого требуется 71,3 млн параметров и 189,9 млрд FLOPs. Напротив, YOLOv10l превосходит эту точность (53,3% mAP), требуя при этом менее половины параметров (29,5 млн) и значительно меньше FLOPs (120,3 млрд). Кроме того, высокооптимизированная YOLOv10n обеспечивает поразительную скорость вывода в 1,56 мс, что делает ее идеальной для видеоаналитики в реальном времени и мобильных приложений.
Link to this sectionРеальные сценарии использования#
Архитектурные различия между этими моделями определяют их оптимальные сценарии использования.
Link to this sectionКогда использовать YOLOv7#
Благодаря богатому представлению признаков, YOLOv7 отлично справляется со сложными средами. Сценарии использования, такие как мониторинг транспортных потоков в густонаселенных городских районах, анализ спутниковых снимков или выявление дефектов в тяжелой автоматизации производства, выигрывают от ее надежной структурной перепараметризации. Ее также часто выбирают в устаревших средах, уже глубоко интегрированных с конкретными конвейерами PyTorch 1.12.
Link to this sectionКогда использовать YOLOv10#
Легкая конструкция YOLOv10 без NMS отлично проявляет себя в ограниченных средах. Она настоятельно рекомендуется для периферийных вычислительных устройств, таких как NVIDIA Jetson Nano или Raspberry Pi. Ее производительность с низкой задержкой делает ее идеальной для динамичных приложений, таких как спортивная аналитика, автономная навигация дронов и высокоскоростная роботизированная сортировка на конвейерных лентах.
Link to this sectionПреимущества экосистемы Ultralytics#
Хотя обе модели имеют сильные академические корни, их истинный потенциал раскрывается при использовании в рамках единой платформы Ultralytics. Разработка моделей компьютерного зрения с нуля — это общеизвестно сложная задача, но экосистема Ultralytics предоставляет непревзойденный опыт для инженеров машинного обучения.
- Простота использования: Python API от Ultralytics предоставляет единый интерфейс. Ты можешь обучать, проверять и экспортировать модели всего несколькими строками кода, избегая кошмаров со сложными зависимостями, характерных для типичных академических репозиториев.
- Хорошо поддерживаемая экосистема: Ultralytics гарантирует, что базовый код активно развивается. Пользователи получают преимущества от бесшовной интеграции с популярными инструментами машинного обучения, такими как Weights & Biases для логирования или Hugging Face для быстрых веб-демо.
- Требования к памяти: Детекторы объектов на основе Transformer часто потребляют огромное количество памяти CUDA во время обучения. Напротив, модели Ultralytics YOLO требуют гораздо меньше памяти, что позволяет использовать гораздо большие размеры пакетов (batch sizes) на оборудовании потребительского уровня.
- Универсальность: Конвейер Ultralytics не ограничивается стандартными ограничивающими рамками (bounding boxes). Он легко поддерживает оценку позы, сегментацию экземпляров и ориентированные ограничивающие рамки во всех поддерживаемых семействах моделей, таких как YOLO11 и YOLOv8.
Link to this sectionПример оптимизированного обучения#
Запуск конвейера обучения с Ultralytics удивительно прост. Независимо от того, используешь ли ты историческую надежность YOLOv7 или скорость YOLOv10 без NMS, синтаксис остается неизменным:
from ultralytics import YOLO
# Load the preferred model (e.g., YOLOv10 Nano)
model = YOLO("yolov10n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run an inference prediction on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to an edge-friendly format like ONNX
model.export(format="onnx")Link to this sectionСценарии использования и рекомендации#
Выбор между YOLOv7 и YOLOv10 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в отношении экосистемы.
Link to this sectionКогда выбирать YOLOv7#
YOLOv7 — отличный выбор для:
- Академического бенчмаркинга: воспроизведение результатов уровня state-of-the-art 2022 года или изучение эффектов E-ELAN и методов trainable bag-of-freebies.
- Исследований репараметризации: изучение плановых репараметризованных сверток и стратегий составного масштабирования моделей.
- Существующих кастомных конвейеров: проектов с сильно модифицированными конвейерами, построенными вокруг специфической архитектуры YOLOv7, которые нельзя легко переработать.
Link to this sectionКогда стоит выбрать YOLOv10#
YOLOv10 рекомендуется для:
- Детекции в реальном времени без NMS: Приложения, которым полезна сквозная (end-to-end) детекция без использования Non-Maximum Suppression, что снижает сложность развертывания.
- Сбалансированного соотношения скорости и точности: Проекты, требующие оптимального баланса между скоростью вывода и точностью детекции для различных масштабов моделей.
- Приложений с постоянной задержкой: Сценарии развертывания, где критически важна предсказуемость времени вывода, например, в робототехнике или автономных системах.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionБудущее: Представляем YOLO26#
Хотя YOLOv7 и YOLOv10 являются впечатляющими вехами, границы ИИ постоянно расширяются. Выпущенная в январе 2026 года, Ultralytics YOLO26 является бесспорным новым стандартом эффективности и точности для всех сценариев развертывания на периферии и в облаке.
Если ты начинаешь новый проект по компьютерному зрению сегодня, YOLO26 — рекомендуемая архитектура. Она опирается на наследие своих предшественников, включая несколько новаторских инноваций:
- Сквозной дизайн без NMS: Вдохновляясь YOLOv10, YOLO26 нативно устраняет постобработку NMS, обеспечивая сверхнизкую задержку вывода для детерминированной робототехники в реальном времени.
- До 43% быстрее вывод на CPU: За счет стратегического удаления модуля Distribution Focal Loss (DFL), YOLO26 радикально ускоряет выполнение на периферийном вычислительном оборудовании без GPU, что делает ее мощным инструментом для IoT-устройств.
- Оптимизатор MuSGD: Вдохновленный недавними инновациями в обучении больших языковых моделей, YOLO26 включает гибрид SGD и Muon, стабилизируя пути обучения и гарантируя более быструю сходимость.
- ProgLoss + STAL: Эти продвинутые функции потерь дают заметные улучшения в распознавании мелких объектов, преодолевая историческую слабость старых поколений YOLO.
- Непревзойденная универсальность: YOLO26 предлагает нативные, специфичные для задачи оптимизации, такие как Residual Log-Likelihood Estimation (RLE) для отслеживания поз и специализированные потери углов для точного обнаружения OBB на аэрофотоснимках.
Для инженеров, ищущих идеальный баланс скорости, точности и простоты развертывания, переход с устаревших моделей на YOLO26 дает немедленное и измеримое конкурентное преимущество.