YOLOv10 против YOLOv7: подробное сравнение
Выбор правильной модели обнаружения объектов очень важен для проектов по компьютерному зрению. Ultralytics YOLO предлагает ряд моделей, отвечающих различным потребностям. На этой странице представлено техническое сравнение YOLOv10 и YOLOv7, двух популярных моделей для задач обнаружения объектов. Мы проанализируем их архитектуры, показатели производительности и идеальные приложения, чтобы помочь вам принять обоснованное решение.
Модель | размер (пикселей) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4TensorRT10 (мс) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv10
YOLOv10, представленный в мае 2024 года исследователями из Университета Цинхуа, представляет собой передовой рубеж в области обнаружения объектов в реальном времени. В своей статье в Arxiv"YOLOv10: End-to-End Object Detection в реальном времени" Ао Ванг, Хуэй Чен, Лихао Лю и др. представляют YOLOv10 как значительное достижение, сосредоточенное на эффективности и точности. Официальная реализация доступна на GitHub. YOLOv10 предназначена для сквозного развертывания, что позволяет устранить зависимость предыдущих версий YOLO от не-максимального подавления (NMS).
Архитектура и ключевые особенности:
В YOLOv10 реализовано несколько архитектурных инноваций, направленных на повышение скорости и сокращение вычислительной избыточности. Среди ключевых особенностей - безъякорный подход и дизайн без NMS, упрощающий постобработку и ускоряющий вывод. Модель использует целостную стратегию проектирования, ориентированную на эффективность и точность, оптимизируя различные компоненты для минимальных накладных расходов и максимальных возможностей. В результате модель не только быстрее, но и сохраняет конкурентоспособную точность, что делает ее подходящей для граничных устройств и приложений реального времени.
Метрики и контрольные показатели эффективности:
Как видно из сравнительной таблицы, модели YOLOv10, особенно варианты YOLOv10n и YOLOv10s, демонстрируют впечатляющую скорость вычислений на TensorRT, достигая 1,56 и 2,66 мс соответственно. YOLOv10n достигает mAPval50-95 39,5 при всего 2,3M параметрах и 6,7B FLOPs, а YOLOv10x - 54,4 mAPval50-95. Эти показатели подчеркивают способность YOLOv10 обеспечивать современную производительность при оптимизированных вычислительных ресурсах. Для более глубокого понимания метрик производительности YOLO обратитесь к документации Ultralytics по метрикам производительностиYOLO .
Примеры использования:
Упор на производительность и эффективность YOLOv10 в реальном времени делает его идеальным для приложений, требующих быстрого обнаружения объектов при ограниченных вычислительных ресурсах. Подходящие примеры использования включают:
- Приложения краевого ИИ: Развертывание на пограничных устройствах для обработки данных в реальном времени в таких сценариях, как интеллектуальные камеры и устройства IoT.
- Робототехника: Обеспечение более быстрого и эффективного распознавания объектов для навигации и взаимодействия в робототехнических системах, о чем говорится в статье "Роль ИИ в робототехнике".
- Автономные системы: Применение в автономных транспортных средствах и беспилотниках, где низкая задержка имеет решающее значение для безопасной и эффективной работы.
- Мобильные и встраиваемые системы: Обнаружение объектов в мобильных приложениях и встроенных системах с ограниченной вычислительной мощностью.
Сильные стороны:
- Высокая эффективность: Дизайн без NMS и оптимизированная архитектура для более быстрого вывода и снижения задержек.
- Соревновательная точность: Сохраняет высокую точность при значительном увеличении скорости.
- Комплексное развертывание: Предназначен для бесшовного сквозного обнаружения объектов в режиме реального времени.
- Меньшие размеры моделей: Эффективная архитектура приводит к уменьшению размеров модели и сокращению количества параметров по сравнению с некоторыми предшественниками.
Слабые стороны:
- Относительно новая: Как более новая модель, YOLOv10 может иметь меньшее сообщество и меньшее количество примеров развертывания по сравнению с более авторитетными моделями, такими как YOLOv7.
- Настройка производительности: Для достижения оптимальной производительности может потребоваться тонкая настройка и эксперименты с различными размерами и конфигурациями моделей, как подробно описано в советах по обучению моделей.
YOLOv7
YOLOv7, представленная в июле 2022 года Чиен-Яо Вангом, Алексеем Бочковским и Хонг-Юаном Марком Лиао, - это широко известная модель обнаружения объектов, известная своей эффективностью и точностью. Модель подробно описана в статье Arxiv"YOLOv7: Trainable bag-of-freebies sets new state-of-the-the-art for real-time object detectors", а в официальном репозитории GitHub представлены подробности ее реализации. YOLOv7 создана на основе предыдущих версий YOLO и включает в себя архитектурные усовершенствования, позволяющие повысить производительность без существенного увеличения вычислительных затрат.
Архитектура и ключевые особенности:
В YOLOv7 реализовано несколько архитектурных инноваций, повышающих его производительность и эффективность. Ключевые особенности включают:
- Расширенные эффективные сети агрегации уровней (E-ELAN): Расширяет возможности обучения и градиентного потока сети.
- Масштабирование модели для моделей на основе конкатенации: Предоставляет рекомендации по эффективному масштабированию глубины и ширины.
- Вспомогательная головка и головка для грубой и тонкой обработки: повышает эффективность обучения и точность обнаружения.
Благодаря этим особенностям YOLOv7 способен достигать самых современных результатов по скорости и точности, что делает его надежным выбором для решения различных задач по обнаружению объектов.
Метрики и контрольные показатели эффективности:
YOLOv7 демонстрирует сильный баланс между скоростью и точностью. Как показано в таблице, YOLOv7l достигает mAPval50-95 51,4, а YOLOv7x - 53,1 mAPval50-95. Хотя по скорости вывода TensorRT модели YOLOv7 немного уступают YOLOv10n и YOLOv10s, они все равно демонстрируют конкурентоспособную производительность, особенно если учитывать большие размеры моделей YOLOv7. Подробные метрики см. в документации по YOLOv7.
Примеры использования:
Благодаря балансу точности и эффективности YOLOv7 подходит для приложений, требующих надежного обнаружения объектов в сценариях реального времени. Идеальные варианты использования включают:
- Автономные транспортные средства: Надежное обнаружение объектов в сложных условиях движения, как критически важный фактор для ИИ в самоуправляемых автомобилях.
- Передовые системы видеонаблюдения: Высокая точность определения потенциальных угроз безопасности в системах безопасности.
- Робототехника: Точное распознавание объектов для манипулирования и навигации в робототехнике, аналогично YOLOv10, но с потенциальным преимуществом в точности в определенных сценариях.
- Промышленная автоматизация: Контроль качества и обнаружение дефектов в производственных процессах, где точность имеет первостепенное значение.
Сильные стороны:
- Высокая mAP: Достигает высокой средней точности, что свидетельствует о высокой точности обнаружения объектов.
- Эффективный вывод: Предназначен для быстрого вывода, подходит для приложений реального времени.
- Устоявшийся и зрелый: YOLOv7 пользуется большим сообществом и широким использованием, что обеспечивает больше ресурсов и поддержки.
- Управляемые размеры моделей: Обеспечивает хороший баланс между размером модели и производительностью.
Слабые стороны:
- Сложность: Архитектура сложнее, чем у некоторых более простых моделей, что потенциально требует большего опыта для тонкой настройки и оптимизации.
- Ресурсоемкость по сравнению с нано-моделями: Несмотря на свою эффективность, эта модель требует больших вычислительных затрат, чем более компактные модели, такие как YOLOv10n, особенно в средах с ограниченными ресурсами.
Другие модели YOLO
Помимо YOLOv10 и YOLOv7, Ultralytics предлагает целый ряд моделей YOLO , каждая из которых обладает уникальными преимуществами. Рассмотрите возможность изучения YOLOv8 как универсальный и удобный в использовании вариант, YOLOv9 - для усовершенствования сетевой архитектуры, а также YOLO11 за новейшую производительность. Вы также можете сравнить YOLOv7 с другими моделями, такими как YOLOv5 и YOLOX, чтобы понять их специфические компромиссы.