Перейти к содержанию

Сравнение моделей: выберите лучшую модель обнаружения объектов для вашего проекта

Выбор правильной архитектуры нейронной сети - краеугольный камень любого успешного проекта по компьютерному зрению. Добро пожаловать в центр сравнения моделейUltralytics ! На этой странице собраны подробные технические анализы и бенчмарки производительности, в которых рассматриваются компромиссы между новейшими Ultralytics YOLO11 и другими ведущими архитектурами, такими как YOLOv10, RT-DETR и EfficientDet.

Независимо от того, требуется ли вашему приложению миллисекундная задержка краевого ИИ или высокая точность, необходимая для медицинской визуализации, это руководство содержит данные, необходимые для обоснованного выбора. Мы оцениваем модели на основе средней точности (mAP), скорости вывода, эффективности параметров и простоты развертывания.

Интерактивные показатели производительности

Визуализация взаимосвязи между скоростью и точностью необходима для определения "границы Парето" моделей обнаружения объектов, которые обеспечивают наилучшую точность при заданном ограничении скорости. На диаграмме ниже представлены основные показатели на стандартных наборах данных, таких как COCO.

На этой диаграмме представлены ключевые показатели производительности, позволяющие быстро оценить компромиссы между различными моделями. Понимание этих показателей необходимо для выбора модели, которая соответствует вашим конкретным ограничениям на развертывание.

Краткое руководство по принятию решений

Не знаете, с чего начать? Используйте это дерево решений, чтобы выбрать архитектуру, которая лучше всего соответствует вашим требованиям к оборудованию и производительности.

graph TD
    A[Start: Define Project Needs] --> B{Deployment Hardware?}
    B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
    B -- "Cloud / GPU" --> D{Accuracy vs Speed?}

    C -- "Extreme Speed (Real-time)" --> E[YOLO11n / YOLO11s]
    C -- "Balanced Legacy" --> F[YOLOv5s / YOLOv8s]

    D -- "Max Accuracy (SOTA)" --> G[YOLO11x / RT-DETR-X]
    D -- "Balanced Performance" --> H[YOLO11m / YOLO11l]

    A --> I{Specialized Features?}
    I -- "NMS-Free Inference" --> J[YOLOv10]
    I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO11 / YOLOv8]
    I -- "Video Analytics" --> L[YOLO11 + Tracking]

Современный ландшафт: YOLO11 и далее

Область обнаружения объектов стремительно развивается. В то время как старые модели остаются актуальными для поддержки устаревших систем, новые архитектуры расширяют границы возможного.

Ultralytics YOLO11

В качестве последнего стабильного релиза, YOLO11 является рекомендуемой отправной точкой для новых проектов. В нем реализованы значительные архитектурные улучшения по сравнению с предыдущими версиями, включая расширенные возможности извлечения признаков и оптимизированные вычислительные графы. Он поддерживает полный набор задач - обнаружение, сегментацию, оценку позы, классификацию и ориентированные граничные поля (OBB)- в рамках единого, унифицированного фреймворка.

Почему стоит выбрать YOLO11?

YOLO11 представляет собой вершину инженерной мысли Ultralytics , предлагая оптимальный баланс скорости и точности для реальных приложений. Он полностью поддерживается нашей экосистемой, что обеспечивает долгосрочное обслуживание и совместимость.

Модели сообществ: Заметка о YOLO12 и YOLO13

Вы можете встретить ссылки на YOLO12 или YOLO13 в обсуждениях сообщества или репозиториях.

Производственные предостережения

В настоящее время мы не рекомендуем использовать YOLO12 или YOLO13 в производственных целях.

  • YOLO12: использует слои внимания, которые часто приводят к нестабильности обучения, чрезмерному потреблению памяти и значительному снижению скорости умозаключений на CPU .
  • YOLO13: Бенчмарки показывают лишь незначительный прирост точности по сравнению с YOLO11 , при этом он больше и медленнее. Опубликованные результаты показали проблемы с воспроизводимостью.

Заглядывая в будущее: YOLO26 и платформа Ultralytics

Ultralytics активно разрабатывает YOLO26, планируя выпустить ее с открытым исходным кодом в конце 2025 года. Эта модель нового поколения будет поддерживать все задачи YOLO11 , но при этом станет меньше, быстрее и нативно сквозной. Кроме того, в 2026 году платформаUltralytics будет запущена в качестве комплексного SaaS-решения для поиска данных, автоаннотирования и облачного обучения, что упростит весь жизненный цикл MLOps.



Смотреть: Сравнение моделей YOLO : Ultralytics YOLO11 против YOLOv10 против YOLOv9 против Ultralytics YOLOv8 🎉

Подробное сравнение моделей

Изучите наши подробные технические сравнения, чтобы понять конкретные архитектурные различия, такие как выбор позвоночника, дизайн головки и функции потери. Для удобства доступа мы разбили их по моделям:

YOLO11 против

YOLO11 опирается на успех своих предшественников и использует передовые разработки. В нем улучшена архитектура "позвоночника" и "шеи" для лучшего извлечения признаков и оптимизации эффективности.

YOLOv10 против

Разработанный Университетом Цинхуа, YOLOv10 фокусируется на устранении шага немаксимального подавления (NMS) для уменьшения дисперсии задержки, предлагая современную производительность при снижении вычислительных затрат.

YOLOv9 против

YOLOv9 представляет программируемую градиентную информацию (PGI) и обобщенную эффективную сеть агрегирования слоев (GELAN) для решения проблемы потери информации в глубоких нейронных сетях.

YOLOv8 vs

Ultralytics YOLOv8 остается очень популярным выбором, благодаря усовершенствованной архитектуре позвоночника и шеи, а также безъякорной разъемной головке для оптимального соотношения точности и скорости.

YOLOv7 против

В YOLOv7 появились "обучаемый мешок свободных данных" и повторная параметризация модели, направленные на оптимизацию процесса обучения без увеличения затрат на вывод.

YOLOv6 vs

Система YOLOv6 компании Meituan предназначена для промышленных применений и оснащена модулями двунаправленной конкатенации (BiC) и стратегиями обучения с использованием якорей.

YOLOv5 vs

Ultralytics YOLOv5 славится простотой использования, стабильностью и скоростью. Он остается надежным выбором для проектов, требующих широкой совместимости с устройствами.

RT-DETR против

RT-DETR (Real-Time Detection Transformer) использует трансформаторы зрения для достижения высокой точности при работе в режиме реального времени, что позволяет добиться превосходства в понимании глобального контекста.

PP-YOLOE+ против

В системе PP-YOLOE+, разработанной компанией Baidu, используется технология Task Alignment Learning (TAL) и отсоединенная голова, что позволяет сбалансировать эффективность и точность.

DAMO-YOLO против

YOLO от Alibaba Group использует нейронную архитектуру поиска (NAS) и эффективный RepGFPN для достижения максимальной точности на статических эталонах.

YOLOX против

YOLOX, разработанная компанией Megvii, - это безъякорная эволюция, известная своей отсоединенной головой и стратегией присвоения меток SimOTA.

EfficientDet в сравнении с

EfficientDet от Google Brain использует составное масштабирование и BiFPN для оптимизации эффективности параметров, предлагая спектр моделей (D0-D7) для различных ограничений.

Этот индекс постоянно обновляется по мере выпуска новых моделей и уточнения эталонов. Мы рекомендуем вам изучить эти ресурсы, чтобы найти идеальное решение для вашего следующего проекта по компьютерному зрению. Если вы ищете решения корпоративного уровня с частным лицензированием, посетите нашу страницу Лицензирование. Счастливого сравнения!


Комментарии