Ir para o conteúdo

YOLOv8 vs YOLO11: Evolução da Detecção de Objetos em Tempo Real

Escolher a arquitetura de visão computacional certa é uma decisão crítica que afeta a velocidade, a precisão e a escalabilidade de seus projetos de IA. Este guia fornece uma comparação técnica detalhada entre o Ultralytics YOLOv8, um padrão da indústria amplamente adotado lançado em 2023, e o Ultralytics YOLO11, a mais recente evolução da série YOLO projetada para eficiência e desempenho superiores. Analisaremos suas diferenças arquitetônicas, métricas de benchmark e casos de uso ideais para ajudá-lo a selecionar o melhor modelo para suas necessidades.

Ultralytics YOLOv8

Autores: Glenn Jocher, Ayush Chaurasia e Jing Qiu
Organização:Ultralytics
Data: 2023-01-10
GitHub:https://github.com/ultralytics/ultralytics
Documentação:https://docs.ultralytics.com/models/yolov8/

Lançado no início de 2023, o YOLOv8 marcou um marco significativo na história da detecção de objetos. Ele introduziu uma estrutura unificada que suporta múltiplas tarefas de visão computacional—incluindo detecção, segmentação de instâncias, estimativa de pose e classificação de imagem—dentro de um único repositório. O YOLOv8 abandonou a detecção baseada em âncoras para uma abordagem sem âncoras, o que simplifica o design e melhora a generalização em diferentes formatos de objetos.

Arquitetura e Principais Características

O YOLOv8 substituiu os módulos C3 encontrados no YOLOv5 pelo módulo C2f (gargalo parcial de estágio cruzado com duas convoluções). Essa alteração melhorou o fluxo de gradiente e a integração de recursos, mantendo uma pegada leve. A arquitetura também apresenta um cabeçalho desacoplado, separando as tarefas de objetividade, classificação e regressão para aumentar a precisão.

Legado de Confiabilidade

YOLOv8 foi testado em milhares de aplicações comerciais, desde a automação de fabrico até veículos autónomos, estabelecendo uma reputação de estabilidade e facilidade de implementação.

Forças e Fraquezas

  • Forças:
    • Ecossistema Maduro: Suportado por uma vasta gama de tutoriais da comunidade, integrações e guias de implantação.
    • Versatilidade: Suporta nativamente OBB (Oriented Bounding Box) e classification, juntamente com a detection padrão.
    • Estabilidade Comprovada: Uma escolha segura para ambientes de produção que exigem um modelo com um longo histórico.
  • Fraquezas:
    • Eficiência de Velocidade: Embora seja rápido, o YOLO11 o supera em velocidades de inferência de CPU e eficiência de parâmetros.
    • Requisitos Computacionais: Variantes maiores (L, X) exigem mais VRAM e FLOPs em comparação com os equivalentes YOLO11 otimizados.
from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

Saiba mais sobre o YOLOv8.

Ultralytics YOLO11

Autores: Glenn Jocher e Jing Qiu
Organização:Ultralytics
Data: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
Documentação:https://docs.ultralytics.com/models/yolo11/

YOLO11 representa o que há de mais moderno na família de modelos Ultralytics. Projetado para redefinir a inferência em tempo real, baseia-se nos sucessos do YOLOv8, mas introduz refinamentos arquitetónicos substanciais. O YOLO11 concentra-se em maximizar a precisão, minimizando o custo computacional, tornando-o a principal escolha para aplicações de IA modernas, desde dispositivos de borda a servidores de nuvem.

Arquitetura e Principais Características

O YOLO11 introduz o bloco C3k2 e o módulo C2PSA (Cross-Stage Partial with Spatial Attention). Estes componentes melhoram a capacidade do modelo de extrair características complexas e lidar com a oclusão de forma mais eficaz do que as iterações anteriores. A arquitetura é otimizada para velocidade, oferecendo tempos de processamento significativamente mais rápidos em CPUs — um fator crítico para implementações de Edge AI onde os recursos de GPU podem não estar disponíveis.

O modelo mantém a interface unificada característica da Ultralytics, garantindo que os desenvolvedores possam alternar entre tarefas como OBB ou segmentação sem alterar seu fluxo de trabalho.

Forças e Fraquezas

  • Forças:
    • Eficiência Superior: Atinge um mAP mais alto com até 22% menos parâmetros do que o YOLOv8, reduzindo o tamanho do modelo e as necessidades de armazenamento.
    • Inferência Mais Rápida: Otimizado especificamente para hardware moderno, oferecendo velocidades mais rápidas em backends de CPU e GPU.
    • Extração de Recursos Aprimorada: O novo backbone melhora a detecção de pequenos objetos e o desempenho em cenas desordenadas.
    • Menor Uso de Memória: Requer menos memória CUDA durante o treinamento em comparação com modelos baseados em transformer como o RT-DETR, permitindo o treinamento em hardware mais acessível.
  • Fraquezas:
    • Lançamento Mais Recente: Como um modelo recente, ferramentas específicas de nicho de terceiros podem levar tempo para atualizar totalmente o suporte, embora o ecossistema principal da Ultralytics o suporte desde o primeiro dia.
from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

Saiba mais sobre o YOLO11.

Comparação Direta de Desempenho

A comparação abaixo destaca os ganhos de eficiência do YOLO11. Embora o YOLOv8 continue sendo um concorrente poderoso, o YOLO11 oferece consistentemente maior precisão (mAP) com complexidade computacional reduzida (FLOPs) e velocidades de inferência mais rápidas. Isso é particularmente notável nos modelos "Nano" e "Small", onde o YOLO11n atinge um 39,5 mAP em comparação com o 37,3 do YOLOv8n, tudo isso rodando significativamente mais rápido na CPU.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
parâmetros
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Análise de Métricas

O YOLO11 demonstra uma clara vantagem na relação velocidade-precisão. Por exemplo, o modelo YOLO11l supera o YOLOv8l em precisão (+0,5 mAP) enquanto usa aproximadamente 42% menos parâmetros e é executado 36% mais rápido na CPU.

Ecossistema e Facilidade de Uso

Ambos os modelos se beneficiam do robusto ecossistema Ultralytics, que foi projetado para democratizar a IA, tornando a tecnologia de ponta acessível a todos.

  • API Unificada: Alternar entre YOLOv8 e YOLO11 é tão simples quanto alterar a string do modelo de yolov8n.pt para yolo11n.pt. Nenhuma refatoração de código é necessária.
  • Eficiência no Treinamento: A Ultralytics fornece datasets de download automático e pesos pré-treinados, simplificando o pipeline desde a coleta de dados até o treinamento do modelo.
  • Versatilidade de Implantação: Ambos os modelos suportam exportação com um clique para formatos como ONNX, TensorRT, CoreML e TFLite, facilitando a implantação em diversos hardwares, incluindo Raspberry Pis, telefones celulares e instâncias na nuvem.
  • Bem Mantido: Atualizações frequentes garantem a compatibilidade com as versões mais recentes de PyTorch e CUDA, com o apoio de uma comunidade ativa no Discord e GitHub.

Conclusão e Recomendações

Embora o YOLOv8 continue sendo um modelo confiável e altamente capaz, adequado para manter sistemas legados, o YOLO11 é a recomendação clara para todo novo desenvolvimento.

  • Escolha YOLO11 se: Você precisa da maior precisão possível, velocidades de inferência mais rápidas (especialmente na CPU) ou está implantando em dispositivos de borda com recursos limitados, onde memória e armazenamento são premium. Suas melhorias arquitetônicas fornecem uma base à prova de futuro para aplicações comerciais.
  • Escolha YOLOv8 se: Você tem um pipeline existente fortemente ajustado para comportamentos específicos do v8 ou está limitado por requisitos de projeto estritos que impedem a atualização para a arquitetura mais recente.

Para aqueles interessados em explorar outras arquiteturas, a documentação do Ultralytics também cobre modelos como YOLOv9, YOLOv10 e RT-DETR. Você pode ver comparações mais amplas em nossa página de comparação de modelos.


Comentários