Ir para o conteúdo

YOLOv8 vs YOLO11: Evolução da deteção de objectos em tempo real

A escolha da arquitetura de visão por computador correta é uma decisão crítica que tem impacto na velocidade, precisão e escalabilidade dos seus projectos de IA. Este guia fornece uma comparação técnica aprofundada entre Ultralytics YOLOv8um padrão da indústria amplamente adotado, lançado em 2023, e o Ultralytics YOLO11a mais recente evolução da série YOLO , concebida para uma eficiência e desempenho superiores. Analisaremos as suas diferenças arquitectónicas, as métricas de referência e os casos de utilização ideais para o ajudar a selecionar o melhor modelo para as suas necessidades.

Ultralytics YOLOv8

Autores: Glenn Jocher, Ayush Chaurasia e Jing Qiu
Organização:Ultralytics
Data: 2023-01-10
GitHubultralytics
Docsyolov8

Lançado no início de 2023, YOLOv8 constituiu um marco significativo na história da deteção de objectos. Introduziu uma estrutura unificada que suporta várias tarefas de visão computacional - incluindo deteção, segmentação de instâncias, estimativa de pose e classificação de imagens - numúnico repositório. YOLOv8 passou de uma deteção baseada em âncoras para uma abordagem sem âncoras, o que simplifica o design e melhora a generalização entre diferentes formas de objectos.

Arquitetura e Principais Características

YOLOv8 substituiu os módulos C3 presentes no YOLOv5 pelo módulo C2f (Cross-Stage Partial bottleneck with two convolutions). Esta alteração melhorou o fluxo de gradiente e a integração de caraterísticas, mantendo uma pegada leve. A arquitetura também apresenta uma cabeça desacoplada, separando as tarefas de objetividade, classificação e regressão para aumentar a precisão.

Legado de fiabilidade

YOLOv8 foi testado em milhares de aplicações comerciais, desde a automatização da produção até aos veículos autónomos, estabelecendo uma reputação de estabilidade e facilidade de implementação.

Forças e Fraquezas

  • Forças:
    • Ecossistema maduro: Apoiado por uma vasta gama de tutoriais da comunidade, integrações e guias de implantação.
    • Versatilidade: Suporta nativamente OBB (Oriented Bounding Box) e classificação juntamente com a deteção padrão.
    • Estabilidade comprovada: Uma escolha segura para ambientes de produção que requerem um modelo com um longo track .
  • Fraquezas:
    • Eficiência de velocidade: Embora rápido, é superado pelo YOLO11 em termos de velocidade de inferência CPU e eficiência de parâmetros.
    • Requisitos de computação: As variantes maiores (L, X) exigem mais VRAM e FLOPs em comparação com os equivalentes YOLO11 optimizados.
from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

Saiba mais sobre o YOLOv8.

Ultralytics YOLO11

Autores: Glenn Jocher e Jing Qiu
Organização:Ultralytics
Data: 2024-09-27
GitHubultralytics
Docsyolo11

YOLO11 representa a vanguarda da família de modelos Ultralytics . Concebido para redefinir a inferência em tempo real, baseia-se nos sucessos do YOLOv8 , mas introduz refinamentos arquitectónicos substanciais. YOLO11 concentra-se em maximizar a precisão e minimizar o custo computacional, tornando-o a principal escolha para aplicações modernas de IA, desde dispositivos de ponta até servidores em nuvem.

Arquitetura e Principais Características

YOLO11 introduz o bloco C3k2 e o módulo C2PSA (Cross-Stage Partial with Spatial Attention). Estes componentes melhoram a capacidade do modelo para extrair caraterísticas complexas e lidar com a oclusão de forma mais eficaz do que nas iterações anteriores. A arquitetura é otimizada para velocidade, proporcionando tempos de processamento significativamente mais rápidos em CPUs - um fator crítico para implantações de IA de borda onde os recursos GPU podem não estar disponíveis.

O modelo mantém a interface unificada caraterística do Ultralytics, garantindo que os programadores possam alternar entre tarefas como OBB ou segmentação sem alterar o seu fluxo de trabalho.

Forças e Fraquezas

  • Forças:
    • Eficiência superior: Atinge maior mAP com até 22% menos parâmetros do que YOLOv8, reduzindo o tamanho do modelo e as necessidades de armazenamento.
    • Inferência mais rápida: Optimizado especificamente para hardware moderno, oferecendo velocidades mais rápidas em backends CPU e GPU .
    • Extração de caraterísticas melhorada: A nova espinha dorsal melhora a deteção de pequenos objectos e o desempenho em cenas desordenadas.
    • Menor uso de memória: Requer menos memória CUDA durante o treinamento em comparação com modelos baseados em transformadores como RT-DETRpermitindo o treinamento em hardware mais acessível.
  • Fraquezas:
    • Versão mais recente: Sendo um modelo recente, as ferramentas específicas de terceiros podem demorar algum tempo a atualizar totalmente o suporte, embora o ecossistema principal Ultralytics o suporte desde o primeiro dia.
from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

Saiba mais sobre o YOLO11.

Comparação Direta de Desempenho

A comparação abaixo destaca os ganhos de eficiência do YOLO11. Embora YOLOv8 continue a ser um concorrente poderoso, YOLO11 fornece consistentemente uma maior precisãomAP) com uma complexidade computacional reduzida (FLOPs) e velocidades de inferência mais rápidas. Isso é particularmente percetível nos modelos "Nano" e "Small", onde o YOLO11n atinge um mAP de 39,5 em comparação com os 37,3 do YOLOv8n, tudo isso enquanto funciona significativamente mais rápido na CPU.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
parâmetros
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Análise métrica

YOLO11 demonstra uma clara vantagem no compromisso velocidade-precisão. Por exemplo, o modelo YOLO11l ultrapassa o YOLOv8l em termos de exatidão (+0,5 mAP), utilizando cerca de 42% menos parâmetros e funcionando 36% mais rápido no CPU.

Ecossistema e facilidade de utilização

Ambos os modelos beneficiam do robusto ecossistemaUltralytics , que foi concebido para democratizar a IA, tornando a tecnologia de ponta acessível a todos.

  • API unificada: Alternar entre YOLOv8 e YOLO11 é tão simples como alterar a cadeia de modelos de yolov8n.pt para yolo11n.pt. Não é necessário refactorizar o código.
  • Eficiência de treinamento: Ultralytics fornece conjuntos de dados de descarregamento automático e pesos pré-treinados, simplificando o pipeline desde a recolha de dados até ao treino do modelo.
  • Versatilidade de implantação: Ambos os modelos suportam a exportação com um clique para formatos como ONNX, TensorRT, CoreML e TFLite, facilitando a implantação em diversos hardwares, incluindo Raspberry Pis, telefones celulares e instâncias de nuvem.
  • Bem mantido: Atualizações frequentes garantem a compatibilidade com as versões mais recentes do PyTorch e CUDA, com o apoio de uma comunidade ativa no Discord e no GitHub.

Conclusão e Recomendações

Enquanto YOLOv8 continua a ser um modelo fiável e altamente capaz, adequado para a manutenção de sistemas antigos, YOLO11 é a recomendação clara para todos os novos desenvolvimentos.

  • Escolha YOLO11 se: Necessita da maior precisão possível, de velocidades de inferência mais rápidas (especialmente na CPU), ou está a implementar em dispositivos de periferia com recursos limitados, onde a memória e o armazenamento são de primeira qualidade. As suas melhorias arquitectónicas proporcionam uma base à prova de futuro para aplicações comerciais.
  • Escolha YOLOv8 se: Tem um pipeline existente fortemente ajustado para comportamentos específicos da v8 ou está limitado por requisitos de projeto rigorosos que impedem a atualização para a arquitetura mais recente.

Para os interessados em explorar outras arquitecturas, os documentos Ultralytics também abrangem modelos como YOLOv9, YOLOv10e RT-DETR. Pode ver comparações mais alargadas na nossa página de comparação de modelos.


Comentários