YOLOv8 vs YOLO11: Evolução da deteção de objectos em tempo real
A escolha da arquitetura de visão por computador correta é uma decisão crítica que tem impacto na velocidade, precisão e escalabilidade dos seus projectos de IA. Este guia fornece uma comparação técnica aprofundada entre Ultralytics YOLOv8um padrão da indústria amplamente adotado, lançado em 2023, e o Ultralytics YOLO11a mais recente evolução da série YOLO , concebida para uma eficiência e desempenho superiores. Analisaremos as suas diferenças arquitectónicas, as métricas de referência e os casos de utilização ideais para o ajudar a selecionar o melhor modelo para as suas necessidades.
Ultralytics YOLOv8
Autores: Glenn Jocher, Ayush Chaurasia e Jing Qiu
Organização:Ultralytics
Data: 2023-01-10
GitHubultralytics
Docsyolov8
Lançado no início de 2023, YOLOv8 constituiu um marco significativo na história da deteção de objectos. Introduziu uma estrutura unificada que suporta várias tarefas de visão computacional - incluindo deteção, segmentação de instâncias, estimativa de pose e classificação de imagens - numúnico repositório. YOLOv8 passou de uma deteção baseada em âncoras para uma abordagem sem âncoras, o que simplifica o design e melhora a generalização entre diferentes formas de objectos.
Arquitetura e Principais Características
YOLOv8 substituiu os módulos C3 presentes no YOLOv5 pelo módulo C2f (Cross-Stage Partial bottleneck with two convolutions). Esta alteração melhorou o fluxo de gradiente e a integração de caraterísticas, mantendo uma pegada leve. A arquitetura também apresenta uma cabeça desacoplada, separando as tarefas de objetividade, classificação e regressão para aumentar a precisão.
Legado de fiabilidade
YOLOv8 foi testado em milhares de aplicações comerciais, desde a automatização da produção até aos veículos autónomos, estabelecendo uma reputação de estabilidade e facilidade de implementação.
Forças e Fraquezas
- Forças:
- Ecossistema maduro: Apoiado por uma vasta gama de tutoriais da comunidade, integrações e guias de implantação.
- Versatilidade: Suporta nativamente OBB (Oriented Bounding Box) e classificação juntamente com a deteção padrão.
- Estabilidade comprovada: Uma escolha segura para ambientes de produção que requerem um modelo com um longo track .
- Fraquezas:
- Eficiência de velocidade: Embora rápido, é superado pelo YOLO11 em termos de velocidade de inferência CPU e eficiência de parâmetros.
- Requisitos de computação: As variantes maiores (L, X) exigem mais VRAM e FLOPs em comparação com os equivalentes YOLO11 optimizados.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
Ultralytics YOLO11
Autores: Glenn Jocher e Jing Qiu
Organização:Ultralytics
Data: 2024-09-27
GitHubultralytics
Docsyolo11
YOLO11 representa a vanguarda da família de modelos Ultralytics . Concebido para redefinir a inferência em tempo real, baseia-se nos sucessos do YOLOv8 , mas introduz refinamentos arquitectónicos substanciais. YOLO11 concentra-se em maximizar a precisão e minimizar o custo computacional, tornando-o a principal escolha para aplicações modernas de IA, desde dispositivos de ponta até servidores em nuvem.
Arquitetura e Principais Características
YOLO11 introduz o bloco C3k2 e o módulo C2PSA (Cross-Stage Partial with Spatial Attention). Estes componentes melhoram a capacidade do modelo para extrair caraterísticas complexas e lidar com a oclusão de forma mais eficaz do que nas iterações anteriores. A arquitetura é otimizada para velocidade, proporcionando tempos de processamento significativamente mais rápidos em CPUs - um fator crítico para implantações de IA de borda onde os recursos GPU podem não estar disponíveis.
O modelo mantém a interface unificada caraterística do Ultralytics, garantindo que os programadores possam alternar entre tarefas como OBB ou segmentação sem alterar o seu fluxo de trabalho.
Forças e Fraquezas
- Forças:
- Eficiência superior: Atinge maior mAP com até 22% menos parâmetros do que YOLOv8, reduzindo o tamanho do modelo e as necessidades de armazenamento.
- Inferência mais rápida: Optimizado especificamente para hardware moderno, oferecendo velocidades mais rápidas em backends CPU e GPU .
- Extração de caraterísticas melhorada: A nova espinha dorsal melhora a deteção de pequenos objectos e o desempenho em cenas desordenadas.
- Menor uso de memória: Requer menos memória CUDA durante o treinamento em comparação com modelos baseados em transformadores como RT-DETRpermitindo o treinamento em hardware mais acessível.
- Fraquezas:
- Versão mais recente: Sendo um modelo recente, as ferramentas específicas de terceiros podem demorar algum tempo a atualizar totalmente o suporte, embora o ecossistema principal Ultralytics o suporte desde o primeiro dia.
from ultralytics import YOLO
# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
Comparação Direta de Desempenho
A comparação abaixo destaca os ganhos de eficiência do YOLO11. Embora YOLOv8 continue a ser um concorrente poderoso, YOLO11 fornece consistentemente uma maior precisãomAP) com uma complexidade computacional reduzida (FLOPs) e velocidades de inferência mais rápidas. Isso é particularmente percetível nos modelos "Nano" e "Small", onde o YOLO11n atinge um mAP de 39,5 em comparação com os 37,3 do YOLOv8n, tudo isso enquanto funciona significativamente mais rápido na CPU.
| Modelo | tamanho (pixels) | mAPval 50-95 | Velocidade CPU ONNX (ms) | Velocidade T4 TensorRT10 (ms) | parâmetros (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Análise métrica
YOLO11 demonstra uma clara vantagem no compromisso velocidade-precisão. Por exemplo, o modelo YOLO11l ultrapassa o YOLOv8l em termos de exatidão (+0,5 mAP), utilizando cerca de 42% menos parâmetros e funcionando 36% mais rápido no CPU.
Ecossistema e facilidade de utilização
Ambos os modelos beneficiam do robusto ecossistemaUltralytics , que foi concebido para democratizar a IA, tornando a tecnologia de ponta acessível a todos.
- API unificada: Alternar entre YOLOv8 e YOLO11 é tão simples como alterar a cadeia de modelos de
yolov8n.ptparayolo11n.pt. Não é necessário refactorizar o código. - Eficiência de treinamento: Ultralytics fornece conjuntos de dados de descarregamento automático e pesos pré-treinados, simplificando o pipeline desde a recolha de dados até ao treino do modelo.
- Versatilidade de implantação: Ambos os modelos suportam a exportação com um clique para formatos como ONNX, TensorRT, CoreML e TFLite, facilitando a implantação em diversos hardwares, incluindo Raspberry Pis, telefones celulares e instâncias de nuvem.
- Bem mantido: Atualizações frequentes garantem a compatibilidade com as versões mais recentes do PyTorch e CUDA, com o apoio de uma comunidade ativa no Discord e no GitHub.
Conclusão e Recomendações
Enquanto YOLOv8 continua a ser um modelo fiável e altamente capaz, adequado para a manutenção de sistemas antigos, YOLO11 é a recomendação clara para todos os novos desenvolvimentos.
- Escolha YOLO11 se: Necessita da maior precisão possível, de velocidades de inferência mais rápidas (especialmente na CPU), ou está a implementar em dispositivos de periferia com recursos limitados, onde a memória e o armazenamento são de primeira qualidade. As suas melhorias arquitectónicas proporcionam uma base à prova de futuro para aplicações comerciais.
- Escolha YOLOv8 se: Tem um pipeline existente fortemente ajustado para comportamentos específicos da v8 ou está limitado por requisitos de projeto rigorosos que impedem a atualização para a arquitetura mais recente.
Para os interessados em explorar outras arquitecturas, os documentos Ultralytics também abrangem modelos como YOLOv9, YOLOv10e RT-DETR. Pode ver comparações mais alargadas na nossa página de comparação de modelos.