YOLOv8 vs YOLO11: Uma comparação técnica
A comparação entreYOLOv8 Ultralytics YOLOv8 e YOLO11 para deteção de objectos revela avanços na visão por computador em tempo real. Ambos os modelos, desenvolvidos pela Ultralytics, foram concebidos para velocidade e precisão, mas respondem a necessidades ligeiramente diferentes e baseiam-se em escolhas arquitectónicas distintas. Esta página fornece uma comparação técnica detalhada para ajudar os utilizadores a compreender as suas principais diferenças e aplicações ideais.
YOLOv8 Descrição geral
YOLOv8, introduzido pela Ultralytics em 2023-01-10, representa uma iteração significativa na série YOLO . Da autoria de Glenn Jocher, Ayush Chaurasia e Jing Qiu, YOLOv8 centra-se na versatilidade e facilidade de utilização numa série de tarefas de visão, incluindo deteção de objectos, segmentação, classificação e estimativa de pose. Baseia-se em arquitecturas YOLO anteriores, mas incorpora melhorias para um melhor desempenho e flexibilidade. A documentaçãoYOLOv8 realça a sua facilidade de utilização, tornando-o acessível tanto para principiantes como para profissionais experientes no domínio da deteção de objectos.
Arquitetura e caraterísticas principais:
YOLOv8 mantém um paradigma de deteção de fase única e sem âncoras, racionalizando a arquitetura do modelo e simplificando o processo de formação. As principais caraterísticas da arquitetura incluem:
- Backbone: Utiliza um backbone CSPDarknet refinado, optimizado para a eficiência da extração de caraterísticas.
- Pescoço: Utiliza uma rede parcial C2f de fase cruzada no pescoço para uma melhor fusão de caraterísticas, melhorando o fluxo de informação e a propagação do gradiente.
- Cabeça: Uma cabeça de deteção dissociada separa as tarefas de classificação e regressão, contribuindo para uma maior precisão e uma convergência mais rápida.
Métricas de desempenho:
YOLOv8 atinge o desempenho mais avançado em vários tamanhos de modelos. Para a deteção de objectos no conjunto de dados COCO, YOLOv8x, a maior variante, atinge 53,9 mAPval50-95, enquanto a versão nano, YOLOv8n, atinge 37,3 mAPval50-95, equilibrando precisão e velocidade. As velocidades de inferência variam de 80,4 ms na CPU ONNX para YOLOv8n a 479,1 ms para YOLOv8x, oferecendo opções para diferentes restrições computacionais. Explore as métricas de desempenho detalhadas YOLOv8 .
Casos de utilização:
A versatilidade do YOLOv8 torna-o adequado para um vasto espetro de aplicações, desde sistemas de alarme de segurança e implementações em cidades inteligentes até aplicações avançadas nos sectores da saúde e da indústria. O seu desempenho equilibrado torna-o uma escolha forte para projectos que exigem uma combinação de precisão e velocidade.
Pontos fortes:
- Suporte versátil de tarefas: Lida com deteção, segmentação, classificação e estimativa de pose.
- Elevada precisão e velocidade: Oferece um bom equilíbrio entre o mAP e a velocidade de inferência.
- Fácil de utilizar: bem documentado e fácil de utilizar com o Ultralytics Python e CLI interfaces.
- Comunidade ativa: Benefits from a large community and continuous updates from Ultralytics.
Pontos fracos:
- Intensivo em recursos: Os modelos de maior dimensão requerem recursos computacionais significativos para a sua formação e implementação.
- Necessidades de otimização: Pode exigir uma otimização adicional para ambientes com recursos extremamente limitados.
YOLO11 Descrição geral
YOLO11O YOLO , o mais recente modelo da Ultralytics, lançado em 2024-09-27, e da autoria de Glenn Jocher e Jing Qiu, baseia-se na série YOLO , com o objetivo de obter mais avanços em termos de eficiência e desempenho. Embora partilhe a filosofia central de velocidade e precisão, YOLO11 introduz refinamentos arquitectónicos concebidos para otimizar a velocidade de inferência sem comprometer significativamente a precisão. A documentaçãoYOLO11 destaca a sua natureza de vanguarda e a sua adequação a aplicações em tempo real.
Arquitetura e caraterísticas principais:
YOLO11 também adopta uma abordagem de fase única e sem âncoras, centrando-se numa conceção simplificada e numa computação eficiente. Os principais aspectos arquitectónicos incluem:
- Backbone eficiente: Utiliza uma arquitetura de backbone optimizada que reduz a sobrecarga computacional enquanto mantém as capacidades de extração de caraterísticas.
- Desenho do pescoço: Apresenta uma estrutura de pescoço refinada que melhora a agregação de caraterísticas com menos parâmetros, contribuindo para uma inferência mais rápida.
- Cabeça optimizada: A cabeça de deteção foi concebida para uma latência mínima, dando prioridade à velocidade nas camadas de previsão finais.
Métricas de desempenho:
YOLO11 demonstra um desempenho competitivo com foco em melhorias de velocidade. Para a deteção de objectos no conjunto de dados COCO, o YOLO11x atinge um mAPval50-95 ligeiramente superior de 54,7 em comparação com o YOLOv8x, mantendo velocidades de inferência mais rápidas na CPU e atingindo velocidades comparáveis na GPU. O modelo YOLO11n atinge 39,5 mAPval50-95, mostrando melhorias em relação ao YOLOv8n. As velocidades de inferência são notavelmente mais rápidas na CPU, com o YOLO11n a 56,1 ms e o YOLO11x a 462,8 ms, o que o torna adequado para aplicações CPU. Consulte as métricas de desempenhoYOLO11 para obter referências detalhadas.
Casos de utilização:
YOLO11 é particularmente adequado para aplicações em que a velocidade de inferência é fundamental, como a análise de vídeo em tempo real, robótica e dispositivos de ponta com recursos computacionais limitados. A sua eficiência torna-o ideal para ser utilizado em cenários que exigem uma deteção rápida de objectos sem sacrificar a precisão. As aplicações incluem gestão de resíduos, conservação ambiental e soluções para automóveis.
Pontos fortes:
- Velocidade de inferência superior: Concebido para uma inferência mais rápida, especialmente na CPU.
- Precisão competitiva: Mantém uma elevada precisão, excedendo frequentemente YOLOv8 em modelos de menor dimensão.
- Arquitetura eficiente: Optimizada para ambientes com recursos limitados e implementação de ponta.
- Modelo Ultralytics mais recente: Beneficia dos mais recentes avanços e do apoio da Ultralytics.
Pontos fracos:
- Ganhos marginais de precisão em modelos maiores: Os modelos maiores YOLO11 apresentam apenas ligeiras melhorias de precisão em relação ao YOLOv8 , continuando a ser computacionalmente intensivos.
- Modelo mais recente: Por ser mais recente, pode ter uma comunidade mais pequena e menos integrações de terceiros em comparação com o YOLOv8.
Tabela de comparação de modelos
Modelo | tamanho (pixéis) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Conclusão
A escolha entre YOLOv8 e YOLO11 depende dos requisitos específicos da aplicação. YOLOv8 oferece uma solução robusta e versátil adequada a uma vasta gama de tarefas, equilibrando a precisão e a velocidade de forma eficaz. É um modelo maduro e bem suportado, ideal para as necessidades de deteção de objectos para fins gerais. YOLO11, por outro lado, foi concebido para otimização da velocidade, o que o torna uma escolha superior quando o tempo de inferência é crítico, especialmente em cenários de computação de ponta ou com CPU. Para aplicações que exigem o desempenho em tempo real mais rápido possível com precisão competitiva, YOLO11 é a opção preferida.
Os utilizadores interessados em explorar outros modelos também podem considerar:
- YOLOv5: Para um modelo bem estabelecido e amplamente utilizado com uma grande comunidade. Comparação entreYOLOv5 e YOLOv8 .
- YOLOv9: Para modelos centrados em melhorias de precisão e inovações arquitectónicas. Documentação do YOLOv9.
- FastSAM: Para tarefas de segmentação extremamente rápidas. DocumentaçãoFastSAM .