YOLOv5 vs YOLO11: Uma Comparação Técnica
Escolher o modelo de detecção de objetos certo é uma decisão crítica que equilibra a necessidade de precisão, velocidade e eficiência de recursos. Esta página fornece uma comparação técnica detalhada entre dois modelos de referência da Ultralytics: o amplamente adotado Ultralytics YOLOv5 e o Ultralytics YOLO11 de última geração. Enquanto YOLOv5 estabeleceu um padrão da indústria para desempenho e facilidade de uso, YOLO11 representa a próxima evolução, oferecendo precisão superior, maior versatilidade e eficiência aprimorada dentro do mesmo ecossistema Ultralytics poderoso.
Ultralytics YOLOv5: O Padrão da Indústria Estabelecido
Lançado em 2020, o YOLOv5 tornou-se rapidamente um dos modelos de deteção de objetos mais populares do mundo. A sua reputação é construída sobre uma combinação excecional de velocidade, fiabilidade e facilidade de utilização, tornando-o uma escolha de referência para inúmeros desenvolvedores e investigadores.
Detalhes Técnicos:
- Autores: Glenn Jocher
- Organização: Ultralytics
- Data: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- Documentação: https://docs.ultralytics.com/models/yolov5/
Arquitetura e Principais Características
O YOLOv5 é construído em PyTorch e apresenta um backbone CSPDarknet53 combinado com um neck PANet para agregação de recursos eficaz. Sua arquitetura é altamente escalável, oferecendo uma variedade de modelos, desde o pequeno e rápido YOLOv5n até o grande e preciso YOLOv5x. Uma característica fundamental do YOLOv5 é seu head de detecção baseado em âncoras, que era altamente eficaz na época de seu lançamento.
Pontos Fortes
- Velocidade de Inferência Excepcional: YOLOv5 é altamente otimizado para inferência rápida, tornando-o uma escolha robusta para aplicações em tempo real, especialmente em hardware de GPU.
- Ecossistema Maduro: Como um modelo bem estabelecido, o YOLOv5 beneficia de uma comunidade massiva, tutoriais extensos e amplo suporte de terceiros. É testado em batalha em inúmeros ambientes de produção.
- Facilidade de Uso: Reconhecido por sua API simples e documentação abrangente, o YOLOv5 permite prototipagem e implementação rápidas. O modelo é perfeitamente integrado ao ecossistema Ultralytics, incluindo o Ultralytics HUB para treinamento sem código.
- Eficiência no Treinamento: O YOLOv5 oferece um processo de treinamento eficiente com pesos pré-treinados prontamente disponíveis, permitindo transfer learning eficaz e ciclos de desenvolvimento mais rápidos.
Fraquezas
- Detecção Baseada em Âncoras: Sua dependência de caixas delimitadoras (anchor boxes) predefinidas pode, às vezes, exigir um ajuste cuidadoso para conjuntos de dados com objetos de formato incomum, uma limitação abordada por detectores sem âncoras mais recentes.
- Teto de Precisão: Embora ainda seja muito preciso, seu desempenho em benchmarks como COCO foi superado por arquiteturas mais recentes como YOLO11.
Casos de Uso Ideais
O YOLOv5 continua sendo uma excelente escolha para aplicações onde velocidade e estabilidade são fundamentais:
- Edge Computing: Suas variantes menores são perfeitas para implementação em dispositivos com recursos limitados, como Raspberry Pi e NVIDIA Jetson.
- Vigilância em Tempo Real: Alimentando sistemas de segurança e aplicações de monitoramento que exigem alto FPS.
- Automação Industrial: Usado para controle de qualidade e automação de processos em ambientes de manufatura.
Ultralytics YOLO11: A próxima evolução em IA de visão
YOLO11 é o mais recente modelo de ponta da Ultralytics, projetado para expandir os limites do que é possível em visão computacional. Ele se baseia nos sucessos de seus antecessores, incluindo o YOLOv8, para oferecer melhorias significativas em precisão, velocidade e versatilidade.
Detalhes Técnicos:
- Autores: Glenn Jocher, Jing Qiu
- Organização: Ultralytics
- Data: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Documentação: https://docs.ultralytics.com/models/yolo11/
Arquitetura e Principais Características
O YOLO11 introduz uma arquitetura de rede refinada com recursos avançados de extração de recursos e um design simplificado. Um grande avanço é seu head de detecção sem âncoras, que melhora a generalização e simplifica o processo de treinamento. Este design moderno permite que o YOLO11 alcance maior precisão com um uso mais eficiente de parâmetros, levando a velocidades de inferência mais rápidas e menores demandas computacionais.
Pontos Fortes
- Desempenho de Última Geração: YOLO11 define um novo padrão de precisão, alcançando pontuações mAP mais altas do que o YOLOv5 em todos os tamanhos de modelo.
- Versatilidade Aprimorada: YOLO11 é uma verdadeira estrutura multitarefa, suportando detecção de objetos, segmentação de instâncias, classificação de imagens, estimativa de pose e caixas delimitadoras orientadas (OBB) dentro de um único modelo unificado.
- Eficiência Superior: O modelo é altamente eficiente, oferecendo uma melhor relação velocidade-precisão. Notavelmente, demonstra uma inferência significativamente mais rápida em CPUs em comparação com o YOLOv5, tornando-o acessível para uma gama mais ampla de hardware. Também requer menos memória para treinamento e inferência do que muitas outras arquiteturas.
- Experiência do Usuário Simplificada: Como parte do ecossistema Ultralytics, o YOLO11 mantém o mesmo compromisso com a facilidade de uso com uma API Python simples, CLI poderosa e documentação extensa.
Fraquezas
- Demanda Computacional para Modelos Grandes: Embora altamente eficientes, os maiores modelos YOLO11 (por exemplo, YOLO11x) ainda exigem recursos computacionais substanciais para alcançar a máxima precisão.
- Integrações em Evolução: Por ser um modelo mais recente, o ecossistema de ferramentas e integrações de terceiros está crescendo rapidamente, mas pode ainda não ser tão extenso quanto o do já estabelecido YOLOv5.
Casos de Uso Ideais
O YOLO11 é a escolha ideal para novos projetos que exigem os mais altos níveis de precisão e flexibilidade:
- Robótica Avançada: Permitindo a interação precisa com objetos e a navegação em ambientes complexos e dinâmicos.
- Saúde e Imagens Médicas: Suporte a tarefas como detecção de tumores, onde a alta precisão é fundamental.
- Cidades Inteligentes: Alimentando gestão de tráfego sofisticada e sistemas de segurança pública.
- Análise de Varejo: Melhorando o gerenciamento de estoque e a análise do comportamento do cliente com maior precisão.
Comparação Direta de Desempenho: YOLOv5 vs. YOLO11
As métricas de desempenho ilustram claramente os avanços feitos com o YOLO11. De modo geral, os modelos YOLO11 oferecem um aumento significativo no mAP, mantendo ou até mesmo melhorando a velocidade de inferência. Por exemplo, o YOLO11s atinge um mAP de 47,0, que é comparável ao YOLOv5l, mas com muito menos parâmetros e inferência de CPU significativamente mais rápida. Da mesma forma, o YOLO11m supera o YOLOv5x em precisão (51,5 vs. 50,7 mAP) enquanto é mais de 4 vezes mais rápido em uma CPU.
Modelo | tamanho (pixels) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4 TensorRT10 (ms) |
parâmetros (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Conclusão: Qual Modelo Você Deve Escolher?
Embora o YOLOv5 permaneça um modelo sólido e confiável, o YOLO11 é o sucessor claro e a escolha recomendada para quase todos os novos projetos. Ele oferece um salto substancial no desempenho, proporcionando maior precisão, maior versatilidade de tarefas e maior eficiência sem sacrificar a facilidade de uso que tornou seus antecessores tão populares.
-
Escolha YOLOv5 se estiver trabalhando em um projeto legado que já o utiliza, ou se sua principal restrição for a implementação em hardware onde suas otimizações específicas de velocidade de GPU fornecem uma vantagem crítica.
-
Escolha o YOLO11 para qualquer nova aplicação. Sua precisão superior, design sem âncoras, capacidades multi-tarefa e excelente desempenho em CPU e GPU o tornam a solução mais poderosa, flexível e à prova de futuro.
Ambos os modelos são apoiados pelo robusto ecossistema Ultralytics, garantindo uma experiência de desenvolvimento tranquila, com excelente suporte e documentação.
Explore Outras Comparações de Modelos
Se você estiver interessado em como esses modelos se comparam a outras arquiteturas líderes, confira nossas outras páginas de comparação: