YOLOv5 vs YOLO11: Uma comparação técnica exaustiva
No panorama em rápida evolução da visão por computador, a escolha do modelo de deteção de objectos correto é fundamental para o sucesso do projeto. Dois dos marcos mais significativos neste domínio são YOLOv5 e o recentemente lançado YOLO11. Enquanto YOLOv5 estabeleceu um padrão lendário de facilidade de utilização e velocidade, YOLO11 ultrapassa os limites da precisão e da eficiência, tirando partido de anos de investigação e desenvolvimento.
Este guia fornece uma análise técnica detalhada destas duas arquitecturas, ajudando os programadores, investigadores e engenheiros a tomar decisões informadas para as suas aplicações de IA.
Ultralytics YOLOv5: O cavalo de batalha fiável
Lançado em 2020, YOLOv5 revolucionou a acessibilidade da deteção de objetos. Foi o primeiro modelo "You Only Look Once" implementado nativamente no PyTorchtornando-o incrivelmente fácil para os desenvolvedores treinarem e implantarem. Seu equilíbrio entre velocidade e precisão o tornou a escolha certa para tudo, desde inspeção industrial até veículos autônomos.
Detalhes Técnicos:
- Autores: Glenn Jocher
- Organização:Ultralytics
- Data: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- Documentos:https://docs.ultralytics.com/models/yolov5/
Principais Características e Arquitetura
YOLOv5 utiliza uma arquitetura baseada em âncoras. Introduziu um backbone CSPDarknet, que melhorou significativamente o fluxo de gradiente e reduziu o custo computacional em comparação com as iterações anteriores. O modelo utiliza um pescoço Path Aggregation Network (PANet) para aumentar o fluxo de informação e integra o aumento de dados Mosaic durante o treino, uma técnica que se tornou um padrão para melhorar a robustez do modelo contra objectos mais pequenos.
Pontos Fortes
YOLOv5 é conhecido pela sua estabilidade e maturidade. Com anos de testes pela comunidade, o ecossistema de tutoriais, integrações de terceiros e guias de implantação é vasto. É uma excelente escolha para sistemas antigos ou dispositivos de ponta em que já existem optimizações de hardware específicas para a sua arquitetura.
Ultralytics YOLO11: A evolução do estado da arte
Lançamento em finais de 2024, YOLO11 representa a vanguarda da IA de visão. Baseia-se nas lições aprendidas com o YOLOv5 e o YOLOv8 para fornecer um modelo que é mais rápido, mais preciso e mais eficiente em termos de computação.
Detalhes Técnicos:
- Autores: Glenn Jocher, Jing Qiu
- Organização:Ultralytics
- Data: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- Documentos:https://docs.ultralytics.com/models/yolo11/
Arquitetura e Principais Características
YOLO11 introduz refinamentos arquitectónicos significativos, incluindo o bloco C3k2 e os módulos C2PSA (Cross-Stage Partial with Spatial Attention). Ao contrário do YOLOv5, YOLO11 utiliza uma cabeça de deteção sem âncoras, o que simplifica o processo de treino, eliminando a necessidade de calcular manualmente as caixas de âncoras. Esta mudança de design melhora a generalização e permite que o modelo se adapte melhor a diversos conjuntos de dados.
Versatilidade inigualável
Uma das caraterísticas que definem o YOLO11 é o seu suporte nativo para múltiplas tarefas de visão computacional numa única estrutura. Enquanto YOLOv5 se concentrava principalmente na deteção (com suporte posterior para segmentação), YOLO11 foi construído desde o início para lidar com..:
- Detecção de Objetos
- Segmentação de Instância
- Classificação de Imagem
- Estimativa de Pose
- Caixas Delimitadoras Orientadas (OBB)
Esta versatilidade permite aos programadores resolver problemas complexos de robótica e análise sem mudar de estrutura.
Comparação de Desempenho
A transição do YOLOv5 para o YOLO11 produz ganhos substanciais de desempenho. As métricas demonstram que YOLO11 oferece um compromisso superior entre velocidade e precisão.
Precisão vs. Eficiência
YOLO11 alcança consistentemente uma maior precisão média (mAP) no conjunto de dados COCO em comparação com os modelos YOLOv5 de tamanho semelhante. Por exemplo, o modelo YOLO11m ultrapassa o modelo YOLOv5x, muito maior, em termos de precisão (51,5 vs 50,7 mAP), operando com uma fração dos parâmetros (20,1M vs 97,2M). Esta redução drástica no tamanho do modelo traduz-se em menores requisitos de memória durante o treino e a inferência, um fator crítico para a implementação em hardware de IA de ponta com recursos limitados.
Velocidade de Inferência
Graças às escolhas arquitectónicas optimizadas, YOLO11 destaca-se nas velocidades de inferência CPU . O modelo YOLO11n cria uma nova referência para aplicações em tempo real, registando apenas 56,1 ms na CPU com ONNX, significativamente mais rápido do que o seu antecessor.
Eficiência da memória
Os modelos Ultralytics YOLO11 foram concebidos para uma utilização óptima da memória. Em comparação com os detectores baseados em transformadores como o RT-DETRYOLO11 requer significativamente menos memória CUDA durante o treino, tornando-o acessível aos programadores com GPUs de consumo padrão.
| Modelo | tamanho (pixels) | mAPval 50-95 | Velocidade CPU ONNX (ms) | Velocidade T4 TensorRT10 (ms) | parâmetros (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Formação e experiência do programador
Ambos os modelos beneficiam do ecossistemaUltralytics abrangente, conhecido pela sua "facilidade de utilização".
Integração perfeita
YOLO11 está integrado no moderno ultralytics Pacote Python , que unifica todas as tarefas numa API simples. Isto permite a formação, validação e implementação em apenas algumas linhas de código.
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
Embora YOLOv5 tenha o seu próprio repositório dedicado, também pode ser facilmente carregado através do PyTorch Hub ou utilizado no ecossistema mais recente para determinadas tarefas. A documentação robusta para ambos os modelos garante que, quer esteja a realizar o ajuste de hiperparâmetros ou a exportar para o OpenVINOo processo é simplificado.
Benefícios para o ecossistema
Escolher um modelo Ultralytics significa ter acesso a um conjunto de ferramentas bem mantido. Desde a integração com o Comet para rastreamento de experimentos até o gerenciamento contínuo de conjuntos de dados, o ecossistema suporta todo o ciclo de vida do MLOps. Este desenvolvimento ativo garante que os patches de segurança e as melhorias de desempenho são regularmente fornecidos.
Casos de Uso Ideais
Quando escolher YOLOv5
- Hardware legado: Se tiver dispositivos de ponta existentes (como Raspberry Pis mais antigos) com pipelines especificamente optimizados para a arquitetura YOLOv5 .
- Fluxos de trabalho estabelecidos: Para projectos em modo de manutenção em que a atualização da arquitetura do modelo central implicaria custos de refacção significativos.
- Optimizações GPU específicas: Em casos raros em que os motores TensorRT específicos são fortemente ajustados para a estrutura de camadas exacta do YOLOv5.
Quando escolher YOLO11
- Novos desenvolvimentos: Para praticamente todos os novos projectos, YOLO11 é o ponto de partida recomendado devido à sua superior relação precisão/computação.
- Aplicações CPU em tempo real: As aplicações executadas em processadores padrão, como laptops ou instâncias de nuvem, se beneficiam imensamente das otimizações de velocidade de CPU do YOLO11.
- Tarefas complexas: Projectos que requerem segmentação de instâncias ou estimativa de pose juntamente com a deteção.
- Requisitos de elevada precisão: Domínios como a imagiologia médica ou a análise de imagens de satélite, em que a deteção de pequenos objectos com elevada precisão é fundamental.
Conclusão
YOLOv5 continua a ser um testemunho de um design de IA eficiente e acessível, tendo impulsionado inúmeras inovações ao longo dos últimos anos. No entanto, YOLO11 representa o futuro. Com a sua arquitetura avançada sem âncoras, pontuações mAP superiores e versatilidade melhorada, fornece aos programadores um conjunto de ferramentas mais poderoso para resolver desafios modernos de visão por computador.
Ao adotar YOLO11, não só obtém um melhor desempenho, como também prepara as suas aplicações para o futuro dentro do próspero ecossistema Ultralytics .
Explore Outros Modelos
Se estiver interessado em comparar estas arquitecturas com outros modelos líderes, explore as nossas comparações detalhadas: