Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 vs YOLOv5#

Ao construir pipelines modernos de visão computacional, selecionar a arquitetura de detecção de objetos correta é fundamental para equilibrar precisão, velocidade de inferência e utilização de recursos. Esta comparação abrangente analisa dois modelos altamente influentes no espaço de visão computacional: YOLOv7 e Ultralytics YOLOv5.

Ao analisar suas diferenças arquitetônicas, métricas de desempenho e cenários ideais de implantação, buscamos ajudar desenvolvedores e pesquisadores a escolher o melhor modelo para seus requisitos específicos.

Link to this sectionHistórico e Origens dos Modelos#

Entender as origens desses modelos fornece contexto para suas filosofias de design e casos de uso direcionados.

Link to this sectionYOLOv5#

Lançado por Glenn Jocher e pela equipe da Ultralytics em 26 de junho de 2020, o YOLOv5 revolucionou o campo ao fornecer uma implementação nativa em PyTorch que priorizou a usabilidade sem sacrificar o desempenho. Ele rapidamente se tornou um padrão da indústria devido ao seu ecossistema incrivelmente simplificado e dinâmicas de treinamento confiáveis. Você pode explorar o código-fonte no repositório GitHub do YOLOv5 ou acessar o modelo diretamente pela Plataforma Ultralytics.

Saiba mais sobre o YOLOv5

Link to this sectionYOLOv7#

Introduzido por Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao do Instituto de Ciência da Informação, Academia Sinica, Taiwan, em 6 de julho de 2022. O YOLOv7 focou fortemente em inovações arquitetônicas como Extended Efficient Layer Aggregation Networks (E-ELAN) e um "bag-of-freebies" treinável para impulsionar o estado da arte em precisão. Detalhes podem ser encontrados em seu artigo oficial no Arxiv e no repositório GitHub do YOLOv7. Para uma integração perfeita, confira a documentação do Ultralytics YOLOv7.

Saiba mais sobre o YOLOv7

Experimentação contínua

Ambos os modelos estão totalmente integrados ao pacote Python da Ultralytics, permitindo que você alterne entre eles simplesmente mudando a string do modelo em seu código!

Link to this sectionInovações Arquiteturais#

Link to this sectionDesign do Ultralytics YOLOv5#

O YOLOv5 utiliza um backbone CSPDarknet53 modificado combinado com um neck Path Aggregation Network (PANet). Este design é altamente otimizado para extração de recursos rápida e eficiência de memória. Ao contrário de arquiteturas mais antigas ou modelos Transformer pesados, o YOLOv5 requer significativamente menos memória CUDA durante o treinamento, permitindo batch sizes maiores em GPUs de nível consumidor padrão. Além disso, o framework Ultralytics suporta inerentemente uma grande variedade de tarefas além de caixas delimitadoras padrão, incluindo segmentação de imagem e classificação de imagem.

Link to this sectionDesign do YOLOv7#

O YOLOv7 introduziu várias reparametrizações estruturais e a arquitetura E-ELAN, que permite que a rede aprenda recursos mais diversos sem destruir o caminho de gradiente original. Ele também implementa uma head auxiliar para supervisão intermediária durante o treinamento. Embora esses avanços gerem um alto mAP, eles frequentemente introduzem estruturas de tensores complexas que podem tornar a exportação para formatos de borda como ONNX ou TensorRT um pouco mais desafiadora em comparação com as exportações simplificadas nativas dos modelos Ultralytics.

Link to this sectionAnálise de Desempenho#

Ao comparar esses modelos, os desenvolvedores devem equilibrar mAPval, velocidade de inferência e complexidade computacional (FLOPs). A tabela abaixo demonstra o desempenho de ambas as arquiteturas avaliadas no dataset COCO.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionPrincipais conclusões#

  • Teto de Precisão: O YOLOv7x alcança a maior precisão geral em impressionantes 53.1 mAPval, tornando-o altamente competitivo para cenários onde maximizar o desempenho da detecção é o objetivo principal.
  • Velocidade e Eficiência: O Ultralytics YOLOv5n é uma maravilha da eficiência, oferecendo latência de inferência ultrarrápida (1.12 ms em T4 TensorRT) com um pequeno uso de memória de apenas 2.6M de parâmetros. Isso o torna uma escolha incomparável para implantações de borda altamente restritas.
  • Equilíbrio de Desempenho: A série YOLOv5 oferece um gradiente excepcional de modelos. O YOLOv5l oferece um fantástico meio-termo, ficando atrás do YOLOv7l por uma pequena margem de precisão, mas oferecendo um pipeline de implantação altamente maduro.

Link to this sectionA Vantagem do Ecossistema Ultralytics#

A arquitetura de um modelo é apenas metade da equação; o ecossistema que o rodeia dita sua viabilidade no mundo real. É aqui que os modelos Ultralytics realmente brilham.

Facilidade de Uso: A Ultralytics fornece uma API Python unificada e altamente intuitiva. Você pode treinar, validar e implantar modelos com o mínimo de código boilerplate, apoiado por uma extensa documentação oficial. Ecossistema Bem Mantido: O desenvolvimento ativo garante atualizações constantes, correções de bugs e integração perfeita com ferramentas de rastreamento modernas como Weights & Biases. Eficiência de Treinamento: Utilizando carregadores de dados otimizados e cache inteligente, o YOLOv5 reduz drasticamente os tempos de treinamento. Além disso, pesos pré-treinados prontos para uso aceleram o aprendizado por transferência em vários domínios.

Link to this sectionExemplo de Código: Treinamento Simplificado#

Com o pacote Ultralytics, iniciar um treinamento é praticamente idêntico, independentemente da arquitetura que você escolher.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model (can easily swap to "yolov7.pt")
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX format for deployment
success = model.export(format="onnx")

Link to this sectionCasos de uso ideais#

Link to this sectionQuando escolher o YOLOv7#

  • Benchmarking Acadêmico: Perfeito para pesquisadores que precisam comparar técnicas novas com um baseline de 2022 bem documentado.
  • Processamento em Nuvem com GPU de Alto Desempenho: Ao implantar em hardware de servidor potente, onde alcançar o maior mAP absoluto em cenas densas supera a simplicidade de exportação.

Link to this sectionQuando escolher o YOLOv5#

  • Implantações de Produção: Ideal para aplicações comerciais que exigem alta estabilidade, opções diretas de implantação de modelo e ampla compatibilidade entre plataformas.
  • Dispositivos de Borda: As variantes menores (YOLOv5n e YOLOv5s) funcionam excepcionalmente bem em telefones celulares e sistemas embarcados.
  • Requisitos Multitarefa: Se o seu projeto precisa evoluir de uma detecção simples para estimativa de pose ou segmentação usando um framework unificado.
Explorando outras arquiteturas

Procurando por iterações mais recentes? Considere explorar o Ultralytics YOLOv8 ou o Ultralytics YOLO11 para mais avanços em detecção sem âncoras e capacidades de aprendizado multitarefa.

Link to this sectionA Próxima Geração: Ultralytics YOLO26#

Embora o YOLOv5 e o YOLOv7 ocupem lugares vitais na história da IA de visão, o cenário está em constante evolução. Lançado em janeiro de 2026, o Ultralytics YOLO26 representa a vanguarda absoluta da tecnologia de detecção de objetos, superando as gerações anteriores em todas as métricas.

Saiba mais sobre o YOLO26

O YOLO26 introduz vários recursos que mudam o paradigma:

  • Design End-to-End sem NMS: Baseando-se em conceitos pioneiros em iterações anteriores, o YOLO26 é nativamente end-to-end. Isso elimina completamente o pós-processamento de Non-Maximum Suppression (NMS), reduzindo gargalos de latência e simplificando drasticamente a lógica de implantação.
  • Otimizador MuSGD: Inspirado no Kimi K2 da Moonshot AI, este otimizador revolucionário funde a estabilidade do SGD padrão com o momento acelerado do Muon, trazendo inovações avançadas de treinamento de LLM diretamente para a visão computacional.
  • Velocidade de CPU Aprimorada: Ao remover estrategicamente o Distribution Focal Loss (DFL), o YOLO26 alcança uma inferência de CPU até 43% mais rápida, tornando-o o campeão indiscutível para implantação em dispositivos IoT de borda e de baixo consumo.
  • ProgLoss + STAL: Essas funções de perda avançadas produzem melhorias maciças no reconhecimento de objetos pequenos, o que é crítico para imagens aéreas e robótica de precisão.
  • Melhorias Específicas por Tarefa: Apresentando perda de segmentação semântica para geração de máscara, Residual Log-Likelihood Estimation (RLE) para rastreamento de pose e perda de ângulo especializada para resolver problemas complexos de limites de Oriented Bounding Box (OBB).

Link to this sectionConclusão#

Tanto o YOLOv5 quanto o YOLOv7 oferecem soluções robustas para detecção de objetos em tempo real. O YOLOv7 continua sendo uma escolha forte para precisão bruta em hardware de alto poder computacional, enquanto o YOLOv5 se destaca como a ferramenta definitiva para desenvolvedores, oferecendo um equilíbrio excepcional de velocidade, eficiência e um ecossistema de classe mundial.

No entanto, para desenvolvedores que desejam preparar seus pipelines para o futuro e alcançar a combinação definitiva de velocidade, simplicidade e precisão de estado da arte, recomendamos fortemente a migração para o Ultralytics YOLO26. Ele encapsula a lendária facilidade de uso da plataforma Ultralytics enquanto entrega inovações arquitetônicas inovadoras.

Contribuidores

Comentários