Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 vs YOLOv5: Uma comparação técnica de detectores em tempo real#

Ao criar pipelines modernos de visão computacional, selecionar a arquitetura de detecção de objetos certa é fundamental para equilibrar precisão, velocidade de inferência e uso de recursos. Esta comparação abrangente examina dois modelos altamente influentes no espaço da visão computacional: YOLOv7 e Ultralytics YOLOv5.

Ao analisar suas diferenças arquiteturais, métricas de desempenho e cenários de implantação ideais, pretendemos ajudar desenvolvedores e pesquisadores a escolher o melhor modelo para suas necessidades específicas.

Link to this sectionHistórico e origens do modelo#

Entender as origens desses modelos fornece contexto para suas filosofias de design e casos de uso pretendidos.

Link to this sectionYOLOv5#

Lançado por Glenn Jocher e pela equipe da Ultralytics em 26 de junho de 2020, o YOLOv5 revolucionou o campo ao fornecer uma implementação nativa em PyTorch que priorizou a usabilidade sem sacrificar o desempenho. Ele rapidamente se tornou um padrão da indústria devido ao seu ecossistema incrivelmente simplificado e dinâmicas de treinamento confiáveis. Você pode explorar o código-fonte no repositório GitHub do YOLOv5 ou acessar o modelo diretamente via Plataforma Ultralytics.

Saiba mais sobre o YOLOv5

Link to this sectionYOLOv7#

Introduzido por Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao do Instituto de Ciência da Informação, Academia Sinica, Taiwan, em 6 de julho de 2022. O YOLOv7 focou fortemente em inovações arquiteturais como E-ELAN (Extended Efficient Layer Aggregation Networks) e um "bag-of-freebies" treinável para elevar o estado da arte em precisão. Detalhes podem ser encontrados em seu artigo oficial no Arxiv e no repositório GitHub do YOLOv7. Para uma integração perfeita, confira a documentação do Ultralytics YOLOv7.

Saiba mais sobre o YOLOv7

Experimentação contínua

Ambos os modelos estão totalmente integrados ao pacote Python da Ultralytics, permitindo que você alterne entre eles simplesmente mudando a string do modelo no seu código!

Link to this sectionInovações Arquiteturais#

Link to this sectionDesign do Ultralytics YOLOv5#

O YOLOv5 utiliza uma espinha dorsal (backbone) CSPDarknet53 modificada combinada com um pescoço Path Aggregation Network (PANet). Este design é altamente otimizado para extração de características rápida e eficiência de memória. Ao contrário de arquiteturas mais antigas ou modelos Transformer pesados, o YOLOv5 requer significativamente menos memória CUDA durante o treinamento, permitindo tamanhos de lote maiores em GPUs de nível consumidor padrão. Além disso, a estrutura Ultralytics suporta inerentemente uma ampla variedade de tarefas além de caixas delimitadoras padrão, incluindo segmentação de imagem e classificação de imagem.

Link to this sectionDesign do YOLOv7#

O YOLOv7 introduziu várias reparametrizações estruturais e a arquitetura E-ELAN, que permite à rede aprender características mais diversas sem destruir o caminho de gradiente original. Ele também implementa uma cabeça auxiliar para supervisão intermediária durante o treinamento. Embora esses avanços produzam um mAP (mean Average Precision) alto, eles geralmente introduzem estruturas de tensores complexas que podem tornar a exportação para formatos de borda como ONNX ou TensorRT um pouco mais desafiadora em comparação com as exportações simplificadas nativas dos modelos Ultralytics.

Link to this sectionAnálise de Desempenho#

Ao comparar esses modelos, os desenvolvedores devem equilibrar o mAPval, a velocidade de inferência e a complexidade computacional (FLOPs). A tabela abaixo demonstra o desempenho de ambas as arquiteturas avaliadas no conjunto de dados COCO.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionPrincipais Conclusões#

  • Teto de Precisão: O YOLOv7x alcança a maior precisão geral com impressionantes 53.1 mAPval, tornando-o altamente competitivo para cenários onde maximizar o desempenho de detecção é o objetivo principal.
  • Velocidade e Eficiência: O Ultralytics YOLOv5n é uma maravilha de eficiência, oferecendo latência de inferência ultrarrápida (1.12 ms em T4 TensorRT) com um uso mínimo de memória de apenas 2.6M de parâmetros. Isso o torna uma escolha inigualável para implantações de borda altamente restritas.
  • Equilíbrio de Desempenho: A série YOLOv5 oferece um gradiente excepcional de modelos. O YOLOv5l oferece um meio-termo fantástico, ficando atrás do YOLOv7l por uma pequena margem de precisão, mas oferecendo um pipeline de implantação altamente maduro.

Link to this sectionA Vantagem do Ecossistema Ultralytics#

A arquitetura de um modelo é apenas metade da equação; o ecossistema que o rodeia dita sua viabilidade no mundo real. É aqui que os modelos Ultralytics realmente brilham.

Facilidade de uso: A Ultralytics fornece uma API Python unificada e altamente intuitiva. Você pode treinar, validar e implantar modelos com o mínimo de código redundante, apoiado por uma extensa documentação oficial. Ecossistema bem mantido: O desenvolvimento ativo garante atualizações constantes, correções de bugs e integração perfeita com ferramentas de rastreamento modernas como Weights & Biases. Eficiência de treinamento: Utilizando carregadores de dados otimizados e cache inteligente, o YOLOv5 reduz drasticamente os tempos de treinamento. Além disso, pesos pré-treinados prontos para uso aceleram o aprendizado por transferência em vários domínios.

Link to this sectionExemplo de Código: Treinamento Simplificado#

Com o pacote Ultralytics, iniciar um treinamento é praticamente idêntico, independentemente da arquitetura que você escolher.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model (can easily swap to "yolov7.pt")
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX format for deployment
success = model.export(format="onnx")

Link to this sectionCasos de Uso Ideais#

Link to this sectionQuando escolher o YOLOv7#

  • Benchmarking acadêmico: Perfeito para pesquisadores que precisam comparar técnicas novas com uma base de referência de 2022 bem documentada.
  • Processamento em nuvem com GPU de alto desempenho: Ao implantar em hardware de servidor potente, onde alcançar o maior mAP absoluto em cenas densas supera a simplicidade de exportação.

Link to this sectionQuando escolher o YOLOv5#

  • Implantações de produção: Ideal para aplicações comerciais que exigem alta estabilidade, opções de implantação de modelo diretas e ampla compatibilidade entre plataformas.
  • Dispositivos de borda: As variantes menores (YOLOv5n e YOLOv5s) funcionam excepcionalmente bem em telefones celulares e sistemas embarcados.
  • Requisitos multitarefa: Se o seu projeto precisa evoluir de uma detecção simples para estimativa de pose ou segmentação usando um framework unificado.
Explorando Outras Arquiteturas

Procurando por iterações mais recentes? Considere explorar o Ultralytics YOLOv8 ou o Ultralytics YOLO11 para mais avanços em detecção sem âncoras e capacidades de aprendizado multitarefa.

Link to this sectionA Próxima Geração: Ultralytics YOLO26#

Embora o YOLOv5 e o YOLOv7 ocupem lugares vitais na história da visão computacional, o cenário está em constante evolução. Lançado em janeiro de 2026, o Ultralytics YOLO26 representa a vanguarda absoluta da tecnologia de detecção de objetos, superando gerações anteriores em todas as métricas.

Saiba mais sobre o YOLO26

O YOLO26 introduz várias características que mudam o paradigma:

  • Design end-to-end sem NMS: Construído com base em conceitos pioneiros em iterações anteriores, o YOLO26 é nativamente end-to-end. Isso elimina completamente o pós-processamento de Non-Maximum Suppression (NMS), reduzindo gargalos de latência e simplificando drasticamente a lógica de implantação.
  • Otimizador MuSGD: Inspirado no Kimi K2 da Moonshot AI, este otimizador revolucionário combina a estabilidade do SGD padrão com o momento acelerado do Muon, trazendo inovações avançadas de treinamento de LLM diretamente para a visão computacional.
  • Velocidade de CPU aprimorada: Ao remover estrategicamente o Distribution Focal Loss (DFL), o YOLO26 alcança uma inferência de CPU até 43% mais rápida, tornando-o o campeão indiscutível para implantação em dispositivos de borda e IoT de baixo consumo.
  • ProgLoss + STAL: Essas funções de perda avançadas produzem melhorias massivas no reconhecimento de pequenos objetos, o que é fundamental para imagens aéreas e robótica de precisão.
  • Melhorias específicas de tarefa: Apresentando perda de segmentação semântica para geração de máscaras, Estimativa de Verossimilhança Residual Logarítmica (RLE) para rastreamento de Pose e perda de ângulo especializada para resolver problemas complicados de limites de Oriented Bounding Box (OBB).

Link to this sectionConclusão#

Tanto o YOLOv5 quanto o YOLOv7 oferecem soluções robustas para detecção de objetos em tempo real. O YOLOv7 continua sendo uma escolha forte para precisão bruta em hardware de alto poder computacional, enquanto o YOLOv5 se destaca como a ferramenta definitiva para desenvolvedores, oferecendo um equilíbrio excepcional de velocidade, eficiência e um ecossistema de classe mundial.

No entanto, para desenvolvedores que buscam preparar seus pipelines para o futuro e alcançar a combinação definitiva de velocidade, simplicidade e precisão de última geração, recomendamos fortemente a migração para o Ultralytics YOLO26. Ele encapsula a lendária facilidade de uso da plataforma Ultralytics, ao mesmo tempo em que oferece inovações arquiteturais inovadoras.

Contribuidores

Comentários