Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs. YOLOv9: Uma Comparação Técnica Aprofundada#

O panorama da visão computacional e da deteção de objetos em tempo real registou avanços notáveis nos últimos anos. Navegar na escolha entre modelos estabelecidos e comprovados e novas arquiteturas de investigação é um desafio comum para os engenheiros de machine learning. Este guia fornece uma comparação técnica abrangente entre dois modelos altamente influentes na família YOLO: YOLOv5 e YOLOv9.

Quer estejas a implementar em dispositivos de edge limitados, a pesquisar extração de características de alta fidelidade ou a construir pipelines complexos de detecção de objetos, compreender as nuances arquitetónicas, as métricas de desempenho e as diferenças de ecossistema destes modelos é crucial.

Link to this sectionVisão Geral dos Modelos#

Antes de mergulhar nas comparações arquitetónicas, é útil compreender as origens e os objetivos principais de cada modelo.

Link to this sectionUltralytics YOLOv5#

Desenvolvido por Glenn Jocher e lançado pela Ultralytics a 26 de junho de 2020, o YOLOv5 marcou uma mudança de paradigma na forma como os programadores interagem com modelos de visão. Ao adotar totalmente o framework PyTorch, o YOLOv5 trocou os complexos passos de compilação dos modelos anteriores baseados em Darknet por uma experiência de utilizador intuitiva e focada em Python.

O YOLOv5 é conhecido pela sua Facilidade de Utilização e desempenho estável em diversos ambientes de hardware. Suporta não só deteção, mas também classificação de imagens e segmentação de instâncias.

Saiba mais sobre o YOLOv5

Link to this sectionYOLOv9#

Introduzido por Chien-Yao Wang e Hong-Yuan Mark Liao do Institute of Information Science da Academia Sinica, Taiwan, o YOLOv9 foca-se fortemente na teoria arquitetónica para mitigar problemas de estrangulamento de informação em redes neuronais profundas.

O núcleo do YOLOv9 baseia-se em duas inovações teóricas principais: Programmable Gradient Information (PGI) e Generalized Efficient Layer Aggregation Network (GELAN). Estes conceitos ajudam o modelo a reter características espaciais críticas através de camadas de rede profundas.

Sabe mais sobre o YOLOv9

Prepare os Seus Projetos para o Futuro

Embora o YOLOv5 e o YOLOv9 sejam poderosos, o recentemente lançado YOLO26 representa o equilíbrio definitivo entre velocidade e precisão. Com um design end-to-end sem NMS e uma inferência CPU até 43% mais rápida, o YOLO26 é altamente recomendado para computação edge moderna e implementações em produção.

Link to this sectionDiferenças Arquitetónicas e Técnicas#

Compreender o que alimenta estes modelos de visão é vital para otimizar estratégias de implementação de modelos.

Link to this sectionExtração de Características e Retenção de Informação#

O YOLOv5 utiliza uma base Cross Stage Partial Network (CSPNet), que reduz eficazmente o custo computacional enquanto mantém um fluxo de gradiente preciso durante a retropropagação. Este design é altamente otimizado para operações de GPU tradicionais e garante requisitos de memória mais baixos durante o treino em comparação com alternativas pesadas baseadas em Transformer.

O YOLOv9 introduz a GELAN, uma arquitetura genérica que estende os princípios da CSPNet. Juntamente com a PGI — uma ramificação reversível auxiliar — o YOLOv9 garante que as camadas profundas não perdem os dados semânticos necessários para funções objetivas precisas. Isto permite que o YOLOv9 alcance uma elevada precisão, particularmente em objetos mais pequenos, embora a complexa ramificação auxiliar possa, por vezes, complicar os pipelines de exportação para hardware de edge profundamente limitado.

Link to this sectionRequisitos de Memória e Eficiência de Treinamento#

Quando se trata de eficiência de treino, o YOLOv5 permanece incrivelmente robusto. O ecossistema Ultralytics, bem mantido, garante que os modelos YOLOv5 consumam significativamente menos memória CUDA, permitindo que os investigadores maximizem os tamanhos de lote (batch sizes) em GPUs de classe de consumo. Embora o YOLOv9 alcance uma excelente eficiência de parâmetros (elevada precisão em relação ao seu tamanho), o seu processo de treino pode exigir mais recursos se não forem utilizados frameworks otimizados. Felizmente, a integração do YOLOv9 na API da Ultralytics coloca-o mais próximo da paridade com a gestão de recursos simplificada do YOLOv5.

Link to this sectionDesempenho e Métricas#

Para avaliar objetivamente estas arquiteturas, comparamos o seu desempenho em datasets padrão como o COCO. Abaixo encontra-se uma análise detalhada de métricas como mAP (Mean Average Precision), velocidade de inferência e contagem de parâmetros.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Como a tabela mostra, o YOLOv9 atinge uma maior precisão bruta em níveis equivalentes, refletindo a sua arquitetura mais recente. No entanto, o YOLOv5n mantém uma latência TensorRT incrivelmente baixa de 1.12ms, destacando a sua força duradoura para aplicações de computação edge localizadas e de alta velocidade.

Link to this sectionMetodologias de Treino e Facilidade de Utilização#

A verdadeira vantagem de alavancar a visão computacional hoje reside na acessibilidade do conjunto de ferramentas.

Link to this sectionA vantagem da Ultralytics#

Embora os repositórios de investigação originais para modelos como o YOLOv9 sejam fundamentais, muitas vezes vêm com matrizes de dependência complexas e scripts de código repetitivo. A API Python da Ultralytics abstrai completamente esta complexidade. Com o ecossistema Ultralytics, podes treinar, avaliar e exportar tanto o YOLOv5 como o YOLOv9 com uma sintaxe unificada e idêntica.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model for fast deployment
model_v5 = YOLO("yolov5s.pt")

# Or leverage a YOLOv9 model for high-fidelity accuracy
model_v9 = YOLO("yolov9c.pt")

# Train seamlessly on custom data with automatic MLflow logging
results = model_v9.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX
model_v9.export(format="onnx")

Esta abordagem de API única proporciona uma imensa Versatilidade, suportando não apenas deteção, mas também estimativa de pose e caixas delimitadoras orientadas (OBB), dependendo do modelo escolhido. Além disso, integrações robustas com ferramentas como Comet ML e Weights & Biases estão integradas diretamente no ciclo de treino.

Link to this sectionCasos de Uso Ideais e Aplicações no Mundo Real#

A escolha entre estas arquiteturas depende muito das restrições do teu hardware e da precisão exigida pelo teu domínio de aplicação.

Link to this sectionQuando escolher o YOLOv5#

O YOLOv5 é um veterano testado em batalha que brilha em implementações que priorizam a estabilidade, baixo consumo de memória e extrema compatibilidade de exportação.

  • Implementações em Dispositivos Móveis: Exportar o YOLOv5 para TFLite ou CoreML para inferência on-device em smartphones mais antigos é incrivelmente fluido.
  • Hardware de Edge Legado: Para dispositivos como o Raspberry Pi ou as primeiras gerações da NVIDIA Jetson Nano, as convoluções diretas do YOLOv5 garantem taxas de fotogramas consistentes para aplicações como gestão inteligente de estacionamento.
  • Prototipagem Rápida: A vasta disponibilidade de tutoriais da comunidade, pesos pré-treinados personalizados e compatibilidade com datasets massivos tornam-no na forma mais rápida de validar um proof-of-concept.

Link to this sectionQuando escolher o YOLOv9#

O YOLOv9 é ideal para cenários onde capturar detalhes intrincados e minimizar falsos negativos é absolutamente crítico, mesmo que isso exija um pouco mais de carga computacional.

  • Aerial and Satellite Imagery: The PGI framework is highly adept at maintaining the fidelity of small objects, making YOLOv9 excellent for drone-based agricultural monitoring.
  • Diagnóstico por Imagem Médica: Ao detetar anomalias ou lesões minúsculas em exames de alta resolução, o fluxo de gradiente preciso da GELAN fornece uma vantagem necessária no recall.
  • Análise de Retalho de Alta Performance: O rastreio de produtos sobrepostos em prateleiras densas beneficia significativamente das capacidades superiores de retenção de características do YOLOv9.

Link to this sectionExpandindo os Teus Horizontes#

Embora a comparação entre o YOLOv5 e o YOLOv9 ofereça uma visão clara de como as arquiteturas evoluíram de 2020 para 2024, o campo da IA está a mover-se mais rápido do que nunca. Para programadores que procuram a fronteira absoluta do desempenho, explorar os mais recentes modelos YOLO26 é altamente recomendado. Ao substituir o tradicional Non-Maximum Suppression por um Design End-to-End NMS-Free nativo e utilizar o avançado MuSGD Optimizer, o YOLO26 preenche a lacuna entre a precisão ao nível da investigação e a velocidade ao nível da produção. Com a Remoção de DFL (Distribution Focal Loss removido para uma exportação simplificada e melhor compatibilidade com dispositivos de edge/baixa potência), o YOLO26 alcança uma inferência CPU até 43% mais rápida, tornando-o ideal para computação edge. Além disso, o ProgLoss + STAL fornece funções de perda melhoradas com melhorias notáveis no reconhecimento de objetos pequenos, crítico para IoT, robótica e imagens aéreas.

Também podes estar interessado em comparar estas arquiteturas com outros modelos de ponta, como o RT-DETR ou o altamente capaz YOLO11. Utilizar o framework unificado da Ultralytics garante que, independentemente do modelo que escolhas, o teu pipeline de desenvolvimento permaneça limpo, eficiente e pronto para escalar.

Contribuidores

Comentários