Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 vs YOLOv5#

O campo da visão computacional testemunhou um crescimento tremendo, com a detecção de objetos atuando como a base para inúmeras aplicações industriais e de pesquisa. Escolher a arquitetura certa geralmente requer uma avaliação cuidadosa da mean Average Precision (mAP), velocidade de inferência e sobrecarga de memória. Nesta comparação, exploramos dois modelos altamente influentes: YOLOv9, celebrado por seus avanços arquitetônicos na retenção de informações de gradiente, e Ultralytics YOLOv5, o padrão da indústria testado em batalha, conhecido por sua incrível facilidade de uso e versatilidade de implantação incomparável.

Link to this sectionInovações Arquitetônicas e Origens Técnicas#

Compreender a mecânica subjacente desses dois modelos fornece um contexto crítico para seus respectivos perfis de desempenho.

Link to this sectionYOLOv9: Informação de Gradiente Programável#

Desenvolvido pelos pesquisadores Chien-Yao Wang e Hong-Yuan Mark Liao no Institute of Information Science, Academia Sinica em Taiwan, o YOLOv9 foi lançado em 21 de fevereiro de 2024. O modelo introduz dois conceitos inovadores para abordar o gargalo de informação comum em redes neurais profundas: Programmable Gradient Information (PGI) e a Generalized Efficient Layer Aggregation Network (GELAN).

Ao utilizar PGI, o YOLOv9 garante que informações vitais sejam retidas durante todo o processo feed-forward, levando a atualizações de gradiente altamente precisas. Enquanto isso, a arquitetura GELAN maximiza a eficiência de parâmetros, permitindo que o modelo alcance precisão de estado da arte com uma sobrecarga computacional surpreendentemente baixa. Você pode explorar os detalhes técnicos no artigo Arxiv do YOLOv9 oficial ou visualizar o repositório GitHub do YOLOv9.

Saiba mais sobre o YOLOv9

Link to this sectionUltralytics YOLOv5: O Padrão de Produção#

Criado por Glenn Jocher e lançado pela Ultralytics em 26 de junho de 2020, o YOLOv5 revolucionou a acessibilidade da visão computacional. Como um dos primeiros modelos de detecção de objetos construídos nativamente na estrutura PyTorch, ele evitou as complexidades do framework Darknet C mais antigo. O YOLOv5 aproveita um backbone CSPNet altamente otimizado e um neck PANet, priorizando um equilíbrio perfeito entre velocidade e precisão.

Sua maior conquista, no entanto, é sua integração ao ecossistema mais amplo da Ultralytics. O YOLOv5 é fortemente otimizado para eficiência de treinamento rápida e ambientes de baixa memória, tornando-o incrivelmente estável para implantações em edge.

Saiba mais sobre o YOLOv5

Eficiência de memória

Ao avaliar modelos para dispositivos edge, lembre-se de que os modelos Ultralytics YOLO geralmente exigem significativamente menos memória GPU durante o treinamento e a inferência em comparação com arquiteturas pesadas baseadas em Transformer.

Link to this sectionAnálise de Desempenho: Velocidade vs. Precisão#

Ao projetar um pipeline de visão computacional, os desenvolvedores devem pesar as compensações entre precisão e latência. A tabela a seguir ilustra as diferenças de desempenho no dataset COCO padrão.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionAnalisando os Compromissos#

O YOLOv9 estabelece domínio absoluto na precisão bruta. O YOLOv9e expande os limites da mAP para 55,6%, utilizando suas camadas GELAN para preservar detalhes de granulação fina. Isso o torna uma escolha excepcional para imagens médicas ou cenários que exigem precisão rigorosa em objetos pequenos.

Por outro lado, o YOLOv5 brilha em sua velocidade de implantação bruta e flexibilidade de hardware. O YOLOv5n (Nano) é famoso por ser leve, executando inferências em apenas 1,12ms em uma GPU T4 via TensorRT. Se você estiver implantando em dispositivos IoT limitados, telefones celulares ou Raspberry Pi, o uso de memória do YOLOv5 torna-o extraordinariamente confiável.

Link to this sectionA Vantagem do Ecossistema Ultralytics#

Uma consideração importante ao selecionar um modelo é o ecossistema de software ao redor. Embora o YOLOv9 forneça benchmarks de pesquisa de alto nível, utilizar ambos os modelos por meio da moderna API Python da Ultralytics reduz a lacuna, oferecendo aos desenvolvedores uma experiência unificada e simplificada.

Link to this sectionFacilidade de Uso e Exportação#

A Ultralytics abstrai obstáculos complexos de engenharia. Recursos como aumento de dados automático e ajuste de hiperparâmetros são tratados prontamente. Levar modelos para produção é igualmente trivial, com comandos de exportação integrados para converter modelos em formatos ONNX, OpenVINO ou TFLite.

Link to this sectionVersatilidade de Tarefas#

Embora ambos os modelos se destaquem na detecção de objetos, os modelos modernos da Ultralytics são construídos para enfrentar uma variedade de desafios de visão computacional. O framework mais amplo oferece suporte nativo para classificação de imagem, segmentação de instância, estimativa de pose e caixas delimitadoras orientadas (OBB), permitindo que os desenvolvedores resolvam múltiplos problemas de visão sem alternar bases de código.

Link to this sectionCasos de uso e recomendações#

Escolher entre o YOLOv9 e o YOLOv5 depende dos requisitos específicos do seu projeto, das restrições de implantação e das preferências de ecossistema.

Link to this sectionQuando escolher o YOLOv9#

O YOLOv9 é uma escolha forte para:

  • Pesquisa sobre o Gargalo de Informação: Projetos acadêmicos que estudam as arquiteturas Programmable Gradient Information (PGI) e Generalized Efficient Layer Aggregation Network (GELAN).
  • Estudos de Otimização de Fluxo de Gradiente: Pesquisas focadas em entender e mitigar a perda de informação em camadas de rede profundas durante o treino.
  • Benchmarking de Detecção de Alta Precisão: Cenários onde o forte desempenho do YOLOv9 no benchmark COCO é necessário como ponto de referência para comparações arquiteturais.

Link to this sectionQuando escolher o YOLOv5#

O YOLOv5 é recomendado para:

  • Sistemas de Produção Comprovados: Implantações existentes onde o longo histórico de estabilidade, documentação extensa e enorme suporte da comunidade do YOLOv5 são valorizados.
  • Treinamento com Recursos Limitados: Ambientes com recursos de GPU limitados onde o pipeline de treinamento eficiente e os menores requisitos de memória do YOLOv5 são vantajosos.
  • Amplo Suporte a Formatos de Exportação: Projetos que exigem implantação em muitos formatos, incluindo ONNX, TensorRT, CoreML e TFLite.

Link to this sectionQuando escolher a Ultralytics (YOLO26)#

Para a maioria dos novos projetos, o Ultralytics YOLO26 oferece a melhor combinação de desempenho e experiência para o desenvolvedor:

  • Implantação de borda sem NMS: Aplicações que requerem inferência consistente e de baixa latência sem a complexidade do pós-processamento de Supressão de Não-Máximos.
  • Ambientes apenas com CPU: Dispositivos sem aceleração de GPU dedicada, onde a inferência em CPU até 43% mais rápida do YOLO26 oferece uma vantagem decisiva.
  • Detecção de objetos pequenos: Cenários desafiadores como imagens de drone aéreo ou análise de sensores IoT onde ProgLoss e STAL aumentam significativamente a precisão em objetos minúsculos.

Link to this sectionExemplo de Implementação#

A beleza do ecossistema Ultralytics é que você pode alternar entre um modelo YOLOv5 e um modelo YOLOv9 simplesmente alterando a string de pesos.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model (swap to "yolov5s.pt" to use YOLOv5)
model = YOLO("yolov9c.pt")

# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on new images
predictions = model.predict("https://ultralytics.com/images/zidane.jpg")

# Export to ONNX for seamless deployment
model.export(format="onnx")

Link to this sectionExplorando Arquiteturas Mais Recentes#

Embora o YOLOv5 e o YOLOv9 sejam modelos excelentes com vantagens distintas, o campo continua a avançar. Usuários que exploram novos projetos também podem querer avaliar as iterações mais recentes da Ultralytics.

  • YOLO11: Uma evolução poderosa e refinada da linhagem YOLOv8, oferecendo excelente equilíbrio entre velocidade e precisão em todas as tarefas de visão.
  • YOLO26: Lançado em 2026, o YOLO26 é a recomendação definitiva para pipelines modernos. Ele apresenta um Design End-to-End NMS-Free, eliminando completamente os gargalos de pós-processamento. Com a Remoção de DFL (Distribution Focal Loss removido para exportação simplificada e melhor compatibilidade com dispositivos edge/baixo consumo de energia), ele alcança até 43% de inferência CPU mais rápida. A estabilidade de treinamento é turbinada pelo novo Otimizador MuSGD, e ProgLoss + STAL oferece funções de perda aprimoradas com melhorias notáveis no reconhecimento de objetos pequenos, crítico para IoT, robótica e imagens aéreas, tornando-o a arquitetura mais robusta tanto para implantações em edge quanto na nuvem.

Para equipes que gerenciam grandes conjuntos de dados e pipelines de implantação complexos, utilizar a Plataforma Ultralytics oferece uma solução sem código para treinar, rastrear e implantar esses modelos de ponta sem esforço.

Contribuidores

Comentários