Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 vs YOLOv5: Uma análise técnica aprofundada sobre a detecção de objetos moderna#

O campo da visão computacional testemunhou um crescimento tremendo, com a detecção de objetos servindo como a espinha dorsal para inúmeras aplicações industriais e de pesquisa. Escolher a arquitetura certa frequentemente requer uma avaliação cuidadosa da precisão média (mAP), velocidade de inferência e sobrecarga de memória. Nesta comparação, exploramos dois modelos altamente influentes: YOLOv9, celebrado por seus avanços arquitetônicos na retenção de informações de gradiente, e Ultralytics YOLOv5, o padrão da indústria testado em batalha, conhecido por sua incrível facilidade de uso e versatilidade de implementação inigualável.

Link to this sectionInovações arquitetônicas e origens técnicas#

Entender os mecanismos subjacentes desses dois modelos fornece um contexto crítico para seus respectivos perfis de desempenho.

Link to this sectionYOLOv9: Informação de Gradiente Programável#

Desenvolvido pelos pesquisadores Chien-Yao Wang e Hong-Yuan Mark Liao no Instituto de Ciência da Informação, Academia Sinica em Taiwan, o YOLOv9 foi lançado em 21 de fevereiro de 2024. O modelo introduz dois conceitos inovadores para resolver o gargalo de informações comum em redes neurais profundas: Programmable Gradient Information (PGI) e a Generalized Efficient Layer Aggregation Network (GELAN).

Ao utilizar PGI, o YOLOv9 garante que informações vitais sejam retidas ao longo do processo de feed-forward, levando a atualizações de gradiente altamente precisas. Enquanto isso, a arquitetura GELAN maximiza a eficiência de parâmetros, permitindo que o modelo alcance precisão de estado da arte com uma sobrecarga computacional surpreendentemente baixa. Você pode explorar os detalhes técnicos no artigo do YOLOv9 no Arxiv ou visualizar o repositório do YOLOv9 no GitHub.

Saiba mais sobre o YOLOv9

Link to this sectionUltralytics YOLOv5: O padrão de produção#

Criado por Glenn Jocher e lançado pela Ultralytics em 26 de junho de 2020, o YOLOv5 revolucionou a acessibilidade da visão computacional. Como um dos primeiros modelos de detecção de objetos construídos nativamente na estrutura PyTorch, ele contornou as complexidades da antiga estrutura Darknet em C. O YOLOv5 aproveita uma estrutura CSPNet altamente otimizada e um neck PANet, priorizando um equilíbrio contínuo entre velocidade e precisão.

Sua maior conquista, no entanto, é a integração ao ecossistema Ultralytics mais amplo. O YOLOv5 é fortemente otimizado para uma rápida eficiência de treinamento e ambientes de baixa memória, tornando-o incrivelmente estável para implementações na borda (edge).

Saiba mais sobre o YOLOv5

Eficiência de Memória

Ao avaliar modelos para dispositivos de borda, lembre-se de que os modelos Ultralytics YOLO geralmente exigem significativamente menos memória de GPU durante o treinamento e a inferência em comparação com arquiteturas pesadas baseadas em Transformer.

Link to this sectionAnálise de desempenho: Velocidade vs. Precisão#

Ao projetar um pipeline de visão computacional, os desenvolvedores devem ponderar as compensações entre precisão e latência. A tabela a seguir ilustra as diferenças de desempenho no dataset COCO padrão.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionAnalisando as compensações#

O YOLOv9 estabelece domínio absoluto na precisão bruta. O YOLOv9e expande os limites do mAP para 55,6%, utilizando suas camadas GELAN para preservar detalhes finos. Isso o torna uma escolha excepcional para imagem médica ou cenários que exigem precisão rigorosa em objetos pequenos.

Por outro lado, o YOLOv5 brilha em sua velocidade de implementação bruta e flexibilidade de hardware. O YOLOv5n (Nano) é famoso por ser leve, executando inferências em apenas 1,12ms em uma GPU T4 via TensorRT. Se você estiver implementando em dispositivos IoT restritos, telefones celulares ou Raspberry Pi, o uso de memória do YOLOv5 torna-o extraordinariamente confiável.

Link to this sectionA Vantagem do Ecossistema Ultralytics#

Uma consideração importante ao selecionar um modelo é o ecossistema de software ao redor. Embora o YOLOv9 forneça benchmarks de pesquisa de alto nível, utilizar ambos os modelos por meio da moderna API Python da Ultralytics preenche a lacuna, oferecendo aos desenvolvedores uma experiência unificada e simplificada.

Link to this sectionFacilidade de uso e exportação#

A Ultralytics abstrai obstáculos complexos de engenharia. Recursos como aumento de dados automático e ajuste de hiperparâmetros já vêm prontos para uso. Levar modelos para a produção é igualmente trivial, com comandos de exportação integrados para converter modelos para formatos ONNX, OpenVINO ou TFLite.

Link to this sectionVersatilidade de tarefas#

Embora ambos os modelos se destaquem na detecção de objetos, os modelos Ultralytics modernos são construídos para lidar com uma variedade de desafios de visão computacional. A estrutura mais ampla oferece suporte nativo para classificação de imagem, segmentação de instâncias, estimativa de pose e caixas delimitadoras orientadas (OBB), permitindo que os desenvolvedores resolvam múltiplos problemas de visão sem trocar de base de código.

Link to this sectionCasos de Uso e Recomendações#

A escolha entre o YOLOv9 e o YOLOv5 depende dos requisitos específicos do seu projeto, restrições de implementação e preferências de ecossistema.

Link to this sectionQuando escolher o YOLOv9#

YOLOv9 é uma escolha sólida para:

  • Pesquisa de Gargalo de Informação: Projetos acadêmicos que estudam arquiteturas de Programmable Gradient Information (PGI) e Generalized Efficient Layer Aggregation Network (GELAN).
  • Estudos de Otimização de Fluxo de Gradiente: Pesquisa focada em entender e mitigar a perda de informação em camadas de rede profundas durante o treinamento.
  • Benchmarking de Detecção de Alta Precisão: Cenários onde o forte desempenho do YOLOv9 no benchmark COCO é necessário como ponto de referência para comparações arquitetônicas.

Link to this sectionQuando escolher o YOLOv5#

O YOLOv5 é recomendado para:

  • Sistemas de Produção Comprovados: Implementações existentes onde o longo histórico de estabilidade, a documentação extensa e o suporte massivo da comunidade do YOLOv5 são valorizados.
  • Treino com Restrição de Recursos: Ambientes com recursos de GPU limitados, onde o pipeline de treino eficiente e os menores requisitos de memória do YOLOv5 são vantajosos.
  • Amplo Suporte a Formatos de Exportação: Projetos que requerem implementação em muitos formatos, incluindo ONNX, TensorRT, CoreML e TFLite.

Link to this sectionQuando escolher a Ultralytics (YOLO26)#

Para a maioria dos novos projetos, o Ultralytics YOLO26 oferece a melhor combinação de desempenho e experiência de desenvolvedor:

  • Implantação de Borda Sem NMS: Aplicações que exigem inferência consistente e de baixa latência sem a complexidade do pós-processamento de Non-Maximum Suppression.
  • Ambientes Apenas com CPU: Dispositivos sem aceleração de GPU dedicada, onde a inferência de CPU até 43% mais rápida do YOLO26 oferece uma vantagem decisiva.
  • Detecção de Pequenos Objetos: Cenários desafiadores como imagens aéreas de drones ou análise de sensores IoT onde o ProgLoss e o STAL aumentam significativamente a precisão em objetos minúsculos.

Link to this sectionExemplo de Implementação#

A beleza do ecossistema Ultralytics é que você pode alternar entre um modelo YOLOv5 e um modelo YOLOv9 simplesmente alterando a string de pesos.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model (swap to "yolov5s.pt" to use YOLOv5)
model = YOLO("yolov9c.pt")

# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on new images
predictions = model.predict("https://ultralytics.com/images/zidane.jpg")

# Export to ONNX for seamless deployment
model.export(format="onnx")

Link to this sectionExplorando arquiteturas mais recentes#

Embora o YOLOv5 e o YOLOv9 sejam modelos excelentes com vantagens distintas, o campo continua a avançar. Usuários que exploram novos projetos também podem querer avaliar as iterações mais recentes da Ultralytics.

  • YOLO11: Uma evolução poderosa e refinada da linhagem YOLOv8 que oferece um excelente equilíbrio de velocidade e precisão em todas as tarefas de visão.
  • YOLO26: Lançado em 2026, o YOLO26 é a recomendação definitiva para pipelines modernos. Ele apresenta um design End-to-End NMS-Free, eliminando completamente os gargalos de pós-processamento. Com a remoção de DFL (Distribution Focal Loss removido para exportação simplificada e melhor compatibilidade com dispositivos de borda/baixo consumo), ele atinge até 43% mais rapidez na inferência em CPU. A estabilidade do treinamento é superalimentada através do novo otimizador MuSGD, e ProgLoss + STAL oferece funções de perda aprimoradas com melhorias notáveis no reconhecimento de objetos pequenos, crítico para IoT, robótica e imagens aéreas, tornando-o a arquitetura mais robusta para implementações na borda e na nuvem.

Para equipes que gerenciam grandes datasets e pipelines de implementação complexos, utilizar a Plataforma Ultralytics oferece uma solução sem código para treinar, rastrear e implementar esses modelos de ponta sem esforço.

Contribuidores

Comentários