Ir para o conteúdo

YOLOv9 . YOLOv5: Evolução arquitetónica e legado na deteção de objetos

A evolução da família YOLO You Only Look Once) representa uma linha do tempo fascinante do progresso da visão computacional. YOLOv5, lançado pela Ultralytics 2020, estabeleceu um novo padrão de facilidade de uso e prontidão para produção, tornando-se a estrutura preferida de desenvolvedores em todo o mundo. YOLOv9, lançado em 2024 por investigadores da Academia Sinica, amplia os limites da arquitetura teórica com conceitos como Informação de Gradiente Programável (PGI).

Esta comparação explora como a confiabilidade comprovada em batalha do YOLOv5 às inovações arquitetónicas do YOLOv9, ajudando-o a decidir qual modelo se adapta às suas necessidades específicas de visão computacional.

Comparação de Métricas de Desempenho

A tabela a seguir compara os dois modelos em vários tamanhos. Observe que, embora YOLOv9 maior precisão teórica (mAP), YOLOv5 competitivo em termos de velocidade e eficiência de recursos, especialmente para implementações legadas.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
parâmetros
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv5: O padrão para IA de produção

Desde o seu lançamento em 2020 pela Ultralytics, YOLOv5 tornou-se sinónimo de implementação prática de IA. Não era apenas uma arquitetura de modelo; era uma mudança completa no ecossistema. Antes do YOLOv5, o treino de modelos de deteção de objetos frequentemente exigia ficheiros de configuração complexos e estruturas frágeis baseadas em C. YOLOv5 uma PyTorch nativa PyTorch que tornou o treino tão simples quanto um único comando.

Saiba mais sobre o YOLOv5

Principais Pontos Fortes do YOLOv5

  1. Facilidade de uso incomparável: a marca registrada dos Ultralytics é a experiência do utilizador. YOLOv5 um fluxo de trabalho contínuo, desde a preparação do conjunto de dados até a implementação.
  2. Amplo suporte a plataformas: Oferece suporte nativo à exportação para CoreML, TFLitee ONNX, tornando-o incrivelmente versátil para aplicações móveis e de ponta.
  3. Baixa sobrecarga de recursos: Ao contrário das arquiteturas pesadas em transformadores que exigem muita GPU , YOLOv5 altamente eficiente, permitindo o treinamento em hardware de consumo ou até mesmo em notebooks gratuitos na nuvem, como Google .
  4. Estabilidade: Com anos de manutenção ativa, os casos extremos foram resolvidos, garantindo uma plataforma estável para aplicações de missão crítica em manufatura inteligente e segurança.

Exemplo de Facilidade de Uso

A execução da inferência com YOLOv5 ou qualquer Ultralytics ) é padronizada e simples:

from ultralytics import YOLO

# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Show results
results[0].show()

YOLOv9: Inovação arquitetónica com PGI

Lançado no início de 2024, YOLOv9 concentra-se em resolver o problema do gargalo de informação nas redes neurais profundas. À medida que as redes se tornam mais profundas, informações críticas podem ser perdidas durante o processo de feed-forward. YOLOv9 esse problema com a Informação de Gradiente Programável (PGI) e a Rede de Agregação de Camadas Eficiente Generalizada (GELAN).

Saiba mais sobre o YOLOv9

Avanços Arquitetônicos

  • Arquitetura GELAN: Esta nova arquitetura combina o melhor do CSPNet (usado no YOLOv5) e do ELAN (usado no YOLOv7) para maximizar a eficiência dos parâmetros. Ela permite que o modelo alcance maior precisão com menos parâmetros em comparação com arquiteturas mais antigas.
  • Informação de gradiente programável (PGI): A PGI gera gradientes fiáveis através de um ramo auxiliar que é utilizado apenas durante o treino. Isto garante que as camadas profundas retêm informação semântica sem adicionar custos de inferência, aumentando o desempenho em tarefas difíceis, como a deteção de pequenos objetos.

Análise comparativa: quando usar cada um?

A escolha entre estes dois modelos depende da sua prioridade: velocidade de implementação ou precisão máxima.

1. Eficiência do treino e ecossistema

YOLOv5 ganha em termos de maturidade do ecossistema. Está integrado em milhares de ferramentas de terceiros e conta com um enorme apoio da comunidade. Se precisar implementar um modelo hoje com o mínimo de atrito, YOLOv5 ou o mais recente YOLO11) é frequentemente a escolha mais segura.

YOLOv9 é totalmente compatível com o Ultralytics , o que significa que os utilizadores podem aproveitar os mesmos pipelines de treinamento simplificados. No entanto, a sua arquitetura complexa (ramificações auxiliares) pode, por vezes, tornar o treinamento mais lento e um pouco mais intensivo em termos de memória do que o YOLOv5 simplificado.

2. Implementação de borda vs. precisão do servidor

Para tarefas puramente orientadas para a precisão, como análise de imagens médicas offline ou inspeção industrial de alta precisão, o YOLOv9e supera significativamente o YOLOv5x, oferecendo um mAP de +5% mAP .

No entanto, para dispositivos de ponta como o Raspberry Pi ou NVIDIA , YOLOv5 continua a ser um dos favoritos. A sua arquitetura mais simples traduz-se bem na quantização int8 e, muitas vezes, produz velocidades de inferência mais rápidas em hardware limitado, embora modelos mais recentes, como o YOLO26, estejam a substituí-lo rapidamente neste nicho.

3. Versatilidade de Tarefas

Ambos os modelos são versáteis, mas a Ultralytics garante que eles suportem uma ampla gama de tarefas além da simples detecção:

  • Segmentação de instâncias: máscaras precisas ao nível do pixel.
  • Classificação: Rotulagem de imagem completa.
  • Estimativa de pose: rastreamento de pontos-chave para reconhecimento de atividades humanas.
  • OBB: Caixas Delimitadoras Orientadas para imagens aéreas.

O Futuro: YOLO26

Embora YOLOv5 YOLOv9 modelos excelentes, o campo evolui rapidamente. Os desenvolvedores que buscam o que há de mais moderno devem procurar o YOLO26.

Lançado em janeiro de 2026, o YOLO26 representa o culminar desses avanços arquitetónicos. Ele adota um design End-to-End NMS, popularizado pela primeira vez pelo YOLOv10, que elimina completamente a etapa de supressão não máxima, que causa grande latência. Além disso, ele apresenta o MuSGD Optimizer, um híbrido de SGD Muon, garantindo convergência e estabilidade mais rápidas.

Com melhorias como ProgLoss + STAL para deteção de pequenos objetos e a remoção do Distribution Focal Loss (DFL) para uma exportação mais simples, o YOLO26 oferece CPU até 43% mais rápida do que as gerações anteriores, tornando-o a escolha superior tanto para pesquisa como para produção.

Saiba mais sobre YOLO26

Conclusão

  • Escolha YOLOv5 se precisar de um modelo leve e testado em batalha para sistemas legados ou restrições extremas de recursos, onde o suporte a operadores mais recentes (como os do YOLOv9) pode ser insuficiente.
  • Escolha YOLOv9 se precisar de alta precisão em conjuntos de dados desafiadores e puder arcar com custos de recursos de treinamento ligeiramente mais elevados.
  • Escolha o YOLO26 para obter o melhor de todos os mundos: velocidade NMS, precisão de alto nível e recursos de última geração, como o otimizador MuSGD.

Para começar a utilizar qualquer um desses modelos, pode usar a Ultralytics para gerir os seus conjuntos de dados, treinar na nuvem e implementar sem esforço.

Começando

Você pode treinar qualquer um desses modelos usando oPython Ultralytics Python . Basta alterar o nome do modelo no seu script:

from ultralytics import YOLO

# Switch between models easily
model = YOLO("yolov5su.pt")  # YOLOv5
# model = YOLO("yolov9c.pt") # YOLOv9
# model = YOLO("yolo26n.pt") # YOLO26

# Train on your data
model.train(data="coco8.yaml", epochs=100)

Comentários