Ir para o conteúdo

YOLOv9 vs YOLOv5: Uma Comparação Detalhada

Esta página fornece uma comparação técnica entre dois modelos significativos de detecção de objetos: YOLOv9 e Ultralytics YOLOv5. Ambos os modelos fazem parte da influente série YOLO (You Only Look Once), conhecida por equilibrar velocidade e precisão na detecção de objetos em tempo real. Esta comparação explora suas diferenças arquitetônicas, métricas de desempenho e casos de uso ideais para ajudá-lo a selecionar o modelo mais adequado para seus projetos de visão computacional.

YOLOv9: Avançando na Precisão com Arquitetura Inovadora

O YOLOv9 foi introduzido em fevereiro de 2024, trazendo inovações arquitetónicas significativas para a vanguarda da deteção de objetos. O seu objetivo é resolver o problema da perda de informação em redes neurais profundas, um desafio crítico para treinar modelos altamente eficazes.

Autores: Chien-Yao Wang, Hong-Yuan Mark Liao
Organização: Instituto de Ciência da Informação, Academia Sinica, Taiwan
Data: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Documentação: https://docs.ultralytics.com/models/yolov9/

Arquitetura e Inovações

O YOLOv9 introduz dois conceitos inovadores detalhados no seu artigo, "YOLOv9: Aprendendo o Que Você Quer Aprender Usando Informação de Gradiente Programável":

  • Informação de Gradiente Programável (PGI): Esta nova abordagem foi projetada para enfrentar o problema do gargalo de informação que ocorre à medida que os dados fluem pelas camadas da rede profunda. O PGI garante que informações de entrada completas estejam disponíveis para calcular a função de perda, preservando assim dados cruciais para atualizações de gradiente mais precisas e um treinamento de modelo mais eficaz.
  • Rede de Agregação de Camadas Eficiente Generalizada (GELAN): O YOLOv9 também apresenta o GELAN, uma nova arquitetura de rede otimizada para utilização de parâmetros e eficiência computacional superiores. Ele se baseia nos princípios do CSPNet e ELAN para criar uma estrutura que atinge maior precisão com menos parâmetros e custos computacionais (FLOPs).

Pontos Fortes

  • Precisão Aprimorada: O YOLOv9 define um novo estado da arte no conjunto de dados COCO, superando muitos detectores de objetos em tempo real anteriores em Precisão Média (mAP).
  • Eficiência Aprimorada: A combinação de PGI e GELAN resulta em modelos que não são apenas altamente precisos, mas também computacionalmente eficientes, tornando-os poderosos para tarefas onde o desempenho é crítico.
  • Preservação de Informação: Ao abordar diretamente o gargalo de informação, o PGI permite o treinamento de redes mais profundas e complexas sem a degradação típica no desempenho, levando a modelos mais robustos.

Fraquezas

  • Recursos de Treinamento: Conforme observado na documentação do YOLOv9, o treinamento de modelos YOLOv9 pode ser mais intensivo em recursos e demorado em comparação com modelos mais estabelecidos como o YOLOv5.
  • Ecossistema Mais Recente: Como um modelo mais recente de um grupo de pesquisa diferente, seu ecossistema, suporte da comunidade e integrações de terceiros são menos maduros do que os do Ultralytics YOLOv5 bem estabelecido.
  • Versatilidade de Tarefas: O YOLOv9 original foca-se principalmente na detecção de objetos. Ele não possui suporte integrado para outras tarefas de visão computacional, como segmentação de instâncias, classificação de imagens e estimativa de pose, que são suportadas nativamente em modelos Ultralytics.

Casos de Uso

  • Aplicações que exigem a maior precisão possível na deteção de objetos, como análise de vídeo avançada e inspeção industrial de alta precisão.
  • Cenários onde a eficiência computacional deve ser equilibrada com o desempenho de ponta, como em IA para gestão de tráfego.
  • Investigação e desenvolvimento em visão computacional avançada, onde a exploração de arquiteturas inovadoras é uma prioridade.

Saiba mais sobre o YOLOv9.

Ultralytics YOLOv5: O Padrão Estabelecido e Versátil

Lançado em 2020, o Ultralytics YOLOv5 tornou-se rapidamente um padrão da indústria devido ao seu equilíbrio excecional de velocidade, precisão e facilidade de utilização. Desenvolvido inteiramente em PyTorch, tem sido continuamente aperfeiçoado e é apoiado por um ecossistema robusto.

Autor: Glenn Jocher
Organização: Ultralytics
Data: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Documentação: https://docs.ultralytics.com/models/yolov5/

Arquitetura e Funcionalidades

O YOLOv5 utiliza uma arquitetura comprovada com um backbone CSPDarknet53 e um neck PANet para agregação eficaz de recursos. Seu head de detecção baseado em âncoras é altamente eficiente. O modelo está disponível em vários tamanhos (n, s, m, l, x), permitindo que os desenvolvedores escolham a combinação perfeita entre desempenho e restrições de recursos.

Pontos Fortes

  • Velocidade e Eficiência Excepcionais: YOLOv5 é altamente otimizado para inferência rápida, tornando-o ideal para aplicações em tempo real em uma ampla gama de hardware, desde GPUs poderosas até dispositivos de borda com recursos limitados.
  • Facilidade de Uso: Reconhecido pela sua experiência de utilizador otimizada, o YOLOv5 oferece interfaces simples de Python e CLI, juntamente com documentação extensa e clara.
  • Ecossistema Bem Mantido: O YOLOv5 se beneficia do ecossistema abrangente da Ultralytics, que inclui desenvolvimento ativo, uma comunidade grande e de apoio no Discord, atualizações frequentes e ferramentas poderosas como o Ultralytics HUB para treinamento e implantação sem código.
  • Equilíbrio de Desempenho: Alcança um forte equilíbrio entre velocidade de inferência e precisão de detecção, tornando-o adequado para uma ampla gama de cenários de implementação no mundo real.
  • Versatilidade: Ao contrário de muitos modelos especializados, o YOLOv5 suporta múltiplas tarefas prontas para uso, incluindo detecção de objetos, segmentação de instâncias e classificação de imagens.
  • Eficiência no Treinamento: O YOLOv5 oferece processos de treinamento eficientes, pesos pré-treinados prontamente disponíveis e requisitos de memória geralmente mais baixos em comparação com muitas outras arquiteturas, especialmente modelos baseados em transformer.

Fraquezas

  • Precisão Máxima: Embora altamente preciso para a sua época, modelos mais recentes como o YOLOv9 podem alcançar pontuações mAP mais elevadas em benchmarks como o COCO.
  • Design Baseado em Âncoras: Ele se baseia em caixas delimitadoras (anchor boxes) predefinidas, o que pode exigir mais ajustes para conjuntos de dados com objetos de formato incomum em comparação com as abordagens modernas sem âncoras.

Casos de Uso

Saiba mais sobre o YOLOv5.

Desempenho e Benchmarks: YOLOv9 vs. YOLOv5

A comparação de desempenho entre o YOLOv9 e o YOLOv5 destaca os avanços na arquitetura do modelo ao longo dos anos. Os modelos YOLOv9 consistentemente alcançam pontuações de mAP mais altas do que suas contrapartes YOLOv5, muitas vezes com um uso mais eficiente de parâmetros e FLOPs na extremidade superior. Por exemplo, o YOLOv9-C atinge 53,0% de mAP com 25,3 milhões de parâmetros, superando os 50,7% de mAP do YOLOv5x com 86,7 milhões de parâmetros.

No entanto, o YOLOv5 se destaca em velocidade, especialmente suas variantes menores como o YOLOv5n e o YOLOv5s, que oferecem tempos de inferência extremamente rápidos tanto na CPU quanto na GPU, tornando-os imbatíveis para muitas aplicações de borda em tempo real.

Modelo tamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
parâmetros
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Conclusão: Qual Modelo Você Deve Escolher?

A escolha entre YOLOv9 e YOLOv5 depende muito das necessidades específicas do seu projeto.

  • YOLOv9 é a escolha superior para aplicações onde a precisão máxima é o objetivo principal, e você tem recursos computacionais suficientes para o treinamento. Sua arquitetura inovadora a torna ideal para expandir os limites do desempenho de detecção de objetos em campos especializados.

  • Ultralytics YOLOv5 continua sendo a opção mais prática e versátil para uma gama mais ampla de aplicações. Suas principais vantagens—facilidade de uso, velocidade, suporte multitarefa e um ecossistema maduro e bem suportado—o tornam o modelo ideal para desenvolvedores que precisam construir soluções robustas e do mundo real de forma rápida e eficiente. Para projetos que exigem implantação em dispositivos de borda ou um equilíbrio entre velocidade e precisão, o YOLOv5 é geralmente a escolha ideal.

Para aqueles que procuram um meio-termo ou recursos ainda mais avançados, a Ultralytics oferece um conjunto completo de modelos. Considere explorar o YOLOv8, que combina muitos dos benefícios de usabilidade do YOLOv5 com uma arquitetura sem âncoras e ainda maior versatilidade, ou o mais recente YOLO11 para desempenho de ponta dentro do ecossistema Ultralytics. Você pode encontrar mais comparações na nossa página de comparação de modelos.



📅 Criado há 1 ano ✏️ Atualizado há 1 mês

Comentários