Ir para o conteúdo

YOLOv5 vs YOLOv7: Uma Comparação Detalhada

Escolher o modelo de detecção de objetos certo é uma decisão crítica que equilibra a necessidade de velocidade, precisão e facilidade de implementação. Esta página oferece uma comparação técnica entre Ultralytics YOLOv5 e YOLOv7, dois modelos influentes no cenário da visão computacional. Embora ambos tenham feito contribuições significativas, Ultralytics YOLOv5 se destaca por seu excepcional equilíbrio de desempenho, design amigável e um ecossistema abrangente e bem mantido, tornando-o uma escolha preferida para uma ampla gama de aplicações do mundo real.

Ultralytics YOLOv5: O Padrão da Indústria Estabelecido

O Ultralytics YOLOv5, lançado em 2020 por Glenn Jocher, rapidamente se tornou um dos modelos de detecção de objetos mais populares devido à sua notável combinação de velocidade, precisão e facilidade de uso. Desenvolvido inteiramente em PyTorch, o YOLOv5 é altamente otimizado, oferecendo uma experiência simplificada desde o treinamento até a implementação.

Autor: Glenn Jocher
Organização: Ultralytics
Data: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Documentação: https://docs.ultralytics.com/models/yolov5/

Arquitetura e Principais Funcionalidades do YOLOv5

O YOLOv5 apresenta uma arquitetura flexível e eficiente construída sobre um backbone CSPDarknet53 e um neck PANet para agregação de recursos eficaz. Ele usa um head de detecção baseado em âncoras, que foi refinado ao longo de inúmeras versões. Uma de suas principais vantagens é a variedade de tamanhos de modelo (n, s, m, l, x), permitindo que os desenvolvedores selecionem a relação ideal entre desempenho e recursos computacionais. Essa escalabilidade o torna adequado para tudo, desde dispositivos de borda leves até servidores de nuvem poderosos.

Forças do YOLOv5

  • Facilidade de Uso: O YOLOv5 é conhecido por suas interfaces Python e CLI simples, documentação extensa e pipelines de treinamento e inferência diretos.
  • Ecosistema Bem Mantido: É suportado pelo robusto ecossistema Ultralytics, que inclui desenvolvimento ativo, uma grande comunidade, atualizações frequentes e ferramentas poderosas como o Ultralytics HUB para treinamento e implantação sem código.
  • Equilíbrio de Desempenho: YOLOv5 alcança um excelente equilíbrio entre velocidade de inferência e precisão de detecção, tornando-o altamente prático para diversos cenários do mundo real.
  • Versatilidade e Eficiência de Treinamento: Ele suporta múltiplas tarefas de visão, incluindo detecção de objetos, segmentação de instâncias e classificação de imagens. O processo de treinamento é eficiente, com pesos pré-treinados prontamente disponíveis e requisitos de memória mais baixos em comparação com arquiteturas mais complexas.

Fraquezas do YOLOv5

  • Limites de Precisão: Embora altamente preciso, modelos mais recentes superaram suas pontuações de mAP em benchmarks padrão como COCO.
  • Design Baseado em Âncoras: Sua dependência de caixas delimitadoras (anchor boxes) predefinidas pode, às vezes, exigir mais ajustes para conjuntos de dados com objetos de formato incomum em comparação com as abordagens modernas sem âncoras.

Casos de Uso para YOLOv5

  • Aplicações em Tempo Real: Ideal para aplicações que exigem inferência rápida, como robótica, visão de drones em aplicações de visão computacional em operações de drones com IA e análise de vídeo em tempo real.
  • Implantação Edge: Adequado para implantação em dispositivos edge com recursos limitados devido ao seu design eficiente e tamanhos de modelo menores. Explore os guias de implantação do NVIDIA Jetson.
  • Prototipagem Rápida: Uma excelente escolha para prototipagem e implementação rápidas de soluções de detecção de objetos, graças à sua facilidade de uso e suporte extensivo.

Saiba mais sobre o YOLOv5.

YOLOv7: Foco em Alta Precisão

O YOLOv7, criado por Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao, foi lançado em 6 de julho de 2022. Ele introduziu várias otimizações arquitetônicas e estratégias de treinamento, conhecidas como "trainable bag-of-freebies", com o objetivo de ampliar os limites da precisão, mantendo a velocidade em tempo real.

Autores: Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao
Organização: Instituto de Ciência da Informação, Academia Sinica, Taiwan
Data: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Docs: https://docs.ultralytics.com/models/yolov7/

Arquitetura e Principais Funcionalidades do YOLOv7

  • E-ELAN: Utiliza a Rede de Agregação de Camadas Eficientes Estendidas (E-ELAN) no backbone para aprimorar a capacidade de aprendizado.
  • Escalonamento de Modelo: Implementa escalonamento composto para profundidade e largura do modelo para otimizar para diferentes orçamentos computacionais.
  • Treinamento com Cabeçalho Auxiliar: Utiliza cabeçalhos auxiliares durante o treinamento (removidos durante a inferência) para melhorar o aprendizado de recursos.
  • Bag-of-Freebies: Aproveita técnicas de treino avançadas para aumentar a precisão sem aumentar o custo de inferência.

Pontos Fortes do YOLOv7

  • Alta Precisão: Alcança altas pontuações de mAP em benchmarks como COCO, particularmente com variantes de modelo maiores.
  • Técnicas de Treinamento Eficientes: Incorpora estratégias de treinamento inovadoras para maximizar o desempenho.

Fraquezas do YOLOv7

  • Complexidade: A arquitetura e o processo de treinamento podem ser mais complexos em comparação com a abordagem simplificada do Ultralytics YOLOv5.
  • Ecossistema e Suporte: Carece da extensa documentação, tutoriais e ecossistema integrado fornecidos pela Ultralytics para YOLOv5.
  • Uso Intenso de Recursos: Modelos maiores exigem recursos computacionais significativos, o que pode limitar a implementação em dispositivos com restrições.

Casos de Uso para YOLOv7

  • Detecção de Alto Desempenho: Adequado para aplicações onde alcançar a mais alta precisão absoluta é fundamental e os recursos computacionais são menos limitados, como em veículos autônomos.
  • Pesquisa: Usado em pesquisa acadêmica explorando técnicas de detecção de objetos de última geração.

Saiba mais sobre o YOLOv7.

Comparação Técnica e de Desempenho

Uma comparação direta do YOLOv5 e do YOLOv7 no conjunto de dados COCO revela as principais diferenças nos seus perfis de desempenho. Os modelos YOLOv7 geralmente alcançam pontuações de mAP mais altas, mas muitas vezes à custa de maior complexidade e requisitos de recursos. Em contraste, o Ultralytics YOLOv5 oferece um perfil mais equilibrado, destacando-se na velocidade de inferência da CPU e mantendo a precisão competitiva, o que é crucial para muitas implementações no mundo real.

Modelo tamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
parâmetros
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Conclusão: Qual Modelo Você Deve Escolher?

A escolha entre YOLOv5 e YOLOv7 depende muito das prioridades do projeto.

YOLOv7 é uma escolha forte para pesquisadores e desenvolvedores que precisam da maior precisão possível em benchmarks padrão e têm acesso a recursos computacionais significativos. Suas técnicas de treinamento inovadoras demonstram como ultrapassar os limites de desempenho.

No entanto, para a grande maioria das aplicações práticas, Ultralytics YOLOv5 continua sendo a escolha superior. Suas principais vantagens—facilidade de uso, implantação rápida, excelente equilíbrio entre velocidade e precisão e um ecossistema próspero—o tornam uma ferramenta incrivelmente eficiente e confiável. Ele capacita os desenvolvedores a construir soluções robustas de visão computacional rapidamente, desde o protótipo inicial até a implantação em produção.

Além disso, o ecossistema Ultralytics continuou a evoluir. Modelos mais recentes como YOLOv8 e YOLO11 se baseiam na base do YOLOv5, oferecendo desempenho ainda melhor e maior versatilidade em tarefas como segmentação, estimativa de pose e rastreamento. Para desenvolvedores que buscam uma estrutura moderna, à prova de futuro e fácil de usar, a família Ultralytics YOLO oferece a solução mais atraente e abrangente.

Explore Outros Modelos

Se você estiver explorando modelos de detecção de objetos, você também pode estar interessado nestas outras comparações:



📅 Criado há 1 ano ✏️ Atualizado há 1 mês

Comentários