Ir para o conteúdo

YOLOv7 vs YOLO11: Uma Comparação Técnica Detalhada

Selecionar o modelo de detecção de objetos ideal requer um profundo conhecimento das capacidades específicas e das compensações de diferentes arquiteturas. Esta página fornece uma comparação técnica abrangente entre YOLOv7 e Ultralytics YOLO11, dois modelos poderosos na linhagem YOLO. Analisaremos suas diferenças arquitetônicas, benchmarks de desempenho e casos de uso ideais para ajudá-lo a escolher a melhor opção para seus projetos de visão computacional.

YOLOv7: Detecção de Objetos Eficiente e Precisa

YOLOv7 foi introduzido como um avanço significativo na detecção de objetos em tempo real, com foco na otimização da eficiência e precisão do treinamento sem aumentar os custos de inferência. Ele estabeleceu um novo estado da arte para detectores em tempo real após seu lançamento.

Autores: Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao
Organização: Instituto de Ciência da Informação, Academia Sinica, Taiwan
Data: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Docs: https://docs.ultralytics.com/models/yolov7/

Arquitetura e Principais Características

O YOLOv7 se baseia em arquiteturas YOLO anteriores, introduzindo várias inovações importantes. Ele emprega técnicas como Extended Efficient Layer Aggregation Networks (E-ELAN) no backbone para melhorar a extração e o aprendizado de recursos. Uma grande contribuição é o conceito de "trainable bag-of-freebies", que envolve estratégias de otimização aplicadas durante o treinamento—como o uso de uma cabeça de detecção auxiliar e orientação do geral para o específico—para aumentar a precisão final do modelo sem adicionar sobrecarga computacional durante a inferência. Embora focado principalmente na detecção de objetos, o repositório oficial mostra extensões da comunidade para tarefas como estimativa de pose e segmentação de instâncias.

Desempenho e Casos de Uso

O YOLOv7 demonstrou desempenho de última geração após o lançamento, oferecendo um equilíbrio atraente entre velocidade e precisão. Por exemplo, o modelo YOLOv7x atinge 53,1% mAPtest no conjunto de dados MS COCO em um tamanho de imagem de 640. Sua eficiência o torna adequado para aplicações em tempo real, como sistemas de segurança avançados e sistemas autônomos que exigem detecção rápida e precisa.

Pontos Fortes

  • Equilíbrio entre Alta Precisão e Velocidade: Oferece uma forte combinação de mAP e velocidade de inferência para tarefas em tempo real em GPU.
  • Treino Eficiente: Utiliza técnicas de treino avançadas ("bag-of-freebies") para melhorar a precisão sem aumentar o custo de inferência.
  • Desempenho Estabelecido: Resultados comprovados em benchmarks padrão como o MS COCO.

Fraquezas

  • Complexidade: A arquitetura e as técnicas de treino podem ser complexas de entender completamente e otimizar.
  • Uso Intenso de Recursos: Modelos YOLOv7 maiores exigem recursos significativos de GPU para treinamento.
  • Versatilidade Limitada de Tarefas: Focado principalmente na detecção de objetos, exigindo implementações separadas para outras tarefas, como segmentação ou classificação, ao contrário de modelos integrados, como o YOLO11.
  • Menos Mantido: A framework não é tão ativamente desenvolvida ou mantida quanto o ecossistema Ultralytics, levando a menos atualizações e menos suporte da comunidade.

Saiba mais sobre o YOLOv7.

Ultralytics YOLO11: Eficiência e versatilidade de última geração

Ultralytics YOLO11 representa a mais recente evolução na série YOLO da Ultralytics, projetada para precisão superior, eficiência aprimorada e versatilidade de tarefas mais ampla dentro de uma estrutura amigável. Ele se baseia nos sucessos de seus antecessores, como o YOLOv8, para oferecer uma experiência de última geração.

Autores: Glenn Jocher e Jing Qiu
Organização: Ultralytics
Data: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Docs: https://docs.ultralytics.com/models/yolo11/

Arquitetura e Principais Características

A arquitetura do YOLO11 incorpora técnicas avançadas de extração de características e um design de rede otimizado, resultando em maior precisão, frequentemente com uma contagem de parâmetros reduzida em comparação com seus antecessores. Essa otimização leva a velocidades de inferência mais rápidas e menores demandas computacionais, o que é crucial para a implementação em diversas plataformas, desde dispositivos de borda até infraestrutura de nuvem.

Uma vantagem fundamental do YOLO11 é a sua versatilidade. Suporta nativamente várias tarefas de visão computacional, incluindo deteção de objetos, segmentação de instâncias, classificação de imagens, estimação de pose e caixas delimitadoras orientadas (OBB). Integra-se perfeitamente no ecossistema Ultralytics, oferecendo uma experiência de utilizador simplificada através de interfaces simples de Python e CLI, documentação extensa e pesos pré-treinados prontamente disponíveis para treino eficiente.

Desempenho e Casos de Uso

O YOLO11 demonstra impressionantes pontuações de precisão média (mAP) em diferentes tamanhos de modelo, alcançando uma compensação entre velocidade e precisão favorável. Por exemplo, o YOLO11m atinge um mAPval de 51,5 em um tamanho de imagem de 640 com significativamente menos parâmetros do que o YOLOv7l. Variantes menores como o YOLO11n oferecem inferência excepcionalmente rápida, enquanto modelos maiores como o YOLO11x maximizam a precisão. Notavelmente, os modelos YOLO11 geralmente exibem menor uso de memória durante o treinamento e a inferência em comparação com outras arquiteturas.

A precisão e eficiência aprimoradas do YOLO11 o tornam ideal para aplicações que exigem processamento preciso e em tempo real:

Pontos Fortes

  • Desempenho de Última Geração: Altas pontuações de mAP com uma arquitetura otimizada e sem âncoras.
  • Inferência Eficiente: Excelente velocidade, especialmente na CPU, adequado para necessidades em tempo real.
  • Suporte Versátil a Tarefas: Lida nativamente com detecção, segmentação, classificação, pose e OBB em uma única estrutura.
  • Facilidade de Uso: API simples, documentação extensa e suporte integrado do Ultralytics HUB para treino e implementação sem código.
  • Ecossistema Bem Mantido: Desenvolvimento ativo, comunidade forte, atualizações frequentes e processos de treinamento eficientes.
  • Escalabilidade: Tem um desempenho eficaz em hardware, da borda à nuvem, com menores requisitos de memória.

Fraquezas

  • Como um modelo mais recente, algumas integrações específicas de ferramentas de terceiros ainda podem estar evoluindo em comparação com modelos mais antigos e estabelecidos.
  • Modelos maiores podem exigir recursos computacionais significativos para treinamento, embora permaneçam altamente eficientes para sua classe de desempenho.

Saiba mais sobre o YOLO11.

Comparativo de Desempenho: YOLOv7 vs. YOLO11

A tabela a seguir fornece uma comparação de desempenho detalhada entre os modelos YOLOv7 e YOLO11 no conjunto de dados COCO. Os modelos YOLO11 demonstram um equilíbrio superior de precisão, velocidade e eficiência. Por exemplo, o YOLO11l atinge um mAP mais alto do que o YOLOv7x com menos da metade dos parâmetros e FLOPs, e é significativamente mais rápido na GPU. Da mesma forma, o YOLO11m corresponde à precisão do YOLOv7l com cerca de metade dos parâmetros e custo computacional. O menor modelo, YOLO11n, oferece uma velocidade notável na CPU e na GPU com uso mínimo de recursos, tornando-o ideal para aplicações de ponta.

Modelo tamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
parâmetros
(M)
FLOPs
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Conclusão: Qual Modelo Você Deve Escolher?

Embora o YOLOv7 fosse um modelo poderoso para a sua época e ainda ofereça um forte desempenho para a deteção de objetos em tempo real, o Ultralytics YOLO11 representa um avanço significativo. O YOLO11 não só supera o YOLOv7 nas principais métricas de desempenho, como também oferece uma estrutura muito mais versátil, fácil de usar e bem suportada.

Para desenvolvedores e pesquisadores que buscam uma solução moderna e completa, YOLO11 é a escolha certa. Suas vantagens incluem:

  • Equilíbrio de Desempenho Superior: YOLO11 oferece um melhor compromisso entre precisão, velocidade e custo computacional.
  • Versatilidade Multi-Tarefa: O suporte nativo para detecção, segmentação, classificação, pose e OBB elimina a necessidade de múltiplos modelos e simplifica os fluxos de trabalho de desenvolvimento.
  • Facilidade de Uso: A API otimizada, a documentação abrangente e os procedimentos de treino simples tornam-no acessível tanto para principiantes como para especialistas.
  • Desenvolvimento Ativo: Como parte do ecossistema Ultralytics, o YOLO11 beneficia de atualizações contínuas, uma forte comunidade de código aberto e integração com ferramentas como o Ultralytics HUB para MLOps perfeitos.

Em resumo, se sua prioridade é aproveitar os mais recentes avanços em IA para uma ampla gama de aplicações com foco na facilidade de implantação e preparação para o futuro, o Ultralytics YOLO11 é o modelo recomendado.

Explore Outros Modelos

Para uma exploração mais aprofundada, considere estas comparações envolvendo YOLOv7, YOLO11 e outros modelos relevantes na documentação Ultralytics:



📅 Criado há 1 ano ✏️ Atualizado há 1 mês

Comentários