Comparação de modelos: YOLOv7 vs YOLOv8 para deteção de objectos
A seleção do modelo de deteção de objectos correto é crucial para obter um desempenho ótimo em tarefas de visão por computador. Esta página oferece uma comparação técnica entre o YOLOv7 e o Ultralytics YOLOv8, dois modelos populares no sector. Analisaremos as suas nuances arquitectónicas, referências de desempenho e aplicações ideais para orientar o seu processo de seleção de modelos.
YOLOv7: Elevado desempenho e eficiência
O YOLOv7, introduzido em 2022-07-06 por Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao do Instituto de Ciências da Informação, Academia Sinica, Taiwan, foi concebido para uma deteção de objectos precisa e de alta velocidade. Detalhado no seu artigo arXiv, o YOLOv7 centra-se no "saco de objectos livres treinável", melhorando a eficiência do treino e a precisão da deteção sem aumentar o custo da inferência.
Pontos fortes:
- Elevada precisão e velocidade: O YOLOv7 alcança um desempenho de deteção de objectos em tempo real de última geração, como demonstrado pelos seus testes de referência no conjunto de dados COCO.
- Arquitetura eficiente: Utiliza técnicas como a re-parametrização do modelo e a atribuição dinâmica de etiquetas para melhorar a eficiência do treino e da inferência.
- Flexibilidade: Oferece várias configurações de modelos (YOLOv7, YOLOv7-X, YOLOv7-W6, YOLOv7-E6, YOLOv7-D6, YOLOv7-E6E) para atender a diferentes recursos computacionais e necessidades de precisão.
Pontos fracos:
- Complexidade: A arquitetura e o processo de formação podem ser mais complexos em comparação com modelos mais simples, exigindo potencialmente mais conhecimentos para afinar e otimizar.
- Intensivo em recursos: Os modelos YOLOv7 de maiores dimensões exigem recursos computacionais significativos para formação e implementação, limitando a sua utilização em ambientes com recursos limitados.
Casos de utilização ideais:
O YOLOv7 é adequado para aplicações que requerem deteção de objectos em tempo real de alto nível, tais como:
- Sistemas avançados de videovigilância que necessitam de elevada precisão e velocidade.
- Condução autónoma e robótica em que o reconhecimento preciso e rápido de objectos é fundamental.
- Inspeção industrial para deteção de defeitos com elevado rendimento.
YOLOv8: Versatilidade e facilidade de utilização
Ultralytics YOLOv8, lançado em 2023-01-10 por Glenn Jocher, Ayush Chaurasia e Jing Qiu na Ultralytics, representa a vanguarda da série YOLO . Embora não seja acompanhado por um artigo arXiv dedicado, YOLOv8 realça a facilidade de utilização, a flexibilidade e o forte desempenho numa série de tarefas de visão, incluindo deteção de objectos, segmentação e estimativa de pose.
Pontos fortes:
- Desempenho equilibrado: YOLOv8 oferece um forte equilíbrio entre precisão e velocidade, tornando-o versátil para várias aplicações.
- Ecossistema de fácil utilização: Ultralytics fornece documentação abrangente, modelos pré-treinados e integração perfeita com o Ultralytics HUB, simplificando os fluxos de trabalho desde o treinamento até a implantação.
- Capacidades multi-tarefa: Suporta deteção de objectos, segmentação de instâncias, estimativa de pose, deteção orientada de objectos e classificação, fornecendo uma solução unificada para diversas necessidades de visão computacional.
- Desenvolvimento ativo e apoio da comunidade: Beneficia de actualizações contínuas e de uma grande e ativa comunidade de código aberto em torno dos projectos Ultralytics .
Pontos fracos:
- Desempenho de pico ligeiramente inferior: Em benchmarks específicos, particularmente para velocidade de deteção de objectos pura, o YOLOv7 pode ultrapassar ligeiramente o YOLOv8 em algumas configurações.
- Tamanho do modelo: Embora eficientes, os tamanhos dos modelos podem ainda ser substanciais para dispositivos de ponta com recursos extremamente limitados, em comparação com modelos altamente especializados como o YOLOv5 Nano.
Casos de utilização ideais:
YOLOv8 é excecionalmente versátil e adapta-se a um amplo espetro de aplicações, incluindo:
- Aplicações em tempo real que exigem um equilíbrio entre velocidade e precisão, tais como sistemas de alarme de segurança e robótica.
- Soluções versáteis de IA de visão em sectores como a agricultura, a indústria transformadora e os cuidados de saúde.
- Prototipagem e implementação rápidas devido à sua facilidade de utilização e ferramentas abrangentes no âmbito do ecossistema Ultralytics .
Modelo | tamanho (pixéis) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Para os utilizadores interessados em explorar outros modelos, Ultralytics também oferece uma gama de modelosYOLO , incluindo o eficiente YOLOv5e os versáteis YOLOv6 e YOLOv9. Além disso, para tarefas que requerem segmentação de instâncias, considere YOLOv8.
Em conclusão, tanto o YOLOv7 como YOLOv8 são modelos poderosos de deteção de objectos. O YOLOv7 destaca-se em cenários que exigem um desempenho máximo de deteção em tempo real, enquanto YOLOv8 proporciona uma experiência mais versátil e fácil de utilizar em várias tarefas de visão e ambientes de implementação. A sua escolha deve ser orientada pelas necessidades específicas da sua aplicação, considerando o equilíbrio entre precisão, velocidade, facilidade de utilização e recursos disponíveis.