YOLO11 vs YOLOv7: Comparação técnica detalhada para deteção de objectos
A escolha do modelo de deteção de objectos correto é crucial para obter um desempenho ótimo em tarefas de visão por computador. Esta página oferece uma comparação técnica detalhada entre o Ultralytics YOLO11 e o YOLOv7, dois modelos avançados concebidos para uma deteção de objectos eficiente e precisa. Iremos explorar as suas nuances arquitectónicas, referências de desempenho e aplicações adequadas para o orientar na tomada de uma decisão informada.
Ultralytics YOLO11
Ultralytics YOLO11, da autoria de Glenn Jocher e Jing Qiu da Ultralytics e lançado em 2024-09-27, é a mais recente evolução da série YOLO . Centra-se no aumento da precisão e da eficiência na deteção de objectos, tornando-o versátil para uma vasta gama de aplicações do mundo real. Ultralytics YOLO11 baseia-se nos modelos YOLO anteriores, refinando a estrutura da rede para alcançar a precisão de deteção mais avançada, mantendo o desempenho em tempo real.
Arquitetura e caraterísticas principais:
A arquitetura do YOLO11 incorpora técnicas avançadas de extração de caraterísticas, resultando numa maior precisão com uma contagem de parâmetros reduzida em comparação com modelos como o YOLOv8. Essa otimização leva a velocidades mais rápidas do mecanismo de inferência e a menores demandas computacionais, tornando-o adequado para implantação em diversas plataformas, desde dispositivos de borda até infraestrutura de nuvem. YOLO11 suporta várias tarefas de visão computacional, incluindo deteção de objetos, segmentação de instâncias, classificação de imagens e estimativa de pose. O modelo está disponível no GitHub.
Métricas de desempenho e parâmetros de referência:
YOLO11 demonstra resultados impressionantes de precisão média (mAP) em diferentes tamanhos de modelo. Por exemplo, o YOLO11m atinge um mAPval50-95 de 51,5 num tamanho de imagem de 640, equilibrando a velocidade e a precisão de forma eficaz. As variantes mais pequenas, como o YOLO11n e o YOLO11s, oferecem uma inferência em tempo real mais rápida para aplicações que dão prioridade à velocidade, enquanto os modelos maiores, como o YOLO11x, maximizam a precisão. Para obter métricas detalhadas YOLO desempenhoYOLO , consulte a documentação Ultralytics .
Casos de utilização:
A precisão e eficiência melhoradas do YOLO11 tornam-no ideal para aplicações que requerem uma deteção de objectos precisa e em tempo real, tais como:
- Robótica: Para navegação precisa e interação de objectos em ambientes dinâmicos.
- Sistemas de segurança: Em sistemas de alarme de segurança avançados para deteção precisa de intrusões e monitorização abrangente.
- Análise de retalho: Para IA no retalho para melhorar a gestão do inventário e a análise aprofundada do comportamento do cliente.
- Automação industrial: Para um controlo de qualidade rigoroso e uma deteção eficiente de defeitos nos processos de fabrico.
Pontos fortes:
- Elevada precisão: Obtém mAP de última geração com arquitecturas refinadas.
- Inferência eficiente: Processamento rápido adequado para aplicações em tempo real.
- Tarefas versáteis: Suporta deteção de objectos, segmentação, classificação e estimativa de pose.
- Escalabilidade: Funciona eficazmente em diferentes hardwares, desde dispositivos de ponta até sistemas de nuvem.
Pontos fracos:
- Os modelos maiores podem exigir mais recursos computacionais em comparação com os modelos mais pequenos optimizados em termos de velocidade.
- A otimização para dispositivos de borda específicos pode exigir configurações adicionais de implementação de modelos.
YOLOv7
YOLOv7, introduzido em julho de 2022 por Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao do Instituto de Ciência da Informação, Academia Sinica, Taiwan, é conhecido por seu saco de brindes treinável que define um novo estado da arte para detectores de objetos em tempo real. Detalhado no seu artigo arXiv e no repositório GitHub, o YOLOv7 enfatiza a velocidade e a eficiência, mantendo uma elevada precisão nas tarefas de deteção de objectos.
Arquitetura e caraterísticas principais:
O YOLOv7 baseia-se na Efficient Layer Aggregation Network (ELAN) e introduz a Extended-ELAN (E-ELAN) para melhorar a capacidade de aprendizagem da rede. Utiliza técnicas como a re-parametrização do modelo e a atribuição dinâmica de etiquetas para melhorar a eficiência da formação e a velocidade de inferência. O YOLOv7 foi concebido para a deteção de objectos de elevado desempenho em várias aplicações.
Métricas de desempenho e parâmetros de referência:
O YOLOv7 demonstra excelentes métricas de desempenho, alcançando um mAP de 51,4% no conjunto de dados COCO com 640 imagens. A sua velocidade também é notável, com o modelo YOLOv7 de base a atingir 161 FPS na inferência do lote 1. Para obter referências de desempenho detalhadas, consulte o repositório oficial do YOLOv7 no GitHub.
Casos de utilização:
O equilíbrio entre velocidade e precisão do YOLOv7 torna-o adequado para uma vasta gama de aplicações, incluindo:
- Deteção de objectos em tempo real: Ideal para aplicações que requerem uma deteção rápida, como a condução autónoma e a análise de vídeo em ritmo acelerado.
- Computação de alto desempenho: Adequado para ambientes em que os recursos computacionais estão disponíveis e em que se dá prioridade a uma elevada exatidão juntamente com a velocidade.
- Investigação e desenvolvimento: Um modelo de base sólido para futuras investigações sobre arquitecturas de deteção de objectos e metodologias de formação.
Pontos fortes:
- Alta velocidade: Atinge velocidades de inferência impressionantes, adequadas para sistemas em tempo real.
- Boa precisão: Apresenta pontuações mAP competitivas em conjuntos de dados de referência.
- Arquitetura eficiente: Utiliza E-ELAN e re-parametrização de modelos para um melhor desempenho.
Pontos fracos:
- Pode exigir mais recursos computacionais em comparação com modelos mais pequenos e mais recentes, como o YOLO11n, para cenários de implantação na periferia.
- A arquitetura, embora eficiente, é menos versátil no apoio a diversas tarefas de visão para além da deteção de objectos, em comparação com a YOLO11.
Tabela de comparação de modelos
Modelo | tamanho (pixéis) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Conclusão
Tanto YOLO11 como o YOLOv7 são modelos poderosos de deteção de objectos, cada um com pontos fortes únicos. YOLO11 destaca-se pela versatilidade e eficiência, suportando múltiplas tarefas de visão com precisão e velocidade de ponta, tornando-o uma forte escolha para diversas aplicações e ambientes de implementação. O YOLOv7, embora também seja eficiente, está particularmente optimizado para a deteção de objectos a alta velocidade, adequado para aplicações em tempo real e para fins de investigação. A escolha entre eles depende dos requisitos específicos do seu projeto, equilibrando factores como a versatilidade da tarefa, as necessidades de precisão e as restrições de implementação.
Para os utilizadores interessados em explorar outros modelos, Ultralytics também oferece YOLOv8, conhecido pela sua eficiência e versatilidade simplificadas, e YOLOv5, amplamente adotado pela sua velocidade e facilidade de utilização. Pode também considerar comparar YOLO11 com o YOLOv9 ou explorar modelos como o RT-DETR para diferentes abordagens arquitectónicas à deteção de objectos.