YOLOv10 vs YOLOv7: Uma comparação pormenorizada
A escolha do modelo de deteção de objectos adequado é fundamental para os projectos de visão computacional.YOLO Ultralytics YOLO oferece uma gama de modelos adaptados a diferentes necessidades. Esta página apresenta uma comparação técnica entre o YOLOv10 e o YOLOv7, duas escolhas populares para tarefas de deteção de objectos. Analisaremos as suas arquitecturas, métricas de desempenho e aplicações ideais para o ajudar a tomar uma decisão informada.
Modelo | tamanho (pixéis) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv10
O YOLOv10, introduzido em maio de 2024 por investigadores da Universidade de Tsinghua, representa a vanguarda da deteção de objectos em tempo real. Detalhado no seu artigo Arxiv,"YOLOv10: Real-Time End-to-End Object Detection", Ao Wang, Hui Chen, Lihao Liu, et al. apresentam o YOLOv10 como um avanço significativo centrado tanto na eficiência como na precisão. A implementação oficial está disponível no GitHub. O YOLOv10 foi concebido para uma implementação de ponta a ponta, abordando a dependência das versões anteriores YOLO na Supressão Não Máxima (NMS).
Arquitetura e caraterísticas principais:
O YOLOv10 apresenta várias inovações arquitectónicas destinadas a aumentar a velocidade e a reduzir a redundância computacional. As principais caraterísticas incluem uma abordagem sem âncoras e uma conceção sem NMS, simplificando o pós-processamento e acelerando a inferência. O modelo adopta uma estratégia de conceção holística orientada para a eficiência e a precisão, optimizando vários componentes para obter o mínimo de sobrecarga e a máxima capacidade. Isto resulta num modelo que não só é mais rápido como também mantém uma precisão competitiva, tornando-o adequado para dispositivos de ponta e aplicações em tempo real.
Métricas de desempenho e parâmetros de referência:
Como mostra a tabela de comparação, os modelos YOLOv10, em particular as variantes YOLOv10n e YOLOv10s, oferecem velocidades de inferência impressionantes no TensorRT, atingindo 1,56 ms e 2,66 ms, respetivamente. O YOLOv10n atinge um mAPval50-95 de 39,5 com apenas 2,3M parâmetros e 6,7B FLOPs, enquanto o YOLOv10x atinge 54,4 mAPval50-95. Estas métricas destacam a capacidade do YOLOv10 de fornecer desempenho de ponta com recursos computacionais optimizados. Para uma compreensão mais aprofundada das métricas de desempenho YOLO , consulte a documentação do Ultralytics sobre as métricas de desempenhoYOLO .
Casos de utilização:
A ênfase do YOLOv10 no desempenho e na eficiência em tempo real torna-o ideal para aplicações que requerem uma deteção rápida de objectos com recursos computacionais limitados. Os casos de utilização adequados incluem:
- Aplicações de IA de ponta: Implementação em dispositivos periféricos para processamento em tempo real em cenários como câmaras inteligentes e dispositivos IoT.
- Robótica: Permitir um reconhecimento de objectos mais rápido e mais eficiente para a navegação e interação em sistemas robóticos, tal como referido em O papel da IA na robótica.
- Sistemas autónomos: Aplicações em veículos autónomos e drones em que a baixa latência é crucial para um funcionamento seguro e eficaz.
- Sistemas móveis e incorporados: Deteção de objectos em aplicações móveis e sistemas incorporados com poder computacional limitado.
Pontos fortes:
- Alta eficiência: Design sem NMS e arquitetura optimizada para uma inferência mais rápida e latência reduzida.
- Precisão competitiva: Mantém uma forte precisão enquanto melhora significativamente a velocidade.
- Implantação de ponta a ponta: Concebida para uma deteção de objectos em tempo real, sem falhas e de ponta a ponta.
- Modelos mais pequenos: A arquitetura eficiente conduz a modelos mais pequenos e a menos parâmetros em comparação com alguns dos seus antecessores.
Pontos fracos:
- Relativamente novo: Sendo um modelo mais recente, o YOLOv10 pode ter uma comunidade mais pequena e menos exemplos de implementação em comparação com modelos mais estabelecidos como o YOLOv7.
- Ajuste de desempenho: Para atingir o desempenho ideal, pode ser necessário um ajuste fino e a experimentação com diferentes tamanhos e configurações de modelos, conforme detalhado nas dicas de treinamento de modelos.
YOLOv7
O YOLOv7, introduzido em julho de 2022 por Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao, é um modelo de deteção de objectos altamente aclamado, conhecido pela sua eficiência e precisão. O modelo é detalhado no artigo do Arxiv,"YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors", e o repositório oficial do GitHub fornece detalhes de implementação. O YOLOv7 baseia-se nas versões anteriores YOLO , incorporando melhorias arquitectónicas para maximizar o desempenho sem aumentar substancialmente o custo computacional.
Arquitetura e caraterísticas principais:
O YOLOv7 incorpora várias inovações arquitectónicas para melhorar o seu desempenho e eficiência. As principais caraterísticas incluem:
- Redes de agregação de camadas eficientes alargadas (E-ELAN): Melhora as capacidades de aprendizagem e o fluxo de gradiente da rede.
- Escalonamento de modelos para modelos baseados em concatenação: Fornece diretrizes para um escalonamento eficaz da profundidade e da largura.
- Cabeça auxiliar e cabeça de chumbo grosso a fino: melhora a eficiência da formação e a precisão da deteção.
Estas caraterísticas contribuem para a capacidade do YOLOv7 de alcançar resultados de última geração em termos de velocidade e precisão, tornando-o uma escolha robusta para várias tarefas de deteção de objectos.
Métricas de desempenho e parâmetros de referência:
O YOLOv7 demonstra um forte equilíbrio entre velocidade e precisão. Conforme mostrado na tabela, o YOLOv7l atinge um mAPval50-95 de 51,4, enquanto o YOLOv7x atinge 53,1 mAPval50-95. Embora ligeiramente mais lento do que o YOLOv10n e o YOLOv10s na velocidade de inferência TensorRT , os modelos YOLOv7 ainda oferecem desempenho competitivo, particularmente quando se considera os tamanhos maiores do modelo YOLOv7. Para obter métricas detalhadas, consulte a documentação do YOLOv7.
Casos de utilização:
O equilíbrio entre precisão e eficiência do YOLOv7 torna-o adequado para aplicações que requerem uma deteção fiável de objectos em cenários em tempo real. Os casos de utilização ideais incluem:
- Veículos autónomos: Deteção robusta de objectos em ambientes de condução complexos, essencial para a IA em veículos autónomos.
- Sistemas de vigilância avançados: Elevada precisão para identificar potenciais ameaças à segurança em sistemas de segurança.
- Robótica: Reconhecimento preciso de objectos para manipulação e navegação em robótica, semelhante ao YOLOv10, mas potencialmente favorecendo a precisão em determinados cenários.
- Automação industrial: Controlo de qualidade e deteção de defeitos em processos de fabrico em que a precisão é fundamental.
Pontos fortes:
- Alta mAP: Obtém uma precisão média elevada, indicando uma excelente precisão na deteção de objectos.
- Inferência eficiente: Concebida para uma inferência rápida, adequada para aplicações em tempo real.
- Bem estabelecido e maduro: O YOLOv7 beneficia de uma comunidade maior e de uma utilização alargada, proporcionando mais recursos e apoio.
- Tamanhos de modelos gerenciáveis: Oferece um bom equilíbrio entre o tamanho do modelo e o desempenho.
Pontos fracos:
- Complexidade: A arquitetura é mais complexa do que alguns modelos mais simples, exigindo potencialmente mais conhecimentos para a afinação e otimização.
- Intensivo em termos de recursos em comparação com os nano-modelos: Embora eficiente, é mais intensivo em termos de computação do que modelos mais pequenos como o YOLOv10n, especialmente em ambientes com recursos extremamente limitados.
Outros modelos YOLO
Para além do YOLOv10 e do YOLOv7, Ultralytics oferece uma gama de modelos YOLO , cada um com pontos fortes únicos. Considere explorar o YOLOv8 para uma opção versátil e de fácil utilização, o YOLOv9 para avanços na arquitetura de rede e o YOLO11 para obter o mais recente desempenho de última geração. Também pode comparar o YOLOv7 com outros modelos como YOLOv5 e o YOLOX para compreender as suas vantagens e desvantagens específicas.