Comparação de modelos: PP-YOLOE+ vs YOLO11 para deteção de objectos
Ao selecionar um modelo de visão por computador para deteção de objectos, é essencial compreender os pontos fortes e fracos das diferentes arquitecturas. Esta página oferece uma comparação técnica pormenorizada entre o PP-YOLOE+ e o Ultralytics YOLO11, dois modelos topo de gama, para o ajudar a tomar uma decisão informada.
Ultralytics YOLO11: Eficiência e versatilidade de ponta
Ultralytics YOLO11, da autoria de Glenn Jocher e Jing Qiu da Ultralytics e lançado em 2024-09-27, é a mais recente iteração da aclamada série YOLO . Foi concebido para a deteção de objectos em tempo real e destaca-se pelo equilíbrio entre velocidade e precisão em diversas aplicações. YOLO11 baseia-se nos modelos YOLO anteriores, introduzindo melhorias na arquitetura para um melhor desempenho e versatilidade em tarefas como a classificação de imagens, segmentação de instâncias e estimativa de pose.
Arquitetura e principais caraterísticas
YOLO11 mantém o paradigma de deteção de fase única e sem âncoras, dando prioridade à velocidade de inferência. As principais caraterísticas da arquitetura incluem:
- Backbone Eficiente: Um backbone simplificado para uma extração rápida de caraterísticas.
- Escalabilidade: Disponível em vários tamanhos (n, s, m, l, x) para atender a diferentes necessidades computacionais e ambientes de implantação, desde dispositivos de borda como o NVIDIA Jetson até servidores em nuvem.
- Versatilidade: Suporta várias tarefas de visão computacional para além da deteção de objectos, oferecendo uma solução flexível no âmbito do ecossistema Ultralytics .
Métricas de desempenho
YOLO11 demonstra um forte equilíbrio entre velocidade e precisão, tornando-o adequado para aplicações em tempo real.
- mAP: Atinge o estado da arte da precisão média (mAP) em conjuntos de dados como COCO. Consulte o guia de métricas de desempenhoYOLO para obter detalhes sobre o mAP e outras métricas de avaliação.
- Velocidade de inferência: Optimizado para uma inferência rápida, crucial para as necessidades de processamento em tempo real, como se vê na IA de visão em aplicações de streaming.
- Tamanho do modelo: Mantém um tamanho de modelo compacto, facilitando a implementação em dispositivos com recursos limitados.
Pontos fortes e pontos fracos
Pontos fortes:
- Versátil e preciso: Destaca-se em várias tarefas de visão, oferecendo elevada precisão e velocidade.
- Ecossistema de fácil utilização: Integração perfeita dentro do ecossistema Ultralytics , com uma abrangente Python e CLI abrangente.
- Implementação escalável: Vários tamanhos de modelos garantem a adaptabilidade a diferentes hardwares.
Pontos fracos:
- Exigência computacional: Os modelos de maiores dimensões podem ser computacionalmente intensivos, exigindo hardware potente para um desempenho ótimo em tempo real.
- Complexidade para novos utilizadores: Embora de fácil utilização, a afinação e a compreensão das nuances da arquitetura podem representar uma curva de aprendizagem para os novos utilizadores de visão por computador.
Casos de utilização ideais
YOLO11 é adequado para aplicações que exigem deteção de objectos em tempo real com elevada precisão:
- Análise de vídeo em tempo real: Aplicações como a gestão de filas de espera e sistemas de segurança beneficiam da sua velocidade e precisão.
- Implementação de IA de ponta: Eficiente para o processamento no dispositivo em plataformas como a Raspberry Pi.
- Sistemas autónomos: Ideal para automóveis de condução autónoma e robótica que exijam uma perceção rápida e precisa, tal como salientado em IA de visão em aplicações de condução autónoma.
PP-YOLOE+: Focado na exatidão e eficiente
A PP-YOLOE+ (Practical YOLO with Evolved Enhancement), desenvolvida pelos autores da PaddlePaddle na Baidu e lançada em 2022-04-02, foi concebida para uma deteção de objectos de elevada precisão com uma eficiência razoável. Trata-se de uma versão melhorada da série PP-YOLOE, centrada em aplicações industriais em que a precisão é fundamental. O PP-YOLOE+ dá prioridade à precisão sem sacrificar significativamente a velocidade de inferência e faz parte do zoo do modelo PaddleDetection.
Arquitetura e principais caraterísticas
O PP-YOLOE+ também adopta uma abordagem sem âncoras, privilegiando a precisão e a eficiência. As principais caraterísticas incluem:
- Foco na alta precisão: Arquitetonicamente aperfeiçoado para atingir uma precisão de topo em tarefas de deteção de objectos.
- Design eficiente: Equilibra a precisão com uma velocidade de inferência eficiente, adequada para aplicações exigentes.
- IntegraçãoPaddlePaddle : Aproveita a estrutura de aprendizagem profunda PaddlePaddle , beneficiando das suas optimizações e do seu ecossistema.
Métricas de desempenho
O PP-YOLOE+ é excelente em termos de precisão, mantendo uma velocidade competitiva:
- Elevada mAP: Obtém uma precisão média elevada (mAP), demonstrando uma forte exatidão em conjuntos de dados de referência como o COCO, conforme detalhado na documentação do PP-YOLOE+.
- Inferência eficiente: Proporciona um bom equilíbrio entre precisão e velocidade de inferência, adequado para aplicações industriais que requerem análise em tempo real.
- Tamanho do modelo: Oferece vários tamanhos de modelo para acomodar diferentes recursos computacionais.
Pontos fortes e pontos fracos
Pontos fortes:
- Precisão excecional: Dá prioridade a uma elevada precisão de deteção, crucial para aplicações de precisão crítica, como a inspeção de qualidade no fabrico.
- Foco industrial: Adequado para ambientes industriais que requerem uma deteção de objectos fiável e precisa.
- EcossistemaPaddlePaddle : Beneficia do ecossistema e das optimizações da estrutura PaddlePaddle .
Pontos fracos:
- Bloqueio do ecossistema: Principalmente dentro do ecossistema PaddlePaddle , o que pode ser uma consideração para utilizadores profundamente integrados noutras estruturas como PyTorch usado pelo Ultralytics YOLO.
- Menos versátil no contexto Ultralytics : Embora capaz, não está tão integrado nativamente na estrutura versátil de tarefas Ultralytics como YOLO11.
Casos de utilização ideais
O PP-YOLOE+ é ideal para aplicações em que a precisão é fundamental:
- Controlo de qualidade industrial: Aplicações que requerem uma deteção precisa de defeitos e garantia de qualidade nos processos de fabrico, tal como se vê na melhoria do fabrico com visão computacional.
- Agricultura de precisão: Tarefas como a monitorização das culturas e a estimativa do rendimento, em que a deteção precisa tem impacto na tomada de decisões, demonstradas na IA que impulsiona a inovação na agricultura.
- Imagiologia no sector da saúde: Análise de imagens médicas em que a precisão da deteção é crítica para o diagnóstico, como a deteção de tumores em imagiologia médica.
Tabela de comparação de modelos
Modelo | tamanho (pixéis) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Conclusão
Tanto o PP-YOLOE+ como YOLO11 são modelos robustos de deteção de objectos, cada um com vantagens únicas. YOLO11 fornece uma solução versátil e de elevado desempenho no âmbito do ecossistema Ultralytics , ideal para aplicações que requerem um equilíbrio entre velocidade e precisão em várias tarefas de visão. O PP-YOLOE+ destaca-se pela precisão e eficiência, sendo particularmente benéfico para os utilizadores no âmbito da estrutura PaddlePaddle e para aqueles que dão prioridade à precisão em ambientes industriais.
Os utilizadores interessados em explorar outros modelos no âmbito do ecossistema Ultralytics também podem considerar:
- YOLOv8 - Um modelo altamente versátil e fácil de utilizar da série YOLO .
- YOLOv9 - Conhecido pelos avanços em termos de precisão e eficiência.
- YOLO - Modelos concebidos através da Pesquisa de Arquitetura Neural para um desempenho optimizado.
- RT-DETR - Real-Time DEtection Transformer, que oferece uma abordagem arquitetónica diferente.
- YOLOv7, YOLOv6 e YOLOv5 - Versões anteriores da família YOLO , cada uma com as suas próprias caraterísticas de desempenho e pontos fortes.