Saltar para o conteúdo

Comparação de modelos: PP-YOLOE+ vs YOLO11 para deteção de objectos

Ao selecionar um modelo de visão por computador para deteção de objectos, é essencial compreender os pontos fortes e fracos das diferentes arquitecturas. Esta página oferece uma comparação técnica pormenorizada entre o PP-YOLOE+ e o Ultralytics YOLO11, dois modelos topo de gama, para o ajudar a tomar uma decisão informada.

Ultralytics YOLO11: Eficiência e versatilidade de ponta

Ultralytics YOLO11, da autoria de Glenn Jocher e Jing Qiu da Ultralytics e lançado em 2024-09-27, é a mais recente iteração da aclamada série YOLO . Foi concebido para a deteção de objectos em tempo real e destaca-se pelo equilíbrio entre velocidade e precisão em diversas aplicações. YOLO11 baseia-se nos modelos YOLO anteriores, introduzindo melhorias na arquitetura para um melhor desempenho e versatilidade em tarefas como a classificação de imagens, segmentação de instâncias e estimativa de pose.

Arquitetura e principais caraterísticas

YOLO11 mantém o paradigma de deteção de fase única e sem âncoras, dando prioridade à velocidade de inferência. As principais caraterísticas da arquitetura incluem:

  • Backbone Eficiente: Um backbone simplificado para uma extração rápida de caraterísticas.
  • Escalabilidade: Disponível em vários tamanhos (n, s, m, l, x) para atender a diferentes necessidades computacionais e ambientes de implantação, desde dispositivos de borda como o NVIDIA Jetson até servidores em nuvem.
  • Versatilidade: Suporta várias tarefas de visão computacional para além da deteção de objectos, oferecendo uma solução flexível no âmbito do ecossistema Ultralytics .

Métricas de desempenho

YOLO11 demonstra um forte equilíbrio entre velocidade e precisão, tornando-o adequado para aplicações em tempo real.

  • mAP: Atinge o estado da arte da precisão média (mAP) em conjuntos de dados como COCO. Consulte o guia de métricas de desempenhoYOLO para obter detalhes sobre o mAP e outras métricas de avaliação.
  • Velocidade de inferência: Optimizado para uma inferência rápida, crucial para as necessidades de processamento em tempo real, como se vê na IA de visão em aplicações de streaming.
  • Tamanho do modelo: Mantém um tamanho de modelo compacto, facilitando a implementação em dispositivos com recursos limitados.

Saber mais sobre YOLO11

Pontos fortes e pontos fracos

Pontos fortes:

  • Versátil e preciso: Destaca-se em várias tarefas de visão, oferecendo elevada precisão e velocidade.
  • Ecossistema de fácil utilização: Integração perfeita dentro do ecossistema Ultralytics , com uma abrangente Python e CLI abrangente.
  • Implementação escalável: Vários tamanhos de modelos garantem a adaptabilidade a diferentes hardwares.

Pontos fracos:

  • Exigência computacional: Os modelos de maiores dimensões podem ser computacionalmente intensivos, exigindo hardware potente para um desempenho ótimo em tempo real.
  • Complexidade para novos utilizadores: Embora de fácil utilização, a afinação e a compreensão das nuances da arquitetura podem representar uma curva de aprendizagem para os novos utilizadores de visão por computador.

Casos de utilização ideais

YOLO11 é adequado para aplicações que exigem deteção de objectos em tempo real com elevada precisão:

  • Análise de vídeo em tempo real: Aplicações como a gestão de filas de espera e sistemas de segurança beneficiam da sua velocidade e precisão.
  • Implementação de IA de ponta: Eficiente para o processamento no dispositivo em plataformas como a Raspberry Pi.
  • Sistemas autónomos: Ideal para automóveis de condução autónoma e robótica que exijam uma perceção rápida e precisa, tal como salientado em IA de visão em aplicações de condução autónoma.

PP-YOLOE+: Focado na exatidão e eficiente

A PP-YOLOE+ (Practical YOLO with Evolved Enhancement), desenvolvida pelos autores da PaddlePaddle na Baidu e lançada em 2022-04-02, foi concebida para uma deteção de objectos de elevada precisão com uma eficiência razoável. Trata-se de uma versão melhorada da série PP-YOLOE, centrada em aplicações industriais em que a precisão é fundamental. O PP-YOLOE+ dá prioridade à precisão sem sacrificar significativamente a velocidade de inferência e faz parte do zoo do modelo PaddleDetection.

Arquitetura e principais caraterísticas

O PP-YOLOE+ também adopta uma abordagem sem âncoras, privilegiando a precisão e a eficiência. As principais caraterísticas incluem:

  • Foco na alta precisão: Arquitetonicamente aperfeiçoado para atingir uma precisão de topo em tarefas de deteção de objectos.
  • Design eficiente: Equilibra a precisão com uma velocidade de inferência eficiente, adequada para aplicações exigentes.
  • IntegraçãoPaddlePaddle : Aproveita a estrutura de aprendizagem profunda PaddlePaddle , beneficiando das suas optimizações e do seu ecossistema.

Métricas de desempenho

O PP-YOLOE+ é excelente em termos de precisão, mantendo uma velocidade competitiva:

  • Elevada mAP: Obtém uma precisão média elevada (mAP), demonstrando uma forte exatidão em conjuntos de dados de referência como o COCO, conforme detalhado na documentação do PP-YOLOE+.
  • Inferência eficiente: Proporciona um bom equilíbrio entre precisão e velocidade de inferência, adequado para aplicações industriais que requerem análise em tempo real.
  • Tamanho do modelo: Oferece vários tamanhos de modelo para acomodar diferentes recursos computacionais.

Saiba mais sobre PP-YOLOE+

Pontos fortes e pontos fracos

Pontos fortes:

  • Precisão excecional: Dá prioridade a uma elevada precisão de deteção, crucial para aplicações de precisão crítica, como a inspeção de qualidade no fabrico.
  • Foco industrial: Adequado para ambientes industriais que requerem uma deteção de objectos fiável e precisa.
  • EcossistemaPaddlePaddle : Beneficia do ecossistema e das optimizações da estrutura PaddlePaddle .

Pontos fracos:

  • Bloqueio do ecossistema: Principalmente dentro do ecossistema PaddlePaddle , o que pode ser uma consideração para utilizadores profundamente integrados noutras estruturas como PyTorch usado pelo Ultralytics YOLO.
  • Menos versátil no contexto Ultralytics : Embora capaz, não está tão integrado nativamente na estrutura versátil de tarefas Ultralytics como YOLO11.

Casos de utilização ideais

O PP-YOLOE+ é ideal para aplicações em que a precisão é fundamental:

Tabela de comparação de modelos

Modelo tamanho
(pixéis)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Conclusão

Tanto o PP-YOLOE+ como YOLO11 são modelos robustos de deteção de objectos, cada um com vantagens únicas. YOLO11 fornece uma solução versátil e de elevado desempenho no âmbito do ecossistema Ultralytics , ideal para aplicações que requerem um equilíbrio entre velocidade e precisão em várias tarefas de visão. O PP-YOLOE+ destaca-se pela precisão e eficiência, sendo particularmente benéfico para os utilizadores no âmbito da estrutura PaddlePaddle e para aqueles que dão prioridade à precisão em ambientes industriais.

Os utilizadores interessados em explorar outros modelos no âmbito do ecossistema Ultralytics também podem considerar:

  • YOLOv8 - Um modelo altamente versátil e fácil de utilizar da série YOLO .
  • YOLOv9 - Conhecido pelos avanços em termos de precisão e eficiência.
  • YOLO - Modelos concebidos através da Pesquisa de Arquitetura Neural para um desempenho optimizado.
  • RT-DETR - Real-Time DEtection Transformer, que oferece uma abordagem arquitetónica diferente.
  • YOLOv7, YOLOv6 e YOLOv5 - Versões anteriores da família YOLO , cada uma com as suas próprias caraterísticas de desempenho e pontos fortes.
📅C riado há 1 ano ✏️ Atualizado há 1 mês

Comentários