Comparação de modelos: YOLO11 vs PP-YOLOE+ para deteção de objectos
A escolha do modelo de deteção de objectos correto é crucial para os projectos de visão por computador. Ultralytics YOLO11 e o PP-YOLOE+ são ambos modelos topo de gama, cada um com pontos fortes únicos que respondem a diferentes necessidades de aplicação. Esta página fornece uma comparação técnica detalhada para ajudar a tomar uma decisão informada entre estes poderosos modelos.
Ultralytics YOLO11
Ultralytics YOLO11 é a mais recente iteração da série YOLO , desenvolvida pela Ultralytics. Conhecido pelas suas capacidades de deteção de objectos em tempo real, YOLO11 baseia-se nas versões anteriores, melhorando a velocidade e a precisão. Mantém o paradigma de deteção de fase única, dando prioridade à inferência eficiente sem comprometer a precisão.
Arquitetura e principais caraterísticas
YOLO11 apresenta uma arquitetura simplificada optimizada para uma inferência rápida. Incorpora avanços na topologia da rede e técnicas de formação para alcançar um equilíbrio entre o número de parâmetros e o desempenho. As principais caraterísticas da arquitetura incluem:
- Backbone eficiente: Utiliza uma rede de backbone altamente eficiente para uma extração rápida de caraterísticas.
- Deteção sem âncoras: Funciona sem caixas de ancoragem, simplificando o processo de deteção e melhorando a adaptabilidade em várias escalas de objectos, semelhante ao YOLOv8.
- Tamanhos de modelos escaláveis: Oferece uma gama de tamanhos de modelos (n, s, m, l, x) para se adaptar a diversos recursos computacionais, desde dispositivos de ponta a servidores de elevado desempenho, garantindo versatilidade na implementação.
Métricas de desempenho
YOLO11 destaca-se pelo equilíbrio entre velocidade e precisão, tornando-o adequado para aplicações em tempo real. Demonstra uma precisão média média (mAP) topo de gama em conjuntos de dados como o COCO, mantendo velocidades de inferência impressionantes. Os diferentes tamanhos de modelo oferecem diferentes compensações entre velocidade e precisão, conforme detalhado na tabela de comparação abaixo.
Casos de utilização e pontos fortes
YOLO11 é ideal para aplicações que requerem uma combinação de velocidade e elevada precisão:
- Análise de vídeo em tempo real: Aplicações como sistemas de segurança, monitorização de tráfego e gestão de filas de espera beneficiam da velocidade e precisão do YOLO11.
- Implantação de borda: A sua eficiência e tamanho compacto tornam YOLO11 excelente para ser implementado em dispositivos de ponta como o Raspberry Pi e oNVIDIA Jetson.
- Aplicações versáteis: Desde a IA no fabrico para controlo de qualidade à visão por computador para prevenção de roubos no retalho, a adaptabilidade do YOLO11 torna-o uma escolha forte em vários domínios.
Autoria e data:
- Autores: Glenn Jocher e Jing Qiu
- Organização: Ultralytics
- Data: 2024-09-27
- Ligação GitHub: Repositório GitHub doUltralytics YOLOv8
- Ligação à documentação: DocumentosUltralytics YOLO11
PP-YOLOE+
O PP-YOLOE+ (Practical PaddlePaddle You Only Look One-level Efficient Plus) foi desenvolvido pela Baidu como parte do zoo do modelo PaddleDetection. Centra-se na obtenção de uma elevada precisão na deteção de objectos, mantendo uma eficiência razoável. O PP-YOLOE+ é uma versão melhorada do PP-YOLOE, que incorpora aperfeiçoamentos arquitectónicos para melhorar o desempenho.
Arquitetura e principais caraterísticas
O PP-YOLOE+ é um modelo de deteção de objectos de fase única, sem âncoras. Simplifica o processo de deteção ao prever diretamente os centros dos objectos e os parâmetros da caixa delimitadora. As principais caraterísticas incluem:
- Design sem âncoras: Simplifica a arquitetura e a formação do modelo, evitando as complexidades das caixas de ancoragem.
- Arquitetura eficiente: Utiliza um backbone ResNet e centra-se em técnicas de otimização para reduzir a sobrecarga computacional, mantendo uma precisão competitiva.
- Integração do EcossistemaPaddlePaddle : Optimizado para uma integração e implementação perfeitas no âmbito da estrutura PaddlePaddle , tirando partido das vantagens do seu ecossistema.
Métricas de desempenho
Os modelos PP-YOLOE+ oferecem uma gama de configurações (t, s, m, l, x) para equilibrar precisão e velocidade. Embora as métricas detalhadas CPU velocidade CPU ONNX não estejam prontamente disponíveis nos dados fornecidos, os modelos PP-YOLOE+ demonstram velocidades competitivas de inferência mAP e TensorRT eficientes, adequadas para aplicações em que a precisão e a implementação eficiente são críticas.
Casos de utilização e pontos fortes
O PP-YOLOE+ é adequado para aplicações em que a elevada precisão e eficiência são fundamentais, particularmente no âmbito do ecossistema PaddlePaddle :
- Inspeção industrial: Ideal para verificações de qualidade a alta velocidade no fabrico, beneficiando da sua precisão e eficiência.
- Computação de ponta: Implementação eficiente em dispositivos móveis e incorporados devido à sua arquitetura optimizada.
- Robótica: Proporciona perceção em tempo real para robôs que operam em ambientes dinâmicos, tirando partido da sua velocidade e precisão.
- Processamento de alto rendimento: Adequado para cenários que requerem uma deteção rápida de objectos em grandes volumes de imagens ou fluxos de vídeo.
Autoria e data:
- Autores: PaddlePaddle Autores
- Organização: Baidu
- Data: 2022-04-02
- Ligação ArXiv: Artigo do ArXiv do PP-YOLOE
- Link do GitHub: Repositório GitHub do PaddleDetection
- Ligação da documentação: Documentação PP-YOLOE+
Tabela de comparação de modelos
Modelo | tamanho (pixéis) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Conclusão
Tanto YOLO11 como o PP-YOLOE+ são modelos robustos de deteção de objectos. YOLO11 proporciona uma experiência versátil e fácil de utilizar no ecossistema Ultralytics , equilibrando a velocidade e a precisão de forma eficaz em várias tarefas. O PP-YOLOE+ destaca-se pela precisão e eficiência, particularmente para utilizadores integrados na estrutura PaddlePaddle ou que dão prioridade ao design sem âncoras para aplicações industriais.
Para os utilizadores interessados noutros modelos, Ultralytics oferece uma gama de modelos de ponta, incluindo: