Comparação técnica: YOLOX vs EfficientDet para deteção de objectos
Os modelos Ultralytics YOLO são conhecidos pela sua velocidade e precisão nas tarefas de deteção de objectos. Esta página oferece uma comparação técnica detalhada entre dois modelos de deteção de objectos proeminentes: Exploraremos as suas concepções arquitectónicas, referências de desempenho, metodologias de formação e aplicações ideais para o ajudar a selecionar o modelo mais adequado às suas necessidades de visão computacional.
YOLOX: Detetor sem âncora de alto desempenho
O YOLOX ("You Only Look Once X") é um detetor de objectos de ponta sem âncoras desenvolvido pela Megvii. Foi concebido para ser simples e ter um elevado desempenho, colmatando a lacuna entre a investigação e as aplicações práticas industriais.
Arquitetura e principais caraterísticas
O YOLOX distingue-se por um paradigma de deteção sem âncoras, simplificando a arquitetura e aumentando a eficiência. Os principais destaques da arquitetura incluem:
- Design sem âncoras: Elimina a complexidade das caixas de ancoragem, conduzindo a uma implementação mais simples e a uma generalização potencialmente melhor, especialmente para objectos com rácios de aspeto variáveis.
- Cabeça desacoplada: Separa as cabeças de classificação e localização, melhorando a otimização para cada tarefa e melhorando a precisão geral.
- Estratégias de formação avançadas: Utiliza técnicas como a atribuição de etiquetas SimOTA e um forte aumento de dados (MixUp e Mosaic) para garantir uma formação robusta e um melhor desempenho.
Autores: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li e Jian Sun Organização: Megvii Data: 2021-07-18 Link do Arxiv: https://arxiv.org/abs/2107.08430 Link do GitHub: https://github.com/Megvii-BaseDetection/YOLOX Link da documentação: https://yolox.readthedocs.io/en/latest/
Métricas de desempenho
Os modelos YOLOX oferecem um equilíbrio convincente de velocidade e precisão. Conforme ilustrado na tabela de comparação, o YOLOX atinge pontuações mAP competitivas, mantendo velocidades de inferência rápidas, o que o torna adequado para aplicações em tempo real. Para um desempenho detalhado em vários tamanhos de modelos, consulte a tabela abaixo.
Casos de utilização
- Deteção de objectos em tempo real: Ideal para aplicações que requerem uma deteção rápida, tais como sistemas de segurança e análise de vídeo em direto.
- Dispositivos de ponta: Desempenho eficiente em dispositivos com recursos limitados, como o NVIDIA Jetson e plataformas móveis.
- Sistemas autónomos: Adequado para robótica e veículos autónomos onde a perceção rápida e precisa é crucial.
Pontos fortes e pontos fracos
Pontos fortes:
- Alta velocidade de inferência: A arquitetura sem âncoras e o design optimizado contribuem para um processamento rápido.
- Simplicidade: O design simplificado facilita o treino e a implementação em comparação com os modelos baseados em âncoras.
- Bom equilíbrio entre precisão e velocidade: Oferece precisão competitiva sem sacrificar a velocidade de inferência.
Pontos fracos:
- mAP: Embora altamente eficiente, pode ser ligeiramente menos exato do que alguns modelos maiores e mais complexos em determinados cenários.
EfficientDet: Deteção de objectos escalável e eficiente
O EfficientDet, desenvolvido pela Google Research, é conhecido pela sua escalabilidade e eficiência na deteção de objectos. Utiliza uma família de modelos que alcançam uma precisão de ponta com um número significativamente menor de parâmetros e FLOPs em comparação com os detectores anteriores.
Arquitetura e principais caraterísticas
O EfficientDet apresenta várias inovações para melhorar a eficiência e a precisão:
- BiFPN (Rede de pirâmide de caraterísticas bidireccionais): Permite uma fusão eficiente de caraterísticas em várias escalas, permitindo que a rede utilize efetivamente caraterísticas em diferentes resoluções.
- Dimensionamento composto: Dimensiona uniformemente todas as dimensões da rede (backbone, BiFPN e rede de previsão de caixa/classe) usando um único coeficiente composto, simplificando o processo de dimensionamento e otimizando o desempenho.
- Backbone eficiente: Utiliza a EfficientNet como rede backbone, conhecida pela sua eficiência e forte capacidade de extração de caraterísticas.
Autores: Mingxing Tan, Ruoming Pang, e Quoc V. Le Organização: Google Data: 2019-11-20 Link do Arxiv: https://arxiv.org/abs/1911.09070 Link do GitHub: https:google Ligação à documentação: https:google
Métricas de desempenho
Os modelos EfficientDet foram concebidos para serem altamente eficientes em diferentes escalas, oferecendo uma gama de modelos de d0 a d7. Atingem excelentes pontuações de mAP com um número relativamente pequeno de parâmetros e FLOPs, o que os torna adequados para implementação em ambientes com recursos limitados. Consulte a tabela de comparação para obter métricas detalhadas.
Casos de utilização
- Implantação móvel e de borda: As dimensões reduzidas do modelo EfficientDet e a sua elevada eficiência tornam-no ideal para dispositivos móveis e cenários de computação de ponta.
- Aplicações que requerem elevada precisão com recursos limitados: Adequado para aplicações em que a precisão é fundamental, mas os recursos computacionais são limitados, como a inspeção de qualidade em dispositivos de ponta.
- Dispositivos alimentados por bateria: O design eficiente em termos energéticos permite a implementação em dispositivos alimentados por bateria e aplicações IoT.
Pontos fortes e pontos fracos
Pontos fortes:
- Alta eficiência: Atinge a precisão mais avançada com menos parâmetros e FLOPs, levando a uma inferência mais rápida e a um custo computacional mais baixo.
- Escalabilidade: O método de escalonamento composto permite o escalonamento fácil do modelo para satisfazer diferentes requisitos de precisão e de recursos.
- Precisão: Forte desempenho em termos de mAP, particularmente para modelos de pequena e média dimensão.
Pontos fracos:
- Velocidade de inferência: Embora eficiente, o EfficientDet pode ser mais lento do que os modelos especificamente optimizados para a velocidade, como o YOLOv10 ou o YOLOv8especialmente para as variantes maiores.
Saiba mais sobre o EfficientDet
Tabela de comparação de desempenho
Modelo | tamanho (pixéis) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Comparações relacionadas
Explore outras comparações interessantes entre modelos de deteção de objectos disponíveis nos documentos Ultralytics :
- YOLOv8 vs YOLOX: Uma comparação entre Ultralytics YOLOv8 e YOLOX.
- YOLOv7 vs YOLOX: Uma análise detalhada das arquitecturas e do desempenho do YOLOv7 e do YOLOX.
- YOLOv5 vs YOLOX: Comparação da eficiência e flexibilidade do YOLOv5 e do YOLOX.
- YOLOX vs YOLO11: Uma comparação técnica entre YOLOX e Ultralytics YOLO11.
- EfficientDet vs YOLOv5: Avaliação da eficiência do EfficientDet em relação ao YOLOv5.
- EfficientDet vs YOLOv7: Uma comparação de desempenho entre o EfficientDet e o YOLOv7.
- EfficientDet vs YOLOv8: Analisar os pontos fortes e fracos do EfficientDet e do YOLOv8.
- EfficientDet vs YOLOv10: Comparação entre os modelos mais recentes, EfficientDet e YOLOv10.