Saltar para o conteúdo

Comparação técnica: YOLOX vs EfficientDet para deteção de objectos

Os modelos Ultralytics YOLO são conhecidos pela sua velocidade e precisão nas tarefas de deteção de objectos. Esta página oferece uma comparação técnica detalhada entre dois modelos de deteção de objectos proeminentes: Exploraremos as suas concepções arquitectónicas, referências de desempenho, metodologias de formação e aplicações ideais para o ajudar a selecionar o modelo mais adequado às suas necessidades de visão computacional.

YOLOX: Detetor sem âncora de alto desempenho

O YOLOX ("You Only Look Once X") é um detetor de objectos de ponta sem âncoras desenvolvido pela Megvii. Foi concebido para ser simples e ter um elevado desempenho, colmatando a lacuna entre a investigação e as aplicações práticas industriais.

Arquitetura e principais caraterísticas

O YOLOX distingue-se por um paradigma de deteção sem âncoras, simplificando a arquitetura e aumentando a eficiência. Os principais destaques da arquitetura incluem:

  • Design sem âncoras: Elimina a complexidade das caixas de ancoragem, conduzindo a uma implementação mais simples e a uma generalização potencialmente melhor, especialmente para objectos com rácios de aspeto variáveis.
  • Cabeça desacoplada: Separa as cabeças de classificação e localização, melhorando a otimização para cada tarefa e melhorando a precisão geral.
  • Estratégias de formação avançadas: Utiliza técnicas como a atribuição de etiquetas SimOTA e um forte aumento de dados (MixUp e Mosaic) para garantir uma formação robusta e um melhor desempenho.

Autores: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li e Jian Sun Organização: Megvii Data: 2021-07-18 Link do Arxiv: https://arxiv.org/abs/2107.08430 Link do GitHub: https://github.com/Megvii-BaseDetection/YOLOX Link da documentação: https://yolox.readthedocs.io/en/latest/

Métricas de desempenho

Os modelos YOLOX oferecem um equilíbrio convincente de velocidade e precisão. Conforme ilustrado na tabela de comparação, o YOLOX atinge pontuações mAP competitivas, mantendo velocidades de inferência rápidas, o que o torna adequado para aplicações em tempo real. Para um desempenho detalhado em vários tamanhos de modelos, consulte a tabela abaixo.

Casos de utilização

  • Deteção de objectos em tempo real: Ideal para aplicações que requerem uma deteção rápida, tais como sistemas de segurança e análise de vídeo em direto.
  • Dispositivos de ponta: Desempenho eficiente em dispositivos com recursos limitados, como o NVIDIA Jetson e plataformas móveis.
  • Sistemas autónomos: Adequado para robótica e veículos autónomos onde a perceção rápida e precisa é crucial.

Pontos fortes e pontos fracos

Pontos fortes:

  • Alta velocidade de inferência: A arquitetura sem âncoras e o design optimizado contribuem para um processamento rápido.
  • Simplicidade: O design simplificado facilita o treino e a implementação em comparação com os modelos baseados em âncoras.
  • Bom equilíbrio entre precisão e velocidade: Oferece precisão competitiva sem sacrificar a velocidade de inferência.

Pontos fracos:

  • mAP: Embora altamente eficiente, pode ser ligeiramente menos exato do que alguns modelos maiores e mais complexos em determinados cenários.

Saber mais sobre YOLOX

EfficientDet: Deteção de objectos escalável e eficiente

O EfficientDet, desenvolvido pela Google Research, é conhecido pela sua escalabilidade e eficiência na deteção de objectos. Utiliza uma família de modelos que alcançam uma precisão de ponta com um número significativamente menor de parâmetros e FLOPs em comparação com os detectores anteriores.

Arquitetura e principais caraterísticas

O EfficientDet apresenta várias inovações para melhorar a eficiência e a precisão:

  • BiFPN (Rede de pirâmide de caraterísticas bidireccionais): Permite uma fusão eficiente de caraterísticas em várias escalas, permitindo que a rede utilize efetivamente caraterísticas em diferentes resoluções.
  • Dimensionamento composto: Dimensiona uniformemente todas as dimensões da rede (backbone, BiFPN e rede de previsão de caixa/classe) usando um único coeficiente composto, simplificando o processo de dimensionamento e otimizando o desempenho.
  • Backbone eficiente: Utiliza a EfficientNet como rede backbone, conhecida pela sua eficiência e forte capacidade de extração de caraterísticas.

Autores: Mingxing Tan, Ruoming Pang, e Quoc V. Le Organização: Google Data: 2019-11-20 Link do Arxiv: https://arxiv.org/abs/1911.09070 Link do GitHub: https:google Ligação à documentação: https:google

Métricas de desempenho

Os modelos EfficientDet foram concebidos para serem altamente eficientes em diferentes escalas, oferecendo uma gama de modelos de d0 a d7. Atingem excelentes pontuações de mAP com um número relativamente pequeno de parâmetros e FLOPs, o que os torna adequados para implementação em ambientes com recursos limitados. Consulte a tabela de comparação para obter métricas detalhadas.

Casos de utilização

  • Implantação móvel e de borda: As dimensões reduzidas do modelo EfficientDet e a sua elevada eficiência tornam-no ideal para dispositivos móveis e cenários de computação de ponta.
  • Aplicações que requerem elevada precisão com recursos limitados: Adequado para aplicações em que a precisão é fundamental, mas os recursos computacionais são limitados, como a inspeção de qualidade em dispositivos de ponta.
  • Dispositivos alimentados por bateria: O design eficiente em termos energéticos permite a implementação em dispositivos alimentados por bateria e aplicações IoT.

Pontos fortes e pontos fracos

Pontos fortes:

  • Alta eficiência: Atinge a precisão mais avançada com menos parâmetros e FLOPs, levando a uma inferência mais rápida e a um custo computacional mais baixo.
  • Escalabilidade: O método de escalonamento composto permite o escalonamento fácil do modelo para satisfazer diferentes requisitos de precisão e de recursos.
  • Precisão: Forte desempenho em termos de mAP, particularmente para modelos de pequena e média dimensão.

Pontos fracos:

  • Velocidade de inferência: Embora eficiente, o EfficientDet pode ser mais lento do que os modelos especificamente optimizados para a velocidade, como o YOLOv10 ou o YOLOv8especialmente para as variantes maiores.

Saiba mais sobre o EfficientDet

Tabela de comparação de desempenho

Modelo tamanho
(pixéis)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

Explore outras comparações interessantes entre modelos de deteção de objectos disponíveis nos documentos Ultralytics :

📅C riado há 1 ano ✏️ Atualizado há 1 mês

Comentários