EfficientDet vs. YOLO: Uma comparação detalhada para a deteção de objectos
A escolha do modelo de deteção de objectos ideal é uma decisão crítica para projectos de visão por computador, uma vez que diferentes modelos oferecem vantagens únicas em termos de precisão, velocidade e eficiência. Esta página oferece uma comparação técnica detalhada entre o EfficientDet e o YOLO, dois modelos proeminentes no campo da deteção de objectos. Analisamos as suas arquitecturas, referências de desempenho e adequação a várias aplicações para o ajudar a fazer uma escolha informada.
EfficientDet
O EfficientDet foi introduzido pela Google em 2019 e é conhecido pela sua eficiência e escalabilidade na deteção de objectos. Atinge uma precisão de ponta com significativamente menos parâmetros e FLOPs em comparação com muitos detectores contemporâneos.
Arquitetura e principais caraterísticas
O EfficientDet utiliza uma série de inovações arquitectónicas para melhorar a eficiência e a precisão:
- Rede de backbone: Utiliza a EfficientNet como backbone, conhecida pela sua eficiência e escalabilidade, conseguida através da pesquisa de arquitetura neural.
- BiFPN (Bi-diretional Feature Pyramid Network): Uma rede de pirâmide de caraterísticas bidirecional ponderada que permite uma fusão eficiente e eficaz de caraterísticas multi-escala.
- Dimensionamento composto: Aumenta sistematicamente todas as dimensões do detetor (backbone, rede de caraterísticas, resolução da rede de previsão de caixa/classe) usando um coeficiente composto.
Métricas de desempenho
Os modelos EfficientDet são fornecidos em vários tamanhos (d0 a d7), oferecendo uma gama de compromissos de desempenho para se adaptarem a diferentes recursos computacionais.
- mAP: Obtém uma elevada precisão média (mAP) no conjunto de dados COCO, demonstrando uma forte precisão de deteção.
- Velocidade de inferência: Oferece uma gama de velocidades de inferência dependendo do tamanho do modelo, sendo os modelos mais pequenos adequados para aplicações em tempo real.
- Tamanho do modelo: Os modelos EfficientDet foram concebidos para serem eficientes em termos de parâmetros, levando a tamanhos de modelo mais pequenos em comparação com outros detectores de alta precisão.
Pontos fortes e pontos fracos
Pontos fortes:
- Elevada eficiência: Excelente equilíbrio entre precisão e custo computacional, tornando-o adequado para ambientes com recursos limitados.
- Escalabilidade: O escalonamento composto permite o escalonamento fácil do modelo para atingir os níveis de desempenho desejados.
- Precisão: Atinge a precisão mais avançada com menos parâmetros.
- Implementação bem documentada: O repositório AutoML da Google fornece uma implementação clara e modelos pré-treinados.
Pontos fracos:
- Complexidade: As estratégias BiFPN e de escalonamento composto aumentam a complexidade da arquitetura.
- Velocidade de inferência: Embora eficiente, a velocidade de inferência pode não ser tão rápida como a de alguns detectores em tempo real, como os modelos Ultralytics YOLO , especialmente para as variantes maiores do EfficientDet.
Casos de utilização
O EfficientDet é adequado para aplicações em que tanto a precisão como a eficiência são cruciais:
- Dispositivos móveis e periféricos: Devido à sua eficiência, pode ser implantado em dispositivos móveis e plataformas de computação periféricas.
- Robótica: Adequado para aplicações robóticas que requerem uma deteção de objectos precisa e eficiente.
- Aplicações com recursos limitados: Ideal para cenários em que os recursos computacionais são limitados, mas ainda é necessária uma elevada precisão.
Saiba mais sobre o EfficientDet
DAMO-YOLO
O YOLO, introduzido pelo Grupo Alibaba em 2022, foi concebido para uma deteção de objectos precisa e de alta velocidade, com especial ênfase nas aplicações industriais. Integra várias técnicas inovadoras para alcançar um equilíbrio entre velocidade e precisão.
Arquitetura e principais caraterísticas
A YOLO incorpora vários componentes inovadores na sua arquitetura:
- Backbone baseado em NAS: Utiliza um backbone de Pesquisa de Arquitetura Neural (NAS), optimizando a velocidade e a precisão.
- RepGFPN (Reparameterized Gradient Feature Pyramid Network): Uma rede de fusão de caraterísticas eficiente que melhora a representação de caraterísticas, mantendo a eficiência computacional.
- ZeroHead: Uma cabeça de deteção leve concebida para minimizar a latência.
- AlignedOTA (Aligned Optimal Transport Assignment): Uma estratégia de atribuição avançada para melhorar a formação e a precisão.
Métricas de desempenho
Os modelos YOLO estão disponíveis em diferentes tamanhos (t, s, m, l) para responder às diferentes necessidades de desempenho.
- mAP: Obtém um mAP competitivo no conjunto de dados COCO, demonstrando um forte desempenho na deteção de objectos.
- Velocidade de inferência: Dá prioridade a uma elevada velocidade de inferência, tornando-a adequada para aplicações em tempo real e sensíveis à latência.
- Tamanho do modelo: Concebido para ser eficiente, oferecendo um bom equilíbrio entre o tamanho do modelo e o desempenho.
Pontos fortes e pontos fracos
Pontos fortes:
- Alta velocidade: Velocidade de inferência excecional, optimizada para aplicações em tempo real.
- Foco industrial: Especificamente concebido para aplicações industriais, com ênfase na utilização prática.
- Precisão: Mantém uma elevada exatidão ao mesmo tempo que atinge velocidades de inferência rápidas.
- Técnicas avançadas: Integra técnicas de ponta como o backbone NAS e o AlignedOTA para um melhor desempenho.
- Código aberto: Disponível publicamente com código e modelos pré-treinados.
Pontos fracos:
- Relativamente novo: Sendo um modelo mais recente, a comunidade e o ecossistema podem ainda estar a desenvolver-se em comparação com modelos mais estabelecidos.
- Complexidade: A integração de múltiplas técnicas avançadas pode tornar a arquitetura complexa para ser modificada ou personalizada em profundidade.
Casos de utilização
O YOLO é particularmente eficaz em cenários que exigem a deteção de objectos em tempo real com elevada precisão:
- Inspeção industrial: Ideal para controlo de qualidade e inspeção em processos de fabrico.
- Condução autónoma: Adequado para veículos autónomos e sistemas avançados de assistência ao condutor (ADAS) em que a baixa latência é fundamental.
- Análise de vídeo em tempo real: Aplicações como a monitorização do tráfego e sistemas de segurança.
- IA de ponta: Implementação em dispositivos de ponta para processamento em tempo real.
Tabela de comparação de modelos
Modelo | tamanho (pixéis) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Conclusão
Tanto o EfficientDet como o YOLO são modelos poderosos de deteção de objectos com pontos fortes distintos. O EfficientDet destaca-se por fornecer uma gama de modelos eficientes com grande precisão, tornando-o versátil para várias aplicações, especialmente aquelas com restrições de recursos. O YOLO, por outro lado, foi concebido para inferência a alta velocidade sem sacrificar significativamente a precisão, tornando-o ideal para aplicações industriais e de ponta em tempo real.
Para os utilizadores interessados noutros modelos de deteção de objectos de elevado desempenho, Ultralytics oferece uma gama de modelos YOLO , incluindo YOLOv5, YOLOv8e o mais recente YOLO11. Também estão disponíveis comparações com outros modelos, como o YOLOX, para o ajudar a encontrar o melhor modelo para as suas necessidades específicas. Considere explorar o Ultralytics HUB para treinamento e implantação simplificados dos modelos YOLO .