YOLO11 vs EfficientDet: Uma comparação técnica pormenorizada
Esta página oferece uma comparação técnica detalhada entre o Ultralytics YOLO11 e o EfficientDet, dois modelos de deteção de objectos proeminentes. Analisamos as suas arquitecturas, referências de desempenho e adequação a diferentes aplicações para o ajudar a selecionar o modelo ideal para as suas necessidades de visão computacional. Embora ambos os modelos visem uma deteção de objectos eficiente e precisa, provêm de diferentes linhas de investigaçãoUltralytics e Google) e empregam filosofias de arquitetura distintas.
Ultralytics YOLO11
Ultralytics YOLO11 representa o mais recente avanço da série YOLO (You Only Look Once), desenvolvida pela Ultralytics e conhecida pelas suas excepcionais capacidades de deteção de objectos em tempo real. Baseia-se no sucesso de antecessores como o YOLOv8concentrando-se na melhoria da precisão e da eficiência computacional.
Detalhes técnicos:
- Autores: Glenn Jocher, Jing Qiu
- Organização: Ultralytics
- Data: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Documentos: https://docs.ultralytics.com/models/yolo11/
Arquitetura e principais caraterísticas: YOLO11 utiliza uma arquitetura de fase única, sem âncoras, optimizada para velocidade e precisão. Os principais recursos incluem camadas refinadas de extração de recursos e uma estrutura de rede simplificada, reduzindo a contagem de parâmetros e a carga computacional. Esse design garante excelente desempenho em diversos hardwares, desde dispositivos de pontaNVIDIA Jetson, Raspberry Pi) até servidores em nuvem.
Uma das principais vantagens do YOLO11 é a sua versatilidade e integração no ecossistema Ultralytics . Suporta múltiplas tarefas para além da deteção de objectos, incluindo segmentação de instâncias, classificação de imagens, estimativa de pose e caixas delimitadoras orientadas (OBB). A estrutura Ultralytics oferece uma APIPython simples e CLIdocumentação extensa, pesos pré-treinados prontamente disponíveis e processos de treino eficientes com requisitos de memória mais baixos em comparação com muitas outras arquitecturas. O ecossistema beneficia de um desenvolvimento ativo, de um forte apoio da comunidade e de uma integração perfeita com ferramentas como o Ultralytics HUB para MLOps simplificados.
Métricas de desempenho: YOLO11 oferece modelos que vão desde o nano (n) ao extra-grande (x), proporcionando um compromisso flexível entre velocidade e precisão. Como se vê na tabela abaixo, os modelos YOLO11 alcançam pontuações mAP competitivas, mantendo altas velocidades de inferência, particularmente em GPUs. Por exemplo, o YOLO11m atinge 51,5 mAPval50-95com uma utilização eficiente dos parâmetros.
Pontos fortes:
- Alta velocidade e eficiência: Excelente velocidade de inferência, ideal para aplicações em tempo real.
- Forte precisão: Obtém pontuações de mAP de última geração em todos os tamanhos de modelos.
- Versatilidade: Suporta tarefas de deteção, segmentação, classificação, pose e OBB.
- Facilidade de utilização: API simples, documentação exaustiva e ecossistema de fácil utilização.
- Ecossistema bem mantido: Desenvolvido ativamente, comunidade forte, actualizações frequentes e ferramentas como o Ultralytics HUB.
- Eficiência de treino: Tempos de formação mais rápidos e menor utilização de memória em comparação com muitas alternativas.
- Flexibilidade de implantação: Otimizado para diversos hardwares, da borda à nuvem.
Pontos fracos:
- Os modelos mais pequenos dão prioridade à velocidade, o que pode implicar um compromisso na precisão máxima alcançável em comparação com as variantes maiores.
- Como detetor de uma fase, pode enfrentar desafios com objectos extremamente pequenos em determinadas cenas complexas.
Casos de utilização ideais: YOLO11 destaca-se em aplicações que exigem desempenho em tempo real e elevada precisão:
- Sistemas autónomos: Robótica e carros autónomos.
- Segurança: Sistemas de vigilância e prevenção de roubos.
- Automação industrial: Controlo de qualidade e eficiência de reciclagem.
- Retalho: Gestão de inventário e análise de clientes.
EfficientDet
O EfficientDet, desenvolvido pela equipa Google Brain, é uma família de modelos de deteção de objectos concebidos para uma elevada precisão e eficiência. Aproveita as inovações arquitectónicas derivadas dos modelos de classificação de imagens EfficientNet.
Detalhes técnicos:
- Autores: Mingxing Tan, Ruoming Pang, Quoc V. Le
- Organização: Google
- Data: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Documentos: https://github.com/google/automl/tree/master/efficientdet#readme
Arquitetura e principais caraterísticas: A arquitetura do EfficientDet caracteriza-se por:
- EfficientNet Backbone: Utiliza o EfficientNet altamente eficiente como seu extrator de caraterísticas de base.
- BiFPN (Rede de Pirâmide de Caraterísticas Bi-direcional): Utiliza uma FPN bidirecional ponderada para uma fusão eficaz de caraterísticas multi-escala.
- Dimensionamento composto: Utiliza um coeficiente composto para dimensionar uniformemente a profundidade, a largura e a resolução da espinha dorsal, da rede de caraterísticas e da cabeça de deteção.
Métricas de desempenho: Os modelos EfficientDet (D0-D7) fornecem uma gama de níveis de precisão e eficiência. Como mostra a tabela, o EfficientDet obtém boas pontuações de mAP, particularmente com modelos maiores, mas muitas vezes à custa de uma latência mais elevada em comparação com as variantes YOLO11 com precisão semelhante.
Pontos fortes:
- Elevada precisão: Obtém pontuações fortes no mAP, especialmente nos modelos maiores.
- Arquitetura escalável: O escalonamento composto permite o ajuste sistemático do tamanho e do desempenho do modelo.
- Fusão eficiente de caraterísticas: O BiFPN melhora a representação de caraterísticas em várias escalas.
Pontos fracos:
- Especificidade da tarefa: Centrado principalmente na deteção de objectos, não tem a versatilidade multitarefa do YOLO11.
- Ecossistema: Ecossistema menos integrado em comparação com o Ultralytics, potencialmente exigindo mais esforço para formação, implementação e suporte.
- Velocidade de inferência: Pode apresentar maior latência em comparação com modelos YOLO11 com precisão semelhante, especialmente em GPUs.
Casos de utilização ideais: O EfficientDet é adequado para aplicações em que é crucial alcançar uma elevada exatidão dentro de orçamentos computacionais específicos, tais como:
- Serviços de visão baseados na nuvem: Onde a latência pode ser menos crítica do que a maximização da precisão por FLOP.
- Investigação: Exploração de arquitecturas escaláveis e técnicas de fusão de caraterísticas.
Saiba mais sobre o EfficientDet
Comparação de desempenho
A tabela abaixo fornece uma comparação quantitativa entre as variantes YOLO11 e EfficientDet no conjunto de dados COCO. Note-se que YOLO11 oferece geralmente velocidades de inferência GPU significativamente mais rápidas (T4 TensorRT10) para níveis de mAP comparáveis e utiliza frequentemente menos parâmetros.
Modelo | tamanho (pixéis) |
mAPval 50-95 |
Velocidade CPU ONNX (ms) |
Velocidade T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Conclusão
Tanto YOLO11 como o EfficientDet são modelos poderosos de deteção de objectos, masYOLO11 Ultralytics YOLO11 oferece vantagens significativas para a maioria dos programadores e investigadores. A sua velocidade superior, especialmente em GPUs, combinada com uma precisão competitiva, torna-o ideal para aplicações em tempo real. Além disso, a versatilidade do YOLO11 em várias tarefas de visão (deteção, segmentação, classificação, pose, OBB), a facilidade de utilização, a formação eficiente, o menor consumo de memória e o robusto ecossistema Ultralytics proporcionam uma experiência de desenvolvimento mais simplificada e produtiva. Embora o EfficientDet ofereça uma forte precisão e escalabilidade, YOLO11 apresenta geralmente um melhor pacote global para diversos cenários de implementação e é a escolha recomendada.
Para uma exploração mais aprofundada, considere a comparação destes modelos com outros como o YOLOv10, YOLOv9, RT-DETRe YOLO. Pode encontrar mais comparações na documentaçãoUltralytics .