YOLO11 EfficientDet: Uma comparação técnica de arquiteturas de visão
No cenário em rápida evolução da visão computacional, selecionar o modelo certo de deteção de objetos é fundamental para o sucesso do projeto. Esta comparação explora as diferenças técnicas entre Ultralytics YOLO11, um detetor em tempo real de última geração lançado no final de 2024, e Google , uma arquitetura altamente influente de 2019 que introduziu o dimensionamento composto no campo.
Embora o EfficientDet tenha estabelecido padrões de referência para a eficiência dos parâmetros no momento do seu lançamento, YOLO11 anos de inovação subsequente, com foco na maximização da velocidade de inferência, precisão e usabilidade para aplicações modernas de IA de ponta e na nuvem.
Modelo mais recente disponível
Embora YOLO11 um modelo poderoso, Ultralytics (lançado em janeiro de 2026) é agora a escolha recomendada de última geração para novos projetos. O YOLO26 oferece um design completo NMS, inferência mais rápida e precisão aprimorada.
Métricas de Desempenho e Análise
A tabela a seguir apresenta uma comparação direta das métricas de desempenho no COCO . As principais métricas incluem a precisão média (mAP) para acuratez, velocidade de inferência (latência) em diferentes hardwares, tamanho do modelo (parâmetros) e complexidade computacional (FLOPs).
| Modelo | tamanho (pixels) | mAPval 50-95 | Velocidade CPU ONNX (ms) | Velocidade T4 TensorRT10 (ms) | parâmetros (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Principais Conclusões
- Latência de inferência:YOLO11 Ultralytics YOLO11 superaYOLO11 o EfficientDet em termos de latência. Por exemplo, o YOLO11x alcança uma precisão mais elevada (54,7 mAP) do que o EfficientDet-d7 (53,7 mAP), ao mesmo tempo que funciona mais de 10 vezes mais rápido numa GPU T4 GPU 11,3 ms contra 128,07 ms).
- Eficiência da arquitetura: enquanto o EfficientDet otimiza para FLOPs (operações de ponto flutuante), YOLO11 otimizado para a utilização de hardware. Isso destaca uma distinção crucial nas métricas de desempenho da IA: FLOPs mais baixos nem sempre se traduzem em inferências mais rápidas no mundo real devido aos custos de acesso à memória e às restrições de paralelismo.
- Escalabilidade do modelo: YOLO11 uma curva de escalabilidade mais prática. O modelo «nano» (YOLO11n) fornece um mAP utilizável de 39,5 mAP velocidades incríveis, enquanto o menor EfficientDet-d0 fica para trás com 34,6 mAP.
Ultralytics YOLO11: Arquitetura e recursos
YOLO11 Ultralytics YOLO11 no legado da família YOLO You Only Look Once), aperfeiçoando a arquitetura para a era moderna da visão computacional. Ele introduz mudanças significativas na espinha dorsal e no pescoço para melhorar a extração de recursos e a velocidade de processamento.
Melhorias arquitetónicas notáveis incluem o bloco C3k2, uma versão refinada do gargalo Cross Stage Partial (CSP) usado em versões anteriores, e o módulo C2PSA (Cross Stage Partial Spatial Attention). Esses componentes permitem que o modelo capture padrões e contextos complexos em imagens com menos parâmetros.
- Autores: Glenn Jocher e Jing Qiu
- Organização:Ultralytics
- Data: 2024-09-27
- GitHub:ultralytics/ultralytics
- Documentação:Documentação do YOLO11
Pontos fortes do YOLO11
- Ecossistema unificado: YOLO11 não YOLO11 apenas um modelo de detecção; ele suporta segmentação de instâncias, estimativa de pose, OBB e classificação prontos para uso.
- Preparação para implementação: com o modo de exportação integrado, os utilizadores podem converter modelos para ONNX, TensorRT, CoreML e TFLite um único comando, garantindo uma implementação perfeita em dispositivos móveis e periféricos.
- Eficiência de treino: YOLO11 significativamente mais rápido do que arquiteturas mais antigas, como o EfficientDet, utilizando pipelines de aumento modernos e funções de perda otimizadas.
Google : Arquitetura e legado
O EfficientDet, desenvolvido pela equipa Google , introduziu o conceito de Compound Scaling (escalonamento composto) na deteção de objetos. Em vez de projetar manualmente modelos maiores, os autores propuseram um método para escalonar simultaneamente a resolução, a profundidade e a largura da rede.
O núcleo do EfficientDet é a BiFPN (Bi-directional Feature Pyramid Network), que permite uma fácil fusão de características em múltiplas escalas. Ele usa uma espinha dorsal EfficientNet, que também foi projetada usando Neural Architecture Search (NAS).
- Autores: Mingxing Tan, Ruoming Pang e Quoc V. Le
- Organização: Google
- Data: 2019-11-20
- Arxiv:1911.09070
- GitHub:google/automl
Forças e Limitações
- Eficiência dos parâmetros: O EfficientDet é historicamente conhecido por alcançar alta precisão com muito poucos parâmetros.
- Eficiência teórica: Embora tenha FLOPs baixos, as conexões complexas na camada BiFPN podem consumir muita memória e ser mais lentas para executar em GPUs em comparação com os caminhos convolucionais diretos do YOLO.
- Versatilidade limitada: O repositório original concentra-se principalmente na deteção, carecendo da flexibilidade nativa e multitarefa (segmentação, pose, OBB) encontrada na Ultralytics .
Análise comparativa: porquê escolher Ultralytics?
Ao comparar estes dois modelos para ambientes de produção em 2025 e 2026, as vantagens do Ultralytics tornam-se evidentes.
Facilidade de uso e experiência do programador
Ultralytics uma experiência de utilizador simplificada. A implementação YOLO11 apenas algumas linhas de Python , enquanto a utilização do EfficientDet frequentemente envolve navegar por bases de código legadas complexas ou TensorFlow .
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
Ecossistema Bem Mantido
O Ultralytics é mantido ativamente com atualizações frequentes. As questões levantadas no GitHub são resolvidas rapidamente e o suporte da comunidade é extenso. Em contrapartida, repositórios de pesquisa mais antigos, como o EfficientDet original, costumam ter atualizações pouco frequentes, o que os torna mais difíceis de manter em projetos comerciais de longo prazo.
Equilíbrio de Desempenho e Memória
YOLO11 um equilíbrio superior entre velocidade e precisão. As escolhas arquitetónicas no YOLO11 GPU , resultando em tempos de inferência mais rápidos, mesmo que a contagem teórica de FLOP seja superior à do EfficientDet. Além disso, Ultralytics são otimizados para um menor uso de memória durante o treino, permitindo aos utilizadores treinar modelos eficazes em GPUs de nível consumidor, ao contrário de muitas alternativas baseadas em Transformer que requerem uma enorme quantidade de VRAM.
Versatilidade em Diferentes Tarefas
Enquanto o EfficientDet é principalmente um detetor de objetos, YOLO11 como base para uma variedade de tarefas. Essa versatilidade reduz a necessidade de aprender diferentes estruturas para diferentes problemas.
Uma estrutura, várias tarefas
- Detecção: Identificar objetos e suas localizações.
- Segmentação: compreensão dos objetos ao nível do pixel.
- Estimativa de pose: Detete pontos-chave no corpo humano.
- Caixas delimitadoras orientadas (OBB): Detecta objetos rotacionados, como navios, em imagens aéreas.
- Classificação: Classifique imagens inteiras de forma eficiente.
Conclusão
Ambas as arquiteturas representam marcos significativos na história da visão computacional. O EfficientDet demonstrou o poder da Pesquisa de Arquitetura Neural e do escalonamento composto. No entanto, para aplicações práticas atuais, Ultralytics YOLO11 é a escolha superior. Oferece velocidades de inferência mais rápidas, maior precisão e um ecossistema amigável para desenvolvedores que reduz drasticamente o tempo de lançamento no mercado.
Para desenvolvedores que buscam o que há de mais recente em desempenho, recomendamos explorar o YOLO26, que se baseia no sucesso do YOLO11 eficiência ainda maior e um design NMS. Aqueles interessados em abordagens baseadas em transformadores também podem considerar o RT-DETR para reconhecimento de contexto global.
Descubra todo o potencial da IA visual visitando a Ultralytics para treinar, implementar e gerir os seus modelos na nuvem.