Saltar para o conteúdo

YOLO11 vs EfficientDet: Uma comparação técnica pormenorizada

Esta página oferece uma comparação técnica detalhada entre o Ultralytics YOLO11 e o EfficientDet, dois modelos de deteção de objectos proeminentes. Analisamos as suas arquitecturas, referências de desempenho e adequação a diferentes aplicações para o ajudar a selecionar o modelo ideal para as suas necessidades de visão computacional. Embora ambos os modelos visem uma deteção de objectos eficiente e precisa, provêm de diferentes linhas de investigaçãoUltralytics e Google) e empregam filosofias de arquitetura distintas.

Ultralytics YOLO11

Ultralytics YOLO11 representa o mais recente avanço da série YOLO (You Only Look Once), desenvolvida pela Ultralytics e conhecida pelas suas excepcionais capacidades de deteção de objectos em tempo real. Baseia-se no sucesso de antecessores como o YOLOv8concentrando-se na melhoria da precisão e da eficiência computacional.

Detalhes técnicos:

Arquitetura e principais caraterísticas: YOLO11 utiliza uma arquitetura de fase única, sem âncoras, optimizada para velocidade e precisão. Os principais recursos incluem camadas refinadas de extração de recursos e uma estrutura de rede simplificada, reduzindo a contagem de parâmetros e a carga computacional. Esse design garante excelente desempenho em diversos hardwares, desde dispositivos de pontaNVIDIA Jetson, Raspberry Pi) até servidores em nuvem.

Uma das principais vantagens do YOLO11 é a sua versatilidade e integração no ecossistema Ultralytics . Suporta múltiplas tarefas para além da deteção de objectos, incluindo segmentação de instâncias, classificação de imagens, estimativa de pose e caixas delimitadoras orientadas (OBB). A estrutura Ultralytics oferece uma APIPython simples e CLIdocumentação extensa, pesos pré-treinados prontamente disponíveis e processos de treino eficientes com requisitos de memória mais baixos em comparação com muitas outras arquitecturas. O ecossistema beneficia de um desenvolvimento ativo, de um forte apoio da comunidade e de uma integração perfeita com ferramentas como o Ultralytics HUB para MLOps simplificados.

Métricas de desempenho: YOLO11 oferece modelos que vão desde o nano (n) ao extra-grande (x), proporcionando um compromisso flexível entre velocidade e precisão. Como se vê na tabela abaixo, os modelos YOLO11 alcançam pontuações mAP competitivas, mantendo altas velocidades de inferência, particularmente em GPUs. Por exemplo, o YOLO11m atinge 51,5 mAPval50-95com uma utilização eficiente dos parâmetros.

Pontos fortes:

  • Alta velocidade e eficiência: Excelente velocidade de inferência, ideal para aplicações em tempo real.
  • Forte precisão: Obtém pontuações de mAP de última geração em todos os tamanhos de modelos.
  • Versatilidade: Suporta tarefas de deteção, segmentação, classificação, pose e OBB.
  • Facilidade de utilização: API simples, documentação exaustiva e ecossistema de fácil utilização.
  • Ecossistema bem mantido: Desenvolvido ativamente, comunidade forte, actualizações frequentes e ferramentas como o Ultralytics HUB.
  • Eficiência de treino: Tempos de formação mais rápidos e menor utilização de memória em comparação com muitas alternativas.
  • Flexibilidade de implantação: Otimizado para diversos hardwares, da borda à nuvem.

Pontos fracos:

  • Os modelos mais pequenos dão prioridade à velocidade, o que pode implicar um compromisso na precisão máxima alcançável em comparação com as variantes maiores.
  • Como detetor de uma fase, pode enfrentar desafios com objectos extremamente pequenos em determinadas cenas complexas.

Casos de utilização ideais: YOLO11 destaca-se em aplicações que exigem desempenho em tempo real e elevada precisão:

Saber mais sobre YOLO11

EfficientDet

O EfficientDet, desenvolvido pela equipa Google Brain, é uma família de modelos de deteção de objectos concebidos para uma elevada precisão e eficiência. Aproveita as inovações arquitectónicas derivadas dos modelos de classificação de imagens EfficientNet.

Detalhes técnicos:

Arquitetura e principais caraterísticas: A arquitetura do EfficientDet caracteriza-se por:

  • EfficientNet Backbone: Utiliza o EfficientNet altamente eficiente como seu extrator de caraterísticas de base.
  • BiFPN (Rede de Pirâmide de Caraterísticas Bi-direcional): Utiliza uma FPN bidirecional ponderada para uma fusão eficaz de caraterísticas multi-escala.
  • Dimensionamento composto: Utiliza um coeficiente composto para dimensionar uniformemente a profundidade, a largura e a resolução da espinha dorsal, da rede de caraterísticas e da cabeça de deteção.

Métricas de desempenho: Os modelos EfficientDet (D0-D7) fornecem uma gama de níveis de precisão e eficiência. Como mostra a tabela, o EfficientDet obtém boas pontuações de mAP, particularmente com modelos maiores, mas muitas vezes à custa de uma latência mais elevada em comparação com as variantes YOLO11 com precisão semelhante.

Pontos fortes:

  • Elevada precisão: Obtém pontuações fortes no mAP, especialmente nos modelos maiores.
  • Arquitetura escalável: O escalonamento composto permite o ajuste sistemático do tamanho e do desempenho do modelo.
  • Fusão eficiente de caraterísticas: O BiFPN melhora a representação de caraterísticas em várias escalas.

Pontos fracos:

  • Especificidade da tarefa: Centrado principalmente na deteção de objectos, não tem a versatilidade multitarefa do YOLO11.
  • Ecossistema: Ecossistema menos integrado em comparação com o Ultralytics, potencialmente exigindo mais esforço para formação, implementação e suporte.
  • Velocidade de inferência: Pode apresentar maior latência em comparação com modelos YOLO11 com precisão semelhante, especialmente em GPUs.

Casos de utilização ideais: O EfficientDet é adequado para aplicações em que é crucial alcançar uma elevada exatidão dentro de orçamentos computacionais específicos, tais como:

  • Serviços de visão baseados na nuvem: Onde a latência pode ser menos crítica do que a maximização da precisão por FLOP.
  • Investigação: Exploração de arquitecturas escaláveis e técnicas de fusão de caraterísticas.

Saiba mais sobre o EfficientDet

Comparação de desempenho

A tabela abaixo fornece uma comparação quantitativa entre as variantes YOLO11 e EfficientDet no conjunto de dados COCO. Note-se que YOLO11 oferece geralmente velocidades de inferência GPU significativamente mais rápidas (T4 TensorRT10) para níveis de mAP comparáveis e utiliza frequentemente menos parâmetros.

Modelo tamanho
(pixéis)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

Conclusão

Tanto YOLO11 como o EfficientDet são modelos poderosos de deteção de objectos, masYOLO11 Ultralytics YOLO11 oferece vantagens significativas para a maioria dos programadores e investigadores. A sua velocidade superior, especialmente em GPUs, combinada com uma precisão competitiva, torna-o ideal para aplicações em tempo real. Além disso, a versatilidade do YOLO11 em várias tarefas de visão (deteção, segmentação, classificação, pose, OBB), a facilidade de utilização, a formação eficiente, o menor consumo de memória e o robusto ecossistema Ultralytics proporcionam uma experiência de desenvolvimento mais simplificada e produtiva. Embora o EfficientDet ofereça uma forte precisão e escalabilidade, YOLO11 apresenta geralmente um melhor pacote global para diversos cenários de implementação e é a escolha recomendada.

Para uma exploração mais aprofundada, considere a comparação destes modelos com outros como o YOLOv10, YOLOv9, RT-DETRe YOLO. Pode encontrar mais comparações na documentaçãoUltralytics .

📅C riado há 1 ano ✏️ Atualizado há 1 mês

Comentários