Ir para o conteúdo

YOLOv5 . EfficientDet: uma comparação técnica dos principais modelos de visão

No mundo da visão computacional, selecionar a arquitetura ideal para deteção de objetos é uma decisão crucial que afeta tudo, desde a precisão do modelo até os custos de implementação. Este guia fornece uma comparação técnica abrangente entre Ultralytics YOLOv5 e EfficientDet, dois modelos influentes que moldaram o panorama da IA moderna.

Enquanto o EfficientDet introduziu o conceito de eficiência escalável por meio do escalonamento composto, YOLOv5 o campo ao combinar desempenho de ponta com uma experiência de utilizador incomparável. Esta análise aprofunda as diferenças arquitetónicas, métricas de desempenho e aplicabilidade no mundo real para ajudar programadores e investigadores a fazerem escolhas baseadas em dados.

Visão Geral do Modelo

Ultralytics YOLOv5

YOLOv5 (You Only Look Once versão 5) é um modelo seminal na história da deteção de objetos. Lançado em meados de 2020 pela Ultralytics, rapidamente se tornou o padrão da indústria pelo seu equilíbrio entre velocidade, precisão e facilidade de uso. Ao contrário dos seus antecessores, YOLOv5 o primeiro YOLO a ser implementado nativamente no PyTorch, tornando-o excepcionalmente acessível tanto para a comunidade de pesquisa quanto para desenvolvedores empresariais.

Saiba mais sobre o YOLOv5

EfficientDet

EfficientDet é uma família de modelos de detecção de objetos desenvolvida pela Google . Baseia-se na estrutura EfficientNet e introduz uma rede piramidal bidirecional ponderada (BiFPN) e um método de dimensionamento composto que dimensiona uniformemente a resolução, a profundidade e a largura para todas as redes de estrutura, rede de recursos e redes de previsão de caixa/classe.

Benchmarks de Desempenho Interativos

Para compreender as vantagens e desvantagens entre estas arquiteturas, é essencial visualizar o seu desempenho em benchmarks padrão. O gráfico abaixo compara métricas-chave no COCO , destacando a fronteira entre velocidade e precisão.

Métricas Detalhadas de Desempenho

A tabela a seguir fornece uma visão detalhada do desempenho de várias escalas de modelos. Ultralytics demonstram consistentemente velocidades de inferência superiores, especialmente quando otimizados para aplicações em tempo real.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
parâmetros
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Arquitetura e Design

A diferença fundamental entre esses dois modelos reside na sua filosofia de design: YOLOv5 a inferência em tempo real e a facilidade de engenharia, enquanto o EfficientDet se concentra na eficiência dos parâmetros por meio da fusão de recursos complexos.

YOLOv5: Projetado para velocidade e usabilidade

YOLOv5 uma espinha dorsal CSPDarknet (Cross Stage Partial Network), que melhora o fluxo de gradiente e reduz os gargalos computacionais. O seu pescoço utiliza uma PANet (Path Aggregation Network) para agregar características em diferentes escalas, garantindo que objetos grandes e pequenos sejam detetados com alta precisão.

A Vantagem Ultralytics

Um dos maiores pontos fortes YOLOv5 é o seu design modular. O foco em «Bag of Freebies» e «Bag of Specials» — técnicas de otimização que melhoram a precisão sem aumentar o custo de inferência — torna-o incrivelmente robusto para diversos cenários de implementação.

EfficientDet: Compound Scaling e BiFPN

O EfficientDet é construído em torno da espinha dorsal do EfficientNet e introduz a BiFPN (Bi-directional Feature Pyramid Network, ou Rede Piramidal de Características Bidirecionais). Enquanto as FPNs padrão somam recursos de diferentes níveis, a BiFPN aplica pesos aprendíveis a esses recursos, permitindo que a rede aprenda quais recursos de entrada são mais importantes. Embora teoricamente eficiente em termos de FLOPs, os padrões complexos e irregulares de acesso à memória da BiFPN podem muitas vezes levar a uma inferência mais lenta no mundo real em GPUs, em comparação com a arquitetura CSPNet simplificada do YOLOv5.

Treino e Facilidade de Uso

Para os programadores, as métricas «suaves» de um modelo — a facilidade de treino, implementação e depuração — são frequentemente tão importantes quanto a precisão bruta.

Experiência de Usuário Otimizada

Ultralytics são famosos pela sua experiência «zero-to-hero». YOLOv5 uma interface de linha de comando (CLI) integrada e Python que permite aos utilizadores começar a treinar com dados personalizados em poucos minutos. Em contrapartida, as implementações do EfficientDet geralmente exigem ficheiros de configuração mais complexos e um conhecimento mais profundo do TensorFlow PyTorch específicos PyTorch para funcionar de forma eficaz.

Eficiência e Recursos de Treinamento

YOLOv5 altamente otimizado para eficiência de treino. Inclui recursos como cálculo automático de âncora, aumento de dados em mosaico e evolução de hiperparâmetros. Além disso, Ultralytics normalmente apresentam requisitos de memória significativamente menores durante o treino em comparação com o EfficientDet e arquiteturas baseadas em transformadores. Isso permite que os investigadores treinem lotes maiores em GPUs de nível consumidor, democratizando o acesso ao treino de modelos de ponta.

from ultralytics import YOLO

# Load a pre-trained YOLO model (recommended over YOLOv5 for new projects)
model = YOLO("yolo26n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

Versatilidade e Aplicações no Mundo Real

Embora o EfficientDet seja principalmente um detetor de objetos, o Ultralytics expandiu as capacidades do YOLO além das simples caixas delimitadoras.

Casos de Uso Ideais

Escolha Ultralytics YOLOv5 ou mais recente) se:

  • O desempenho em tempo real é fundamental: aplicações como condução autónoma, análise de vídeo e robótica exigem a baixa latência que YOLO oferecem.
  • Implementação de ponta: está a implementar em dispositivos móveis, Raspberry Pi ou NVIDIA , onde a memória e a capacidade de computação são limitadas.
  • Desenvolvimento rápido: você precisa iterar rapidamente com uma API estável e bem documentada e suporte ativo da comunidade.

Escolha o EfficientDet se:

  • As restrições de FLOPs são fundamentais: em cenários teóricos muito específicos, nos quais os FLOPs são a única restrição (em vez da latência), o dimensionamento do EfficientDet pode oferecer vantagens.
  • Referências de pesquisa: está a comparar especificamente com extratores de características baseados em EfficientNet num contexto académico.

O Futuro: YOLO26

Embora YOLOv5 uma ferramenta poderosa, o campo avançou. Ultralytics lançou Ultralytics o YOLO26, um modelo de última geração que redefine os padrões estabelecidos pelos seus antecessores.

O YOLO26 apresenta um design completo NMS, eliminando a necessidade de pós-processamento de supressão não máxima. Isso resulta em pipelines de implementação mais simples e inferência mais rápida. Além disso, o YOLO26 remove a perda focal de distribuição (DFL) para melhor compatibilidade de borda e utiliza o novo otimizador MuSGD, inspirado nas inovações de treinamento LLM, para garantir uma convergência estável.

Para os programadores que procuram o melhor desempenho absoluto, a migração para o YOLO26 é altamente recomendada. Ele oferece CPU até 43% mais rápida em comparação com as gerações anteriores, tornando-o a escolha superior para aplicações modernas de IA de ponta.

Saiba mais sobre YOLO26

Conclusão

Tanto YOLOv5 o EfficientDet conquistaram o seu lugar no hall da fama da visão computacional. O EfficientDet demonstrou o poder do dimensionamento composto, enquanto YOLOv5 que o alto desempenho pode ser acessível e fácil de usar.

No entanto, para aplicações práticas em 2026, o Ultralytics oferece uma vantagem distinta. A combinação de manutenção ativa, uma plataforma unificada para anotação e treinamento de dados e inovação arquitetónica contínua torna modelos como YOLOv5— e o avançado YOLO26— a escolha preferida dos profissionais.

Para aqueles interessados em explorar outras arquiteturas modernas, considere rever comparações com YOLO11 ou RT-DETR para compreender totalmente o leque de ferramentas disponíveis.


Comentários