YOLOv5 . EfficientDet: uma comparação técnica dos principais modelos de visão
No mundo da visão computacional, selecionar a arquitetura ideal para deteção de objetos é uma decisão crucial que afeta tudo, desde a precisão do modelo até os custos de implementação. Este guia fornece uma comparação técnica abrangente entre Ultralytics YOLOv5 e EfficientDet, dois modelos influentes que moldaram o panorama da IA moderna.
Enquanto o EfficientDet introduziu o conceito de eficiência escalável por meio do escalonamento composto, YOLOv5 o campo ao combinar desempenho de ponta com uma experiência de utilizador incomparável. Esta análise aprofunda as diferenças arquitetónicas, métricas de desempenho e aplicabilidade no mundo real para ajudar programadores e investigadores a fazerem escolhas baseadas em dados.
Visão Geral do Modelo
Ultralytics YOLOv5
YOLOv5 (You Only Look Once versão 5) é um modelo seminal na história da deteção de objetos. Lançado em meados de 2020 pela Ultralytics, rapidamente se tornou o padrão da indústria pelo seu equilíbrio entre velocidade, precisão e facilidade de uso. Ao contrário dos seus antecessores, YOLOv5 o primeiro YOLO a ser implementado nativamente no PyTorch, tornando-o excepcionalmente acessível tanto para a comunidade de pesquisa quanto para desenvolvedores empresariais.
- Autor: Glenn Jocher
- Organização:Ultralytics
- Data: 2020-06-26
- GitHub:Repositório Ultralytics YOLOv5
EfficientDet
EfficientDet é uma família de modelos de detecção de objetos desenvolvida pela Google . Baseia-se na estrutura EfficientNet e introduz uma rede piramidal bidirecional ponderada (BiFPN) e um método de dimensionamento composto que dimensiona uniformemente a resolução, a profundidade e a largura para todas as redes de estrutura, rede de recursos e redes de previsão de caixa/classe.
- Autores: Mingxing Tan, Ruoming Pang e Quoc V. Le
- Organização:Google Research
- Data: 2019-11-20
- Arxiv:EfficientDet: Detecção de Objetos Escalável e Eficiente
- GitHub:RepositórioGoogle
Benchmarks de Desempenho Interativos
Para compreender as vantagens e desvantagens entre estas arquiteturas, é essencial visualizar o seu desempenho em benchmarks padrão. O gráfico abaixo compara métricas-chave no COCO , destacando a fronteira entre velocidade e precisão.
Métricas Detalhadas de Desempenho
A tabela a seguir fornece uma visão detalhada do desempenho de várias escalas de modelos. Ultralytics demonstram consistentemente velocidades de inferência superiores, especialmente quando otimizados para aplicações em tempo real.
| Modelo | tamanho (pixels) | mAPval 50-95 | Velocidade CPU ONNX (ms) | Velocidade T4 TensorRT10 (ms) | parâmetros (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Arquitetura e Design
A diferença fundamental entre esses dois modelos reside na sua filosofia de design: YOLOv5 a inferência em tempo real e a facilidade de engenharia, enquanto o EfficientDet se concentra na eficiência dos parâmetros por meio da fusão de recursos complexos.
YOLOv5: Projetado para velocidade e usabilidade
YOLOv5 uma espinha dorsal CSPDarknet (Cross Stage Partial Network), que melhora o fluxo de gradiente e reduz os gargalos computacionais. O seu pescoço utiliza uma PANet (Path Aggregation Network) para agregar características em diferentes escalas, garantindo que objetos grandes e pequenos sejam detetados com alta precisão.
A Vantagem Ultralytics
Um dos maiores pontos fortes YOLOv5 é o seu design modular. O foco em «Bag of Freebies» e «Bag of Specials» — técnicas de otimização que melhoram a precisão sem aumentar o custo de inferência — torna-o incrivelmente robusto para diversos cenários de implementação.
EfficientDet: Compound Scaling e BiFPN
O EfficientDet é construído em torno da espinha dorsal do EfficientNet e introduz a BiFPN (Bi-directional Feature Pyramid Network, ou Rede Piramidal de Características Bidirecionais). Enquanto as FPNs padrão somam recursos de diferentes níveis, a BiFPN aplica pesos aprendíveis a esses recursos, permitindo que a rede aprenda quais recursos de entrada são mais importantes. Embora teoricamente eficiente em termos de FLOPs, os padrões complexos e irregulares de acesso à memória da BiFPN podem muitas vezes levar a uma inferência mais lenta no mundo real em GPUs, em comparação com a arquitetura CSPNet simplificada do YOLOv5.
Treino e Facilidade de Uso
Para os programadores, as métricas «suaves» de um modelo — a facilidade de treino, implementação e depuração — são frequentemente tão importantes quanto a precisão bruta.
Experiência de Usuário Otimizada
Ultralytics são famosos pela sua experiência «zero-to-hero». YOLOv5 uma interface de linha de comando (CLI) integrada e Python que permite aos utilizadores começar a treinar com dados personalizados em poucos minutos. Em contrapartida, as implementações do EfficientDet geralmente exigem ficheiros de configuração mais complexos e um conhecimento mais profundo do TensorFlow PyTorch específicos PyTorch para funcionar de forma eficaz.
Eficiência e Recursos de Treinamento
YOLOv5 altamente otimizado para eficiência de treino. Inclui recursos como cálculo automático de âncora, aumento de dados em mosaico e evolução de hiperparâmetros. Além disso, Ultralytics normalmente apresentam requisitos de memória significativamente menores durante o treino em comparação com o EfficientDet e arquiteturas baseadas em transformadores. Isso permite que os investigadores treinem lotes maiores em GPUs de nível consumidor, democratizando o acesso ao treino de modelos de ponta.
from ultralytics import YOLO
# Load a pre-trained YOLO model (recommended over YOLOv5 for new projects)
model = YOLO("yolo26n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
Versatilidade e Aplicações no Mundo Real
Embora o EfficientDet seja principalmente um detetor de objetos, o Ultralytics expandiu as capacidades do YOLO além das simples caixas delimitadoras.
- YOLOv5 : Suporta deteção de objetos, segmentação de instâncias e classificação de imagens.
- Recursos do EfficientDet: focado principalmente na detecção de objetos, com algumas adaptações para segmentação que são menos integradas a um fluxo de trabalho unificado.
Casos de Uso Ideais
Escolha Ultralytics YOLOv5 ou mais recente) se:
- O desempenho em tempo real é fundamental: aplicações como condução autónoma, análise de vídeo e robótica exigem a baixa latência que YOLO oferecem.
- Implementação de ponta: está a implementar em dispositivos móveis, Raspberry Pi ou NVIDIA , onde a memória e a capacidade de computação são limitadas.
- Desenvolvimento rápido: você precisa iterar rapidamente com uma API estável e bem documentada e suporte ativo da comunidade.
Escolha o EfficientDet se:
- As restrições de FLOPs são fundamentais: em cenários teóricos muito específicos, nos quais os FLOPs são a única restrição (em vez da latência), o dimensionamento do EfficientDet pode oferecer vantagens.
- Referências de pesquisa: está a comparar especificamente com extratores de características baseados em EfficientNet num contexto académico.
O Futuro: YOLO26
Embora YOLOv5 uma ferramenta poderosa, o campo avançou. Ultralytics lançou Ultralytics o YOLO26, um modelo de última geração que redefine os padrões estabelecidos pelos seus antecessores.
O YOLO26 apresenta um design completo NMS, eliminando a necessidade de pós-processamento de supressão não máxima. Isso resulta em pipelines de implementação mais simples e inferência mais rápida. Além disso, o YOLO26 remove a perda focal de distribuição (DFL) para melhor compatibilidade de borda e utiliza o novo otimizador MuSGD, inspirado nas inovações de treinamento LLM, para garantir uma convergência estável.
Para os programadores que procuram o melhor desempenho absoluto, a migração para o YOLO26 é altamente recomendada. Ele oferece CPU até 43% mais rápida em comparação com as gerações anteriores, tornando-o a escolha superior para aplicações modernas de IA de ponta.
Conclusão
Tanto YOLOv5 o EfficientDet conquistaram o seu lugar no hall da fama da visão computacional. O EfficientDet demonstrou o poder do dimensionamento composto, enquanto YOLOv5 que o alto desempenho pode ser acessível e fácil de usar.
No entanto, para aplicações práticas em 2026, o Ultralytics oferece uma vantagem distinta. A combinação de manutenção ativa, uma plataforma unificada para anotação e treinamento de dados e inovação arquitetónica contínua torna modelos como YOLOv5— e o avançado YOLO26— a escolha preferida dos profissionais.
Para aqueles interessados em explorar outras arquiteturas modernas, considere rever comparações com YOLO11 ou RT-DETR para compreender totalmente o leque de ferramentas disponíveis.