Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 vs YOLOv5#

Escolher a arquitetura de rede neural certa é fundamental para implementar pipelines de visão computacional de sucesso em produção. Esta página fornece uma análise técnica aprofundada comparando o YOLOv10 e o YOLOv5, dois modelos altamente influentes na evolução da detecção de objetos em tempo real. Embora ambos os modelos tenham causado impactos significativos na comunidade de IA, eles representam diferentes eras e filosofias no design de arquitetura de aprendizagem profunda.

Este guia avalia estas arquiteturas com base na mAP (mean Average Precision), latência de inferência, eficiência de parâmetros e suporte do ecossistema, ajudando-te a escolher o melhor modelo para as tuas necessidades de implementação.

Link to this sectionVisão Geral dos Modelos#

Link to this sectionYOLOv10: Deteção de Objetos de Ponta a Ponta em Tempo Real#

Desenvolvido por pesquisadores da Universidade Tsinghua, o YOLOv10 introduziu uma abordagem inovadora para detecção de objetos, eliminando a necessidade de pós-processamento.

O avanço definidor do YOLOv10 é o seu Design End-to-End NMS-Free. Historicamente, os modelos YOLO dependiam da NMS (Non-Maximum Suppression) para filtrar caixas delimitadoras redundantes. O YOLOv10 utiliza atribuições duplas consistentes para treinamento sem NMS, o que reduz drasticamente a variabilidade da latência de inferência e simplifica a lógica de implementação. Além disso, a arquitetura apresenta um design focado na eficiência e precisão que otimiza minuciosamente vários componentes para reduzir a redundância computacional.

Saiba mais sobre o YOLOv10

Link to this sectionYOLOv5: O Padrão da Indústria para Usabilidade#

Lançado pouco depois da criação do repositório PyTorch da Ultralytics, o YOLOv5 redefiniu o que os desenvolvedores esperavam de um framework de IA de visão open-source. Ele permanece como uma das arquiteturas mais implementadas globalmente.

O YOLOv5 é celebrado pela sua Facilidade de Uso e Ecossistema Altamente Mantido. Escrito inteiramente em PyTorch, ele ofereceu uma experiência "do zero ao topo" perfeita com suporte pronto para uso para treinamento, validação e exportação para formatos como ONNX e TensorRT. Ao contrário do YOLOv10, que se concentra principalmente na detecção pura de objetos, o YOLOv5 demonstra uma Versatilidade excepcional, suportando segmentação de instâncias e classificação de imagens dentro da mesma API Python unificada.

Saiba mais sobre o YOLOv5

Link to this sectionComparação de desempenho e métricas#

Visualizar a relação entre velocidade e precisão é essencial para identificar os modelos que oferecem a melhor precisão para uma determinada restrição de velocidade. Entender essas métricas de desempenho é fundamental para selecionar um modelo que se alinhe às tuas restrições específicas de hardware.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256,9160.4
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionAnálise Técnica#

  1. Precisão (mAP): O YOLOv10 demonstra uma clara vantagem geracional em precisão. Por exemplo, o modelo YOLOv10-X alcança 54,4% mAPval, superando o YOLOv5x (50,7% mAP). Esse salto deve-se em grande parte à estratégia de treinamento sem NMS e aos refinamentos arquitetônicos introduzidos em 2024.
  2. Latência de Inferência: Embora os modelos YOLOv5 sejam excepcionalmente rápidos em benchmarks brutos T4 TensorRT (por exemplo, YOLOv5n a 1,12ms), o YOLOv10 elimina o passo de pós-processamento NMS completamente. Em implementações práticas de ponta a ponta, o design sem NMS do YOLOv10 oferece uma latência mais consistente e determinística, o que é crítico para aplicações em tempo real como veículos autônomos e robótica.
  3. Eficiência de Parâmetros: Os modelos YOLOv10 mantêm um Equilíbrio de Desempenho altamente competitivo. O YOLOv10-S alcança 46,7% mAP com apenas 7,2M de parâmetros, enquanto o YOLOv5s alcança 37,4% mAP com 9,1M de parâmetros.
Dica de implantação

Ao implementar em dispositivos de edge AI como o NVIDIA Jetson, modelos sem lógica NMS (como o YOLOv10 e o YOLO26) muitas vezes compilam de forma mais limpa para o TensorRT, evitando operações de fallback para a CPU.

Link to this sectionCasos de uso e recomendações#

Escolher entre o YOLOv10 e o YOLOv5 depende dos teus requisitos específicos de projeto, restrições de implementação e preferências de ecossistema.

Link to this sectionQuando escolher o YOLOv10#

O YOLOv10 é uma escolha forte para:

  • Detecção em tempo real sem NMS: Aplicações que se beneficiam da detecção de ponta a ponta sem Non-Maximum Suppression, reduzindo a complexidade da implementação.
  • Equilíbrio entre velocidade e precisão: Projetos que exigem um forte equilíbrio entre velocidade de inferência e precisão de detecção em diversas escalas de modelo.
  • Aplicações de latência consistente: Cenários de implementação onde tempos de inferência previsíveis são críticos, como em robótica ou sistemas autônomos.

Link to this sectionQuando escolher o YOLOv5#

O YOLOv5 é recomendado para:

  • Sistemas de Produção Comprovados: Implantações existentes onde o longo histórico de estabilidade, documentação extensa e enorme suporte da comunidade do YOLOv5 são valorizados.
  • Treinamento com Recursos Limitados: Ambientes com recursos de GPU limitados onde o pipeline de treinamento eficiente e os menores requisitos de memória do YOLOv5 são vantajosos.
  • Amplo Suporte a Formatos de Exportação: Projetos que exigem implantação em muitos formatos, incluindo ONNX, TensorRT, CoreML e TFLite.

Link to this sectionQuando escolher a Ultralytics (YOLO26)#

Para a maioria dos novos projetos, o Ultralytics YOLO26 oferece a melhor combinação de desempenho e experiência para o desenvolvedor:

  • Implantação de borda sem NMS: Aplicações que requerem inferência consistente e de baixa latência sem a complexidade do pós-processamento de Supressão de Não-Máximos.
  • Ambientes apenas com CPU: Dispositivos sem aceleração de GPU dedicada, onde a inferência em CPU até 43% mais rápida do YOLO26 oferece uma vantagem decisiva.
  • Detecção de objetos pequenos: Cenários desafiadores como imagens de drone aéreo ou análise de sensores IoT onde ProgLoss e STAL aumentam significativamente a precisão em objetos minúsculos.

Link to this sectionA vantagem da Ultralytics#

Embora o YOLOv10 ofereça excelentes capacidades de detecção, confiar em repositórios acadêmicos às vezes pode complicar os pipelines de produção. Ao usar o pacote Python da Ultralytics, ganhas acesso a um ecossistema unificado que suporta tanto o YOLOv5 quanto o YOLOv10, juntamente com recursos avançados.

  • Eficiência de Treinamento: As arquiteturas Ultralytics YOLO são profundamente otimizadas para menores requisitos de memória durante o treinamento. Ao contrário de modelos pesados de Transformer (como o RT-DETR) que exigem muita memória CUDA, podes treinar confortavelmente o YOLOv5 e o YOLOv10 em GPUs de consumo padrão.
  • Integração de Ecossistema: A integração com a Plataforma Ultralytics permite aos desenvolvedores gerenciar visualmente conjuntos de dados, rastrear experimentos usando o Weights & Biases e ajustar automaticamente hiperparâmetros.

Link to this sectionExemplo de Código: Treinamento Sem Esforço#

Usando a biblioteca Ultralytics, alternar entre essas arquiteturas é tão simples quanto alterar a string do modelo. O pipeline de treinamento lida automaticamente com aumento de dados, escala e configuração do otimizador.

from ultralytics import YOLO

# To use YOLOv5:
# model = YOLO("yolov5s.pt")

# To use YOLOv10:
model = YOLO("yolov10s.pt")

# Train the model on a custom dataset
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=16,
    device=0,  # Use GPU 0
)

# Export the trained model to ONNX format
path = model.export(format="onnx")

Link to this sectionA Próxima Geração: Ultralytics YOLO26#

Se estás a iniciar um novo projeto de machine learning hoje, recomendamos fortemente avaliar o mais recente Ultralytics YOLO26. Lançado em janeiro de 2026, ele representa o que há de mais moderno, combinando as melhores inovações dos últimos cinco anos.

O YOLO26 incorpora nativamente o Design End-to-End NMS-Free pioneiro do YOLOv10, garantindo uma implementação rápida e determinística. Além disso, o YOLO26 introduz vários avanços críticos:

  • Inferência em CPU até 43% mais rápida: Ao remover o módulo DFL (Distribution Focal Loss), o YOLO26 alcança acelerações massivas em CPUs padrão, tornando-o a escolha principal para implementação móvel e sensores IoT de baixa potência.
  • Otimizador MuSGD: Inspirado por técnicas de treinamento de Grandes Modelos de Linguagem (LLM) como o Kimi K2 da Moonshot AI, o YOLO26 utiliza um híbrido de SGD e Muon. Isso garante execuções de treinamento incrivelmente estáveis e uma convergência vastamente acelerada em comparação com os otimizadores AdamW usados no YOLOv10.
  • ProgLoss + STAL: Essas funções de perda avançadas produzem melhorias notáveis no reconhecimento de pequenos objetos, o que é crítico para imagens de drones e aplicações de segurança aérea.
  • Domínio de Tarefas Específicas: Enquanto o YOLOv10 é estritamente um detector de caixas delimitadoras, o YOLO26 oferece melhorias arquitetônicas dedicadas para todas as tarefas, incluindo RLE (Residual Log-Likelihood Estimation) para Pose e perdas de ângulo especializadas para Caixas Delimitadoras Orientadas (OBB).
Explora Mais

Se estás a explorar o cenário mais amplo de detecção de objetos, talvez também tenhas interesse em comparar essas arquiteturas com outros frameworks. Confere as nossas análises aprofundadas sobre YOLO11 vs EfficientDet ou RT-DETR vs YOLOv8 para benchmarks mais abrangentes.

Seja confiando no legado robusto do YOLOv5, na inovação sem NMS do YOLOv10 ou no desempenho de ponta incomparável do YOLO26, o ecossistema Ultralytics fornece as ferramentas necessárias para dar vida às tuas aplicações de IA de visão de forma rápida e eficiente.

Contribuidores

Comentários