Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX vs YOLOv5#

Selecionar o modelo de detecção de objetos certo é uma decisão crítica que determina o sucesso de qualquer projeto de visão computacional. Este guia fornece uma comparação técnica abrangente entre dois modelos fundamentais no cenário de IA: o YOLOX da Megvii e o Ultralytics YOLOv5. Ao analisar suas arquiteturas, métricas de desempenho e ecossistemas de treinamento, nosso objetivo é ajudar desenvolvedores e pesquisadores a fazerem uma escolha informada para seus ambientes de implementação específicos.

Link to this sectionIntrodução aos Modelos#

Ambos os modelos surgiram durante um período de rápido avanço na detecção de objetos em tempo real, mas adotaram filosofias arquitetônicas diferentes para alcançar seu desempenho.

Link to this sectionYOLOX: Uma abordagem sem âncoras (Anchor-Free)#

Lançado pelos pesquisadores Zheng Ge, Songtao Liu, Feng Wang, Zeming Li e Jian Sun na Megvii em 18 de julho de 2021, o YOLOX introduziu uma mudança significativa ao abandonar as tradicionais caixas âncora (anchor boxes). Documentado em seu relatório técnico no Arxiv, o YOLOX integrou um design sem âncoras (anchor-free) com uma cabeça desacoplada e a estratégia de atribuição de rótulos SimOTA. Este design visava reduzir a lacuna entre a pesquisa acadêmica e a aplicação industrial, oferecendo um forte desempenho em conjuntos de dados padrão.

Saiba mais sobre o YOLOX

Link to this sectionYOLOv5: O padrão para visão computacional em produção#

Criado por Glenn Jocher e lançado pela Ultralytics em 26 de junho de 2020, o YOLOv5 tornou-se rapidamente o padrão da indústria para visão computacional implementada. Construído nativamente no framework PyTorch, ele democratizou a IA de ponta ao oferecer facilidade de uso incomparável, treinamento excepcionalmente rápido e um repositório altamente polido. A arquitetura do YOLOv5 focou em um equilíbrio perfeito entre velocidade, precisão e facilidade de implementação, tornando-o um favorito para tudo, desde dispositivos de borda (edge) até implementações massivas em nuvem.

Saiba mais sobre o YOLOv5

Link to this sectionDiferenças Arquiteturais#

Entender as diferenças mecânicas centrais entre essas redes esclarece por que elas apresentam desempenhos diferentes em várias tarefas.

Link to this sectionSem Âncoras (Anchor-Free) vs. Com Âncoras (Anchor-Based)#

O contraste mais marcante é o mecanismo sem âncoras do YOLOX. Modelos tradicionais como o YOLOv5 dependem de caixas âncora predefinidas para prever caixas delimitadoras, o que requer análise de agrupamento no conjunto de dados de treinamento para determinar tamanhos ideais de âncora. O YOLOX elimina isso, prevendo as coordenadas da caixa delimitadora diretamente em cada localização espacial. Embora a abordagem sem âncoras reduza o número de parâmetros de design e o ajuste heurístico, a abordagem refinada baseada em âncoras do YOLOv5, auxiliada por sua funcionalidade de auto-âncora, garante uma convergência de treinamento incrivelmente estável e previsível desde o primeiro uso.

Link to this sectionCabeça Desacoplada vs. Cabeça Acoplada#

O YOLOX emprega uma cabeça desacoplada, o que significa que as tarefas de classificação e regressão são separadas em ramos distintos da rede neural. Os autores argumentaram que isso resolve conflitos entre o aprendizado de características espaciais e semânticas. Por outro lado, o YOLOv5 utilizava uma cabeça acoplada altamente otimizada (em suas versões anteriores) que maximizava a eficiência computacional e reduzia a latência de inferência, o que é crucial para a computação de borda em tempo real.

Evolução Arquitetônica

Enquanto o YOLOX defendeu a cabeça desacoplada em 2021, a Ultralytics posteriormente adotou e aperfeiçoou arquiteturas desacopladas em modelos subsequentes como o YOLOv8 e o inovador YOLO26, combinando o melhor dos dois mundos.

Link to this sectionEstratégia de Atribuição de Rótulos#

O YOLOX utiliza o SimOTA para atribuição de rótulos, que formula o pareamento de objetos reais com previsões como um problema de Transporte Ótimo. Essa atribuição dinâmica melhora o tratamento de cenas com muitos objetos. O YOLOv5 emprega uma atribuição robusta baseada em regras de forma, garantindo que amostras positivas de alta qualidade sejam consistentemente enviadas à função de perda, o que contribui para sua lendária estabilidade de treinamento.

Link to this sectionDesempenho e Benchmarks#

O equilíbrio entre velocidade e precisão é o teste definitivo para essas arquiteturas. A tabela abaixo ilustra o desempenho de vários tamanhos de modelo em benchmarks padrão.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Embora o YOLOX alcance pontuações de mAP competitivas, especialmente em suas variantes maiores, o YOLOv5 mantém uma vantagem notável na velocidade de inferência TensorRT em todos os aspectos. O modelo YOLOv5s, por exemplo, oferece relações excepcionais de velocidade por precisão, tornando-o altamente desejável para aplicações em tempo real onde cada milissegundo conta.

Link to this sectionA vantagem da Ultralytics: Treinamento e Usabilidade#

Ao transitar da pesquisa para a produção, o ecossistema que envolve um modelo é muitas vezes tão importante quanto o próprio modelo. Aqui, as vantagens do ecossistema Ultralytics tornam-se claramente aparentes.

Link to this sectionExperiência de Usuário Simplificada#

O YOLOv5 é universalmente elogiado por sua experiência do desenvolvedor "zero-to-hero". A API Python da Ultralytics e a CLI permitem que você carregue, treine e implemente modelos com apenas algumas linhas de código. Em contraste, executar o YOLOX a partir do repositório GitHub da Megvii requer mais configuração manual de variáveis de ambiente, configurações complexas de caminho Python e uma curva de aprendizado mais íngreme, típica de bases de código de pesquisa acadêmica.

Link to this sectionEficiência de Treinamento e Requisitos de Memória#

Os modelos Ultralytics são meticulosamente projetados para minimizar o uso de memória durante o treinamento. O YOLOv5 requer significativamente menos memória CUDA em comparação com modelos Transformer altamente parametrizados como o RT-DETR ou modelos de pesquisa não otimizados. Isso permite que desenvolvedores treinem lotes (batches) maiores em hardware de nível consumidor, acelerando o ciclo de desenvolvimento iterativo.

Link to this sectionVersatilidade em Tarefas#

Enquanto o YOLOX é estritamente um framework de detecção de objetos, o ecossistema Ultralytics evoluiu o YOLOv5 para suportar múltiplas tarefas de visão. Prontamente, você pode realizar Classificação de Imagens, Segmentação de Instâncias e detecção de objetos usando exatamente a mesma sintaxe de API.

Inovação Contínua

Se você precisa de tarefas ainda mais avançadas como Estimativa de Pose ou detecção de Caixa Delimitadora Orientada (OBB), recomendamos fortemente a atualização para a arquitetura mais recente Ultralytics YOLO26, que suporta todas elas nativamente com precisão de ponta.

Link to this sectionComparação de Código#

A diferença na usabilidade é melhor demonstrada através de código.

Treinamento com YOLOv5:

from ultralytics import YOLO

# Load a pretrained YOLOv5s model
model = YOLO("yolov5su.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Display results
results[0].show()

Treinamento com YOLOX: (Requer clonagem manual do repositório, instalação via setup.py e argumentos complexos de CLI)

# Example YOLOX training command
python tools/train.py -f exps/default/yolox_s.py -d 1 -b 64 --fp16 -o

A abordagem da Ultralytics elimina atritos, permitindo que você se concentre no seu conjunto de dados e na lógica da aplicação, em vez de depurar arquivos de configuração. Além disso, rastrear seus experimentos é simples com integrações integradas para Weights & Biases e Comet ML.

Link to this sectionCasos de Uso Ideais e Aplicações no Mundo Real#

A escolha entre esses modelos depende do ambiente operacional do seu projeto.

Link to this sectionOnde o YOLOX se destaca#

O YOLOX continua sendo um forte candidato em ambientes acadêmicos onde pesquisadores estudam explicitamente paradigmas sem âncoras ou estratégias de atribuição de rótulos. Também é útil em cenários onde a detecção em cenas com muitos objetos é a métrica principal absoluta e as velocidades de implementação na borda são secundárias.

Link to this sectionOnde o YOLOv5 se destaca#

O YOLOv5 é o campeão indiscutível da implementação prática.

  • Fabricação de Alta Velocidade: Para detecção de defeitos em linhas de montagem, a latência mínima de inferência do YOLOv5 em GPUs de borda garante que os produtos sejam inspecionados sem desacelerar a esteira.
  • Drones e Imagens Aéreas: Sua pegada de memória eficiente permite que ele seja executado em computadores de bordo leves em drones para tarefas como monitoramento agrícola e rastreamento de vida selvagem.
  • Varejo Inteligente: Desde checkout automatizado até gerenciamento de estoque, o YOLOv5 exporta facilmente para TensorRT e ONNX para implementação em massa em milhares de câmeras de lojas.

Link to this sectionOlhando para o Futuro: A Vantagem do YOLO26#

Embora o YOLOv5 seja um modelo lendário, o campo da IA avança rapidamente. Se você está começando um novo projeto hoje, aconselhamos fortemente dar uma olhada na última geração de modelos da Ultralytics.

Lançado em 2026, o Ultralytics YOLO26 representa um enorme salto à frente. Ele apresenta um Design de Ponta a Ponta Sem NMS, removendo completamente a necessidade de pós-processamento de Supressão de Não-Máximos, o que simplifica drasticamente a lógica de implementação. Ao remover a Perda Focal de Distribuição (DFL) e utilizar o inovador Otimizador MuSGD, o YOLO26 alcança até 43% mais rapidez na inferência de CPU do que as gerações anteriores, mantendo maior precisão, especialmente em objetos pequenos, graças às novas funções de perda ProgLoss + STAL.

Se você escolher a confiabilidade testada em batalha do YOLOv5 ou o desempenho de ponta do YOLO26, a Plataforma Ultralytics garante que você tenha as melhores ferramentas disponíveis para levar suas soluções de visão computacional do conceito à produção sem problemas. Certifique-se de explorar a documentação completa da Ultralytics para desbloquear todo o potencial do seu pipeline de IA.

Contribuidores

Comentários