Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX vs YOLO11#

A evolução da visão computacional tem sido impulsionada fortemente pela busca por frameworks de detecção de objetos em tempo real que equilibrem alta precisão com velocidade de inferência. Entre os marcos mais notáveis nesta jornada estão o YOLOX e o Ultralytics YOLO11. Embora ambos os modelos tenham feito contribuições significativas para a área, suas arquiteturas, filosofias de design e ecossistemas de desenvolvedores diferem substancialmente.

Esta comparação técnica abrangente explora suas arquiteturas, métricas de desempenho, metodologias de treinamento e cenários de implantação ideais para te ajudar a tomar uma decisão informada para o teu próximo projeto de inteligência artificial.

Link to this sectionVisão Geral do YOLOX#

Introduzido pelos pesquisadores Zheng Ge, Songtao Liu, Feng Wang, Zeming Li e Jian Sun na Megvii em 18 de julho de 2021, o YOLOX representou uma mudança significativa na série YOLO. Ele conectou com sucesso a lacuna entre a pesquisa acadêmica e a aplicação industrial ao introduzir um design sem âncoras (anchor-free).

Para mais contexto técnico, podes consultar o artigo original do YOLOX no Arxiv.

Link to this sectionPrincipais Recursos Arquitetônicos#

O YOLOX afastou-se da detecção tradicional baseada em âncoras ao adotar uma cabeça desacoplada (decoupled head) e um mecanismo sem âncoras. Este design reduziu o número de parâmetros e melhorou o desempenho do modelo em vários benchmarks. Adicionalmente, introduziu estratégias avançadas de atribuição de rótulos como o SimOTA para acelerar o processo de treinamento e melhorar a convergência.

Embora o YOLOX ofereça uma precisão excelente para a sua época, ele foca-se principalmente na detecção de objetos por caixas delimitadoras (bounding box) e carece de suporte nativo para outras tarefas complexas de visão de imediato.

Saiba mais sobre o YOLOX

Design sem âncoras (Anchor-Free)

Ao eliminar caixas de âncora predefinidas, o YOLOX reduziu drasticamente o ajuste heurístico necessário para diferentes conjuntos de dados, tornando-se uma base sólida para a pesquisa em metodologias sem âncoras.

Link to this sectionVisão geral do Ultralytics YOLO11#

Lançado em 27 de setembro de 2024 por Glenn Jocher e Jing Qiu na Ultralytics, o YOLO11 é um modelo de ponta que redefine a versatilidade e a facilidade de uso em visão computacional. Construído sobre anos de pesquisa fundamental, ele fornece uma solução altamente refinada e pronta para produção que se destaca em uma infinidade de tarefas.

Link to this sectionA vantagem da Ultralytics#

O YOLO11 não é apenas um detector de objetos; é um framework unificado que suporta segmentação de instâncias, classificação de imagens, estimativa de pose e detecção por caixas delimitadoras orientadas (OBB). Ele possui uma arquitetura altamente eficiente que prioriza um equilíbrio perfeito entre velocidade, contagem de parâmetros e precisão.

Além disso, o YOLO11 está totalmente integrado à Plataforma Ultralytics, que oferece um ecossistema otimizado para anotação de dados, treinamento de modelos e implantação.

Sabe mais sobre o YOLO11

Link to this sectionComparação de desempenho e métricas#

Ao comparar estes modelos, o equilíbrio de desempenho torna-se claro. O YOLO11 atinge uma Precisão Média (mAP) mais alta com significativamente menos parâmetros e FLOPs na maioria das categorias de tamanho em comparação com os seus equivalentes YOLOX.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356,9194.9

Como demonstrado, os modelos YOLO11 superam consistentemente o YOLOX em precisão enquanto mantêm uma pegada de parâmetros mais enxuta. Por exemplo, o YOLO11m atinge 51.5 mAP com apenas 20.1M de parâmetros, enquanto o YOLOXx atinge um mAP semelhante de 51.1, mas requer massivos 99.1M de parâmetros. Esta eficiência de memória durante o treinamento e a inferência torna o YOLO11 altamente adequado para implantação em dispositivos de edge AI, evitando os requisitos pesados de memória CUDA típicos de modelos mais antigos ou baseados em Transformer como o RT-DETR.

Treinamento Eficiente

Os modelos Ultralytics exigem significativamente menos memória GPU durante o treinamento em comparação com o YOLOX e arquiteturas baseadas em Transformer, permitindo que os pesquisadores treinem modelos poderosos em hardware de consumo padrão.

Link to this sectionEcossistema e Facilidade de Uso#

Uma das diferenças mais marcantes entre os dois frameworks é a experiência do desenvolvedor.

O YOLOX geralmente exige clonar repositórios, configurar ambientes complexos e executar argumentos de linha de comando verbosos para treinar e exportar modelos para formatos como ONNX ou TensorRT.

Em contraste absoluto, o Ultralytics YOLO11 oferece uma API Python e CLI incrivelmente simples. A biblioteca Ultralytics lida automaticamente com aumento de dados, ajuste de hiperparâmetros e exportação.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly on custom data
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for optimized deployment
model.export(format="engine")

Este ecossistema bem mantido é apoiado por uma documentação extensa e uma integração perfeita com ferramentas como Weights & Biases para rastreamento de experimentos.

Link to this sectionCasos de uso ideais#

Escolher entre estes modelos geralmente depende dos detalhes do ambiente de implantação.

Link to this sectionQuando usar o YOLOX#

  • Sistemas Legados: Se tiveres um pipeline estabelecido construído explicitamente em torno do framework MegEngine ou paradigmas de detecção de objetos do início de 2021.
  • Bases Acadêmicas: Ao realizar pesquisas que exijam benchmarking direto contra arquiteturas fundamentais sem âncoras da era de 2021.

Link to this sectionQuando usar o YOLO11#

  • Implantações de Produção: Para aplicações comerciais em varejo inteligente ou sistemas de alarme de segurança, onde código robusto e mantido e alta precisão são inegociáveis.
  • Pipelines Multitarefa: Quando um projeto requer rastrear objetos, estimar poses humanas e segmentar instâncias usando um único framework unificado.
  • Dispositivos de Edge com Recursos Limitados: Devido à sua baixa contagem de parâmetros e alto rendimento, o YOLO11 é ideal para implantação em Raspberry Pi ou nós de edge móveis via CoreML e NCNN.

Link to this sectionOlhando para o futuro: A vantagem do YOLO26#

Embora o YOLO11 represente um grande salto em relação ao YOLOX, o campo da visão computacional está avançando rapidamente. Para desenvolvedores iniciando novos projetos hoje, o Ultralytics YOLO26 é a recomendação definitiva.

Lançado em janeiro de 2026, o YOLO26 aproveita a genialidade arquitetural do YOLO11 e introduz vários recursos inovadores:

  • Design End-to-End NMS-Free: O YOLO26 elimina o pós-processamento de Supressão Não Máxima (NMS), transmitindo nativamente a inferência para pipelines de implantação mais rápidos e simples (um conceito explorado pela primeira vez no YOLOv10).
  • Inferência de CPU até 43% mais rápida: Através da remoção da Distribution Focal Loss (DFL), o YOLO26 é vastamente mais eficiente em CPUs e dispositivos de edge de baixa potência.
  • Otimizador MuSGD: Inspirado por inovações de treinamento de LLM da Moonshot AI, o otimizador MuSGD garante execuções de treinamento altamente estáveis e rápida convergência.
  • Funções de perda avançadas: Utilizando ProgLoss + STAL, o YOLO26 alcança melhorias notáveis no reconhecimento de objetos pequenos, o que é crítico para imagens de drones e robótica autônoma.

Para a grande maioria das tarefas modernas de visão computacional, atualizar o teu pipeline para aproveitar o YOLO26 proporcionará o equilíbrio absoluto entre velocidade, precisão e simplicidade de implantação.

Comentários