Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX vs DAMO-YOLO#

A evolução da detecção de objetos em tempo real vivenciou inúmeras mudanças de paradigma, desde arquiteturas baseadas em âncoras até as sem âncoras, e desde backbones projetados manualmente até a busca automática por arquitetura neural (NAS). Nesta comparação técnica abrangente, analisaremos dois marcos significativos nessa jornada: YOLOX e DAMO-YOLO. Exploraremos suas inovações arquiteturais, metodologias de treinamento e compensações de desempenho, enquanto também destacamos como o moderno Ultralytics YOLO26 oferece uma alternativa incomparável para desenvolvedores modernos.

Link to this sectionYOLOX: Pioneirismo no Paradigma Sem Âncoras#

Lançado em 18 de julho de 2021 por Zheng Ge, Songtao Liu, Feng Wang, Zeming Li e Jian Sun na Megvii, o YOLOX marcou um ponto de virada crítico ao integrar com sucesso um design sem âncoras à família YOLO. Descrito em seu relatório técnico detalhado no ArXiv, o YOLOX visou preencher a lacuna entre a pesquisa acadêmica e a implementação industrial.

Link to this sectionPrincipais inovações arquiteturais#

O YOLOX introduziu várias mudanças estruturais centrais que melhoraram drasticamente seus antecessores:

  • Mecanismo sem âncoras: Ao prever o centro de um objeto e as dimensões de sua caixa delimitadora diretamente, o YOLOX reduziu o número de heurísticas de design e simplificou os complexos processos de agrupamento de âncoras. Isso o torna altamente adaptável a cenários variados de visão computacional.
  • Decoupled Head (Cabeça desacoplada): Os modelos YOLO tradicionais usavam uma única cabeça acoplada para classificação e regressão. O YOLOX implementou uma cabeça desacoplada, processando a classificação e a localização separadamente, o que convergiu muito mais rápido e melhorou a precisão.
  • Atribuição de rótulos SimOTA: Uma versão simplificada da Optimal Transport Assignment (OTA) foi usada para atribuir amostras positivas dinamicamente, reduzindo tempos de treinamento e superando as ambiguidades das atribuições de ponto central.
O legado do YOLOX

O design de cabeça desacoplada do YOLOX influenciou fortemente as gerações subsequentes de detectores de objetos, tornando-se um recurso padrão em muitos modelos modernos.

Saiba mais sobre o YOLOX

Link to this sectionDAMO-YOLO: Busca de arquitetura automatizada em escala#

Desenvolvido por Xianzhe Xu e uma equipe de pesquisadores do Alibaba Group, o DAMO-YOLO foi introduzido em 23 de novembro de 2022. Conforme detalhado em sua publicação no ArXiv, o modelo utilizou fortemente a Neural Architecture Search (NAS) para expandir a fronteira de Pareto de velocidade e precisão.

Link to this sectionPrincipais inovações arquiteturais#

A estratégia do DAMO-YOLO foi construída com base na automatização do design de estruturas eficientes:

  • Backbones MAE-NAS: Utilizando um algoritmo evolutivo multiobjetivo, o DAMO-YOLO descobriu backbones altamente eficientes personalizados para orçamentos de latência específicos, particularmente quando exportados para frameworks como o TensorRT.
  • Efficient RepGFPN: Um design de neck robusto que aprimora significativamente a fusão de recursos em diferentes resoluções espaciais, o que é altamente benéfico para análise de imagens aéreas e detecção de objetos em escalas variadas.
  • ZeroHead: Uma cabeça de previsão simplificada que reduz a redundância computacional sem sacrificar a mean Average Precision (mAP) geral do modelo.
  • AlignedOTA e Destilação: Incorpora atribuição de rótulos avançada e destilação de conhecimento professor-aluno para extrair o desempenho máximo de modelos alunos menores.

Saiba mais sobre o DAMO-YOLO

Link to this sectionComparação de desempenho e métricas#

Ao comparar esses dois modelos, precisamos observar suas contagens de parâmetros, FLOPs necessários e perfis de latência. Abaixo estão os dados de benchmark comparando YOLOX e DAMO-YOLO em várias escalas.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Embora ambos os modelos alcancem resultados impressionantes, eles trazem ressalvas. O YOLOX requer ajuste cuidadoso de sua cabeça desacoplada, enquanto a forte dependência do DAMO-YOLO em destilação torna o retreinamento em conjuntos de dados personalizados altamente intensivo em recursos, exigindo grandes quantidades de memória de GPU.

Link to this sectionCasos de uso e recomendações#

Escolher entre o YOLOX e o DAMO-YOLO depende dos requisitos específicos do seu projeto, restrições de implantação e preferências de ecossistema.

Link to this sectionQuando escolher o YOLOX#

O YOLOX é uma escolha forte para:

  • Investigação de Deteção "Anchor-Free": Investigação académica que utiliza a arquitetura limpa e "anchor-free" do YOLOX como base para experimentar novas "detection heads" ou funções de perda.
  • Dispositivos de "Edge" Ultra-Leves: Implementação em microcontroladores ou hardware móvel legado onde a pegada extremamente pequena da variante YOLOX-Nano (0.91M parâmetros) é crítica.
  • Estudos de Atribuição de Rótulos SimOTA: Projetos de investigação que analisam estratégias de atribuição de rótulos baseadas em transporte ótimo e o seu impacto na convergência do treino.

Link to this sectionQuando Escolher o DAMO-YOLO#

O DAMO-YOLO é recomendado para:

  • Análise de Vídeo de Alto Rendimento: Processamento de fluxos de vídeo de alto FPS em infraestrutura GPU NVIDIA fixa onde o rendimento batch-1 é a métrica principal.
  • Linhas de Produção Industrial: Cenários com restrições rígidas de latência de GPU em hardware dedicado, como inspeção de qualidade em tempo real em linhas de montagem.
  • Investigação em Neural Architecture Search: Estudar os efeitos da pesquisa automatizada de arquitetura (MAE-NAS) e backbones reparametrizados eficientes no desempenho da detecção.

Link to this sectionQuando escolher a Ultralytics (YOLO26)#

Para a maioria dos novos projetos, o Ultralytics YOLO26 oferece a melhor combinação de desempenho e experiência para o desenvolvedor:

  • Implantação de borda sem NMS: Aplicações que requerem inferência consistente e de baixa latência sem a complexidade do pós-processamento de Supressão de Não-Máximos.
  • Ambientes apenas com CPU: Dispositivos sem aceleração de GPU dedicada, onde a inferência em CPU até 43% mais rápida do YOLO26 oferece uma vantagem decisiva.
  • Detecção de objetos pequenos: Cenários desafiadores como imagens de drone aéreo ou análise de sensores IoT onde ProgLoss e STAL aumentam significativamente a precisão em objetos minúsculos.

Link to this sectionA Vantagem da Ultralytics: Apresentamos o YOLO26#

Embora o YOLOX e o DAMO-YOLO representem marcos históricos importantes, os desenvolvedores modernos precisam de uma solução que combine precisão de ponta com facilidade de uso inigualável. É aqui que o Ultralytics YOLO26 transforma o cenário. Lançado em janeiro de 2026, o YOLO26 baseia-se no legado dos modelos livres de NMS para oferecer o equilíbrio definitivo de velocidade, precisão e experiência do desenvolvedor.

Link to this sectionPor que escolher o YOLO26?#

O ecossistema integrado da Ultralytics supera repositórios acadêmicos fragmentados ao oferecer:

  • Design end-to-end livre de NMS: O YOLO26 elimina nativamente a Non-Maximum Suppression (NMS) durante a inferência. Isso resulta em uma latência previsível e incrivelmente rápida, fundamental para implantações em edge e veículos autônomos.
  • Remoção de DFL: Ao remover a Distribution Focal Loss, o YOLO26 simplifica os processos de exportação para dispositivos de edge, reduzindo drasticamente os requisitos de memória para aplicações leves.
  • Otimizador MuSGD: O YOLO26 aproveita inovações de treinamento de LLM com seu otimizador híbrido SGD e Muon, garantindo estabilidade de treinamento sólida e convergência ultrarrápida.
  • Até 43% de inferência de CPU mais rápida: Graças a otimizações estruturais profundas, o YOLO26 roda extremamente rápido em CPUs sem a necessidade de hardware de GPU caro.
  • Funções de perda avançadas: A integração do ProgLoss + STAL fornece melhorias massivas no reconhecimento de pequenos objetos, tornando-o ideal para tarefas como inspeções por drones e monitoramento de IoT.
  • Versatilidade: Ao contrário do DAMO-YOLO, que é estritamente um detector, o YOLO26 oferece suporte nativo a tarefas de Segmentação de Instância, Estimativa de Pose, Classificação de Imagem e Caixa Delimitadora Orientada (OBB) em um framework único e unificado.
Comece a construir instantaneamente

Com a API Python da Ultralytics, você não precisa configurar manualmente pipelines complexos de destilação ou escrever centenas de linhas de código C++ para implantar seu modelo.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run ultra-fast, NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX or OpenVINO with a single command
model.export(format="openvino")

Saiba mais sobre o YOLO26

Link to this sectionOutros Modelos a Considerar#

O ecossistema de visão computacional é vasto. Dependendo de suas restrições específicas, você também pode querer explorar outras arquiteturas totalmente suportadas pelo ecossistema Ultralytics:

  • YOLO11: O sucessor altamente capaz do YOLO26, conhecido por sua robustez em análise de varejo e controle de qualidade de fabricação.
  • YOLOv8: Um modelo lendário, altamente estável e sem âncoras que popularizou a implantação em edge em larga escala.
  • RT-DETR: Um Transformer de Detecção em Tempo Real desenvolvido pela Baidu, oferecendo uma excelente alternativa para tarefas que se beneficiam fortemente de mecanismos de atenção global, embora ao custo de maiores requisitos de memória de treinamento.

Link to this sectionConclusão#

Tanto o YOLOX quanto o DAMO-YOLO contribuíram com conceitos vitais para a progressão do aprendizado profundo—o YOLOX validando a abordagem desacoplada e sem âncoras, e o DAMO-YOLO demonstrando o poder da busca automatizada de arquitetura. No entanto, para produção no mundo real, as complexidades de suas bases de código de pesquisa originais podem desacelerar equipes ágeis.

Ao aproveitar a Plataforma Ultralytics abrangente, os desenvolvedores podem superar esses obstáculos. Com o design end-to-end do YOLO26, velocidades superiores de CPU e documentação extensa, alcançar IA de visão de ponta é mais acessível do que nunca. Esteja você construindo infraestrutura de cidade inteligente, diagnósticos de saúde ou robótica avançada, a Ultralytics fornece o caminho mais eficiente desde dados brutos até a implementação robusta no mundo real.

Comentários