Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 vs YOLO11#

Ao construir sistemas de visão computacional de última geração, selecionar o modelo certo é fundamental para equilibrar precisão, latência e eficiência de recursos. No cenário em rápida evolução da inteligência artificial, a Ultralytics continua a expandir as fronteiras do que é possível. Esta comparação técnica detalhada explora a transição do altamente bem-sucedido YOLO11 para o novo e revolucionário YOLO26, fornecendo aos engenheiros e pesquisadores de IA os insights necessários para tomar decisões arquiteturais informadas.

Link to this sectionLinhagem e Metadados do Modelo#

Ambos os modelos foram desenvolvidos pela Ultralytics, mas representam paradigmas diferentes na linha do tempo de detecção de objetos e modelos de visão multitarefa.

Detalhes do YOLO26:

Saiba mais sobre o YOLO26

Detalhes do YOLO11:

Sabe mais sobre o YOLO11

Outras Arquiteturas

Embora o YOLO26 seja nosso modelo de tempo real mais avançado, usuários que lidam com hardware altamente especializado ou capacidades de memória massivas também podem explorar arquiteturas baseadas em Transformer, como RT-DETR ou o pioneiro inovador sem NMS, YOLOv10.

Link to this sectionDiferenças Arquiteturais e Inovações#

O salto do YOLO11 para o YOLO26 envolve mudanças fundamentais tanto na arquitetura do modelo quanto no regime de treinamento subjacente. Enquanto o YOLO11 estabeleceu uma base robusta para detecção de objetos e aprendizado multitarefa, o YOLO26 reformula completamente o pipeline de implantação para computação de borda (edge computing).

Link to this sectionDesign End-to-End Sem NMS#

Uma das atualizações mais significativas no YOLO26 é sua arquitetura nativamente end-to-end. Diferente do YOLO11, que depende do pós-processamento de Non-Maximum Suppression (NMS) para filtrar bounding boxes sobrepostas, o YOLO26 elimina totalmente essa etapa. Este conceito, pioneiro no YOLOv10, reduz drasticamente a variabilidade da latência e simplifica a lógica de implantação em diversos dispositivos de borda.

Link to this sectionRemoção de DFL para Eficiência de Borda#

O YOLO11 utiliza Distribution Focal Loss (DFL) para refinar estimativas de bounding boxes. No entanto, a DFL depende de operações complexas de softmax que geralmente são mal suportadas por aceleradores de borda de baixo consumo. O YOLO26 remove a DFL com sucesso sem sacrificar a precisão. Essa simplificação arquitetural resulta em uma compatibilidade vastamente melhorada com sistemas embarcados e permite que o YOLO26 alcance até 43% de inferência em CPU mais rápida em comparação com seu predecessor.

Link to this sectionO Otimizador MuSGD#

A estabilidade e a velocidade do treinamento são primordiais. O YOLO26 apresenta o Otimizador MuSGD, um híbrido de Stochastic Gradient Descent (SGD) e Muon, fortemente inspirado por inovações de treinamento de LLMs da Kimi K2 da Moonshot AI. Este otimizador traz a estabilidade de treinamento de modelos de linguagem para a visão computacional, garantindo uma convergência mais rápida e reduzindo a pegada de memória durante o treinamento em comparação com alternativas pesadas de Transformer.

Link to this sectionProgLoss e STAL#

Para pesquisadores que trabalham com imagens aéreas ou aplicações com drones, detectar características minúsculas é um desafio histórico. O YOLO26 introduz a ProgLoss combinada com STAL (Scale-Targeted Attention Loss), proporcionando melhorias notáveis no reconhecimento de objetos pequenos em relação ao YOLO11.

Link to this sectionComparação de desempenho e métricas#

Ao comparar os modelos lado a lado, o YOLO26 demonstra uma clara superioridade em precisão e eficiência em dispositivos de borda, mantendo ao mesmo tempo os requisitos de memória incrivelmente baixos característicos do ecossistema Ultralytics.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59,520.7
YOLO26m64053.1220.04.720,468,2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356,9194.9

Nota: O modelo YOLO26 nano (YOLO26n) demonstra uma melhoria de ~31% na velocidade da CPU em comparação com o YOLO11n (38.9ms vs 56.1ms), destacando sua filosofia de design focada na borda.

Link to this sectionVersatilidade em Tarefas de Visão Computacional#

Ambos os modelos se beneficiam do ecossistema Ultralytics altamente mantido, oferecendo facilidade de uso inigualável através de uma API Python unificada. Eles não são apenas detectores de objetos; são potências multitarefa. No entanto, o YOLO26 incorpora vários avanços específicos para tarefas:

  • Segmentação de Instância: O YOLO26 utiliza uma perda de segmentação semântica refinada e prototipagem multiescala, gerando limites de máscara mais nítidos do que o YOLO11. Saiba mais sobre fluxos de trabalho de segmentação.
  • Estimativa de Pose: Ao integrar Residual Log-Likelihood Estimation (RLE), o YOLO26 melhora drasticamente a precisão dos keypoints em poses humanas complexas. Descubra capacidades de estimativa de pose.
  • Oriented Bounding Boxes (OBB): Uma função de perda de ângulo especializada resolve problemas históricos de descontinuidade de limites, tornando o YOLO26 excepcionalmente confiável para detectar objetos rotacionados em feeds de satélite. Leia sobre tarefas de OBB.
  • Classificação de Imagens: Ambos os modelos lidam com classificação de alta velocidade de forma eficiente, com o YOLO26 entregando melhorias marginais na precisão top-1 no ImageNet.

Link to this sectionExemplo de Código de Treinamento e Inferência#

A Ultralytics é celebrada pela sua experiência de desenvolvedor. Treinar um modelo SOTA ou executar um script de inferência requer apenas algumas linhas de código, minimizando o boilerplate e maximizando a produtividade. Além disso, treinar modelos YOLO requer significativamente menos memória CUDA do que redes Transformer grandes.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Utilize GPU for accelerated training
)

# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the clean, instant predictions
results[0].show()

Link to this sectionCasos de Uso Ideais e Estratégias de Implantação#

A escolha entre o YOLO26 e o YOLO11 depende inteiramente das restrições do seu ambiente de produção.

Link to this sectionQuando Implantar o YOLO26#

O YOLO26 é a escolha definitiva para projetos modernos e novos (greenfield). Ele é construído especificamente para:

  • Computação de Borda e IoT: Seu desempenho impressionante de CPU e a remoção de DFL o tornam o rei de dispositivos como Raspberry Pi, NPUs Coral e processadores móveis.
  • Drones e Análises Aéreas: A integração de ProgLoss + STAL torna-o singularmente capaz de rastrear objetos minúsculos e em movimento rápido através de paisagens extensas.
  • Latency-Critical Applications: In autonomous robotics or manufacturing quality control, the NMS-free design ensures deterministic latency without unexpected post-processing spikes.

Link to this sectionQuando Reter o YOLO11#

Embora o YOLO26 seja superior, o YOLO11 continua sendo um modelo incrivelmente capaz. Você pode optar pelo YOLO11 se:

  • Pipelines Legados: Sua infraestrutura de implantação C++ existente está fortemente acoplada às saídas específicas baseadas em âncoras e à lógica de NMS de arquiteturas mais antigas.
  • Bases Acadêmicas: Você está publicando pesquisas e precisa de um padrão de 2024 altamente reconhecido para comparar seus algoritmos novos.

Link to this sectionO Poder do Ecossistema Ultralytics#

Independentemente de você implantar o YOLO11 ou o YOLO26, utilizar modelos Ultralytics significa aproveitar um ecossistema bem mantido com atualizações frequentes e vasto suporte da comunidade.

Para equipes corporativas, a Plataforma Ultralytics oferece uma solução ponta a ponta para anotação de dados, treinamento de modelos e implantação contínua na nuvem. Desde a exportação de seus pesos treinados para CoreML ou TensorRT, até a configuração de ajuste de hiperparâmetros avançado, as ferramentas fornecidas garantem que seu ciclo de vida de IA seja o mais otimizado possível.

Contribuidores

Comentários