Ultralytics YOLO26

Visão geral

O Ultralytics YOLO26 é a mais recente evolução na série YOLO de detectores de objetos em tempo real, projetado desde a base para dispositivos de borda (edge) e de baixo consumo de energia. Ele introduz um design simplificado que remove complexidade desnecessária enquanto integra inovações direcionadas para oferecer uma implementação mais rápida, leve e acessível.

Gráficos de comparação do Ultralytics YOLO26

Experimente na Plataforma Ultralytics

Explore e execute modelos YOLO26 diretamente na Plataforma Ultralytics.

A arquitetura do YOLO26 é guiada por três princípios fundamentais:

  • Simplicidade: O YOLO26 é um modelo nativo ponta a ponta (end-to-end), produzindo previsões diretamente sem a necessidade de supressão não-máxima (NMS). Ao eliminar este passo de pós-processamento, a inferência torna-se mais rápida, leve e fácil de implementar em sistemas do mundo real. Esta abordagem inovadora foi pioneira no YOLOv10 por Ao Wang na Universidade de Tsinghua e foi ainda mais aprimorada no YOLO26.
  • Eficiência de Implementação: O design ponta a ponta elimina uma etapa inteira do pipeline, simplificando drasticamente a integração, reduzindo a latência e tornando a implementação mais robusta em diversos ambientes.
  • Inovação em Treinamento: O YOLO26 introduz o otimizador MuSGD, um híbrido de SGD e Muon — inspirado pelos avanços do Kimi K2 da Moonshot AI no treinamento de LLM. Este otimizador traz maior estabilidade e convergência mais rápida, transferindo avanços de otimização de modelos de linguagem para a visão computacional.
  • Otimizações Específicas de Tarefa: O YOLO26 introduz melhorias direcionadas para tarefas especializadas, incluindo perda de segmentação semântica e módulos proto multiescala para Segmentação, Estimativa de Verossimilhança Residual Logarítmica (RLE) para estimativa de Pose de alta precisão, e decodificação otimizada com perda de ângulo para resolver problemas de limite em OBB.

Juntas, estas inovações entregam uma família de modelos que alcança maior precisão em objetos pequenos, proporciona uma implementação perfeita e executa até 43% mais rápido em CPUs — tornando o YOLO26 um dos modelos YOLO mais práticos e implementáveis até hoje para ambientes com recursos limitados.

Principais Recursos

  • Remoção de DFL O módulo de Distribuição Focal Loss (DFL), embora eficaz, frequentemente complicava a exportação e limitava a compatibilidade de hardware. O YOLO26 remove o DFL inteiramente, simplificando a inferência e ampliando o suporte para dispositivos de borda (edge) e de baixo consumo de energia.

  • Inferência sem NMS Ponta a Ponta Diferente dos detectores tradicionais que dependem do NMS como um passo separado de pós-processamento, o YOLO26 é nativamente ponta a ponta. As previsões são geradas diretamente, reduzindo a latência e tornando a integração em sistemas de produção mais rápida, leve e confiável.

  • ProgLoss + STAL Funções de perda aprimoradas aumentam a precisão da detecção, com melhorias notáveis no reconhecimento de objetos pequenos, um requisito crítico para IoT, robótica, imagens aéreas e outras aplicações de borda.

  • Otimizador MuSGD Um novo otimizador híbrido que combina SGD com Muon. Inspirado pelo Kimi K2 da Moonshot AI, o MuSGD introduz métodos de otimização avançados do treinamento de LLM na visão computacional, permitindo um treinamento mais estável e uma convergência mais rápida.

  • Inferência de CPU até 43% Mais Rápida Especificamente otimizado para computação de borda, o YOLO26 entrega inferência de CPU significativamente mais rápida, garantindo desempenho em tempo real em dispositivos sem GPUs.

  • Aprimoramentos de Segmentação de Instância Introduz perda de segmentação semântica para melhorar a convergência do modelo e um módulo proto atualizado que aproveita informações multiescala para uma qualidade de máscara superior.

  • Estimativa de Pose de Precisão Integra a Estimativa de Verossimilhança Residual Logarítmica (RLE) para uma localização mais precisa de keypoints e otimiza o processo de decodificação para aumentar a velocidade de inferência.

  • Decodificação OBB Refinada Introduz uma perda de ângulo especializada para melhorar a precisão da detecção de objetos em formato quadrado e otimiza a decodificação OBB para resolver problemas de descontinuidade de limite.

Gráficos de comparação ponta a ponta do Ultralytics YOLO26


Tarefas e Modos Suportados

O YOLO26 baseia-se na versátil gama de modelos estabelecida pelos lançamentos anteriores do Ultralytics YOLO, oferecendo suporte aprimorado em várias tarefas de visão computacional:

ModeloNomes de arquivoTarefaInferênciaValidaçãoTreinamentoExportação
YOLO26yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.ptDetecção
YOLO26-segyolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.ptSegmentação de Instância
YOLO26-semyolo26n-sem.pt yolo26s-sem.pt yolo26m-sem.pt yolo26l-sem.pt yolo26x-sem.ptSegmentação Semântica
YOLO26-poseyolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.ptPose/Keypoints
YOLO26-obbyolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.ptDetecção Orientada
YOLO26-clsyolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.ptClassificação

Esta estrutura unificada garante que o YOLO26 seja aplicável em detecção em tempo real, segmentação de instância, segmentação semântica, classificação, estimativa de pose e detecção orientada de objetos — tudo com suporte para treinamento, validação, inferência e exportação.

Variantes apenas de arquitetura

yolo26-p2.yaml e yolo26-p6.yaml adicionam uma head de detecção P2 (para objetos pequenos) ou P6 (para entrada grande) e são fornecidos apenas como arquiteturas YAML. Não foram lançados pesos específicos de escala yolo26*-p2.pt ou yolo26*-p6.pt. Instancie uma configuração escalonada a partir do YAML (por exemplo, YOLO("yolo26n-p6.yaml")) e treine ou ajuste conforme necessário.


Métricas de Desempenho

Desempenho

Veja Documentação de Detecção para exemplos de uso com estes modelos treinados no COCO, que incluem 80 classes pré-treinadas.

Modelotamanho
(pixels)
mAPval
50-95
mAPval
50-95(e2e)
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
parâmetros
(M)
FLOPs
(B)
YOLO26n64040.940.138.9 ± 0.71.7 ± 0.02.45.4
YOLO26s64048.647.887.2 ± 0.92.5 ± 0.09.520.7
YOLO26m64053.152.5220.0 ± 1.44.7 ± 0.120.468.2
YOLO26l64055.054.4286.2 ± 2.06.2 ± 0.224.886.4
YOLO26x64057.556.9525.8 ± 4.011.8 ± 0.255.7193.9

Os valores de Params e FLOPs referem-se ao modelo fundido após model.fuse(), que combina camadas Conv e BatchNorm e remove a cabeça de deteção auxiliar um-para-muitos. Os pontos de verificação pré-treinados mantêm a arquitetura de treino completa e podem apresentar valores mais elevados.


Exemplos de Utilização

Esta secção apresenta exemplos simples de treino e inferência com YOLO26. Para a documentação completa sobre estes e outros modos, consulta as páginas de documentação Predict, Train, Val e Export.

Nota que o exemplo abaixo é para modelos YOLO26 Detect para deteção de objetos. Para outras tarefas suportadas, consulta a documentação Segment, Segmentação Semântica, Classify, OBB e Pose.

Exemplo

Modelos pré-treinados PyTorch *.pt, bem como ficheiros de configuração *.yaml, podem ser passados para a classe YOLO() para criar uma instância de modelo em Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")
Arquitetura de Cabeça Dupla

YOLO26 apresenta uma arquitetura de cabeça dupla que proporciona flexibilidade para diferentes cenários de implementação:

  • Cabeça Um-para-Um (Predefinição): Produz previsões de ponta-a-ponta sem NMS, gerando (N, 300, 6) com um máximo de 300 deteções por imagem. Esta cabeça está otimizada para uma inferência rápida e implementação simplificada.
  • Cabeça Um-para-Muitos: Gera resultados YOLO tradicionais que requerem pós-processamento NMS, gerando (N, nc + 4, 8400) onde nc é o número de classes. Esta cabeça atinge tipicamente uma precisão ligeiramente superior à custa de processamento adicional.

Podes alternar entre as cabeças durante a exportação, previsão ou validação:

from ultralytics import YOLO

model = YOLO("yolo26n.pt")

# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg")  # inference
metrics = model.val(data="coco.yaml")  # validation
model.export(format="onnx")  # export

# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False)  # inference
metrics = model.val(data="coco.yaml", end2end=False)  # validation
model.export(format="onnx", end2end=False)  # export

A escolha depende dos teus requisitos de implementação: utiliza a cabeça um-para-um para máxima velocidade e simplicidade, ou a cabeça um-para-muitos quando a precisão é a prioridade máxima.

YOLOE-26: Segmentação de Instâncias de Vocabulário Aberto

YOLOE-26 integra a arquitetura de alto desempenho YOLO26 com as capacidades de vocabulário aberto da série YOLOE. Permite a deteção e segmentação em tempo real de qualquer classe de objeto utilizando prompts de texto, prompts visuais ou um modo sem prompt para inferência zero-shot, eliminando efetivamente as restrições do treino por categorias fixas.

Ao tirar partido do design NMS-free, de ponta-a-ponta do YOLO26, o YOLOE-26 proporciona uma inferência de mundo aberto rápida. Isto torna-o uma solução poderosa para aplicações de edge em ambientes dinâmicos onde os objetos de interesse representam um vocabulário vasto e em evolução.

Desempenho

Consulta a Documentação YOLOE para exemplos de utilização com estes modelos treinados nos datasets Objects365v1, GQA e Flickr30k.

Modelotamanho
(pixels)
Tipo de PromptmAPminival
50-95(e2e)
mAPminival
50-95
mAPrmAPcmAPfparâmetros
(M)
FLOPs
(B)
YOLOE-26n-seg640Texto/Visual23.7 / 20.924.7 / 21.920.5 / 17.624.1 / 22.326.1 / 22.44.86.0
YOLOE-26s-seg640Texto/Visual29.9 / 27.130.8 / 28.623.9 / 25.129.6 / 27.833.0 / 29.913.121.7
YOLOE-26m-seg640Texto/Visual35.4 / 31.335.4 / 33.931.1 / 33.434.7 / 34.036.9 / 33.827.970.1
YOLOE-26l-seg640Texto/Visual36.8 / 33.737.8 / 36.335.1 / 37.637.6 / 36.238.5 / 36.132.388.3
YOLOE-26x-seg640Texto/Visual39.5 / 36.240.6 / 38.537.4 / 35.340.9 / 38.841.0 / 38.869.9196.7

Exemplo de Uso

O YOLOE-26 suporta tanto prompts baseados em texto quanto visuais. Usar prompts é simples — basta passá-los através do método predict, como mostrado abaixo:

Exemplo

Prompts de texto permitem especificar as classes que desejas detectar por meio de descrições textuais. O código a seguir mostra como podes usar o YOLOE-26 para detectar pessoas e ônibus em uma imagem:

from ultralytics import YOLO

# Initialize model
model = YOLO("yoloe-26l-seg.pt")  # or select yoloe-26s/m-seg.pt for different sizes

# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])

# Run detection on the given image
results = model.predict("path/to/image.jpg")

# Show results
results[0].show()

Para um mergulho profundo em técnicas de prompting, treinamento do zero e exemplos completos de uso, visita a Documentação do YOLOE.

Citações e Agradecimentos

Publicação do Ultralytics YOLO26

A Ultralytics não publicou um artigo de pesquisa formal para o YOLO26 devido à natureza em rápida evolução dos modelos. Em vez disso, focamos em fornecer modelos de ponta e torná-los fáceis de usar. Para as atualizações mais recentes sobre recursos, arquiteturas e uso do YOLO, visita o nosso repositório GitHub e a documentação.

Se usares o YOLO26 ou outro software da Ultralytics no teu trabalho, por favor, cita-o como:

Citação
@software{yolo26_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO26},
  version = {26.0.0},
  year = {2026},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

DOI pendente. O YOLO26 está disponível sob as licenças AGPL-3.0 e Enterprise.


Perguntas Frequentes

Quais são as principais melhorias no YOLO26 em comparação com o YOLO11?

  • Remoção de DFL: Simplifica a exportação e amplia a compatibilidade de borda
  • Inferência End-to-End sem NMS: Elimina o NMS para uma implementação mais rápida e simples
  • ProgLoss + STAL: Aumenta a precisão, especialmente em objetos pequenos
  • Otimizador MuSGD: Combina SGD e Muon (inspirado no Kimi K2 da Moonshot) para um treinamento mais estável e eficiente
  • Até 43% mais rápida em inferência de CPU: Grandes ganhos de desempenho para dispositivos apenas com CPU

Quais tarefas o YOLO26 suporta?

O YOLO26 é uma família de modelos unificada, fornecendo suporte end-to-end para várias tarefas de visão computacional:

Cada variante de tamanho (n, s, m, l, x) suporta todas as tarefas, além de versões de vocabulário aberto via YOLOE-26.

Por que o YOLO26 é otimizado para implantação na borda (edge)?

O YOLO26 oferece desempenho de ponta na borda com:

  • Até 43% mais rápida em inferência de CPU
  • Tamanho de modelo e uso de memória reduzidos
  • Arquitetura simplificada para compatibilidade (sem DFL, sem NMS)
  • Formatos de exportação flexíveis incluindo TensorRT, ONNX, CoreML, TFLite e OpenVINO

Como posso começar com o YOLO26?

Os modelos YOLO26 foram lançados em 14 de janeiro de 2026 e estão disponíveis para download. Instala ou atualiza o pacote ultralytics e carrega um modelo:

from ultralytics import YOLO

# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("image.jpg")

Consulta a seção Usage Examples para instruções de treino, validação e exportação.

Comentários