Ir para o conteúdo

Ultralytics YOLO26

Brevemente ⚠️

🚧 Os modelos YOLO26 ainda estão em desenvolvimento e ainda não foram lançados. Os números de desempenho mostrados aqui são apenas previews. Os downloads e lançamentos finais seguirão em breve — mantenha-se atualizado através do YOLO Vision 2025.

Visão geral

O Ultralytics YOLO26 é a mais recente evolução na série YOLO de detectores de objetos em tempo real, projetado desde o início para dispositivos edge e de baixa potência. Ele introduz um design simplificado que remove a complexidade desnecessária, integrando inovações direcionadas para fornecer uma implantação mais rápida, leve e acessível.

A arquitetura do YOLO26 é orientada por três princípios básicos:

  • Simplicidade: YOLO26 é um modelo nativo end-to-end, produzindo previsões diretamente, sem a necessidade de supressão não máxima (NMS). Ao eliminar esta etapa de pós-processamento, a inferência torna-se mais rápida, leve e fácil de implementar em sistemas do mundo real. Esta abordagem inovadora foi pioneira no YOLOv10 por Ao Wang na Universidade de Tsinghua e foi ainda mais aprimorada no YOLO26.
  • Eficiência de Implantação: O design end-to-end elimina toda uma etapa do pipeline, simplificando drasticamente a integração, reduzindo a latência e tornando a implantação mais robusta em diversos ambientes.
  • Inovação no Treinamento: O YOLO26 introduz o otimizador MuSGD, um híbrido de SGD e Muon — inspirado nas inovações do Kimi K2 da Moonshot AI no treinamento de LLM. Este otimizador traz maior estabilidade e convergência mais rápida, transferindo os avanços de otimização de modelos de linguagem para a visão computacional.

Juntas, essas inovações fornecem uma família de modelos que alcança maior precisão em pequenos objetos, oferece implantação perfeita e é executada até 43% mais rápido em CPUs — tornando o YOLO26 um dos modelos YOLO mais práticos e implantáveis até o momento para ambientes com recursos limitados.

Gráficos de Comparação do Ultralytics YOLO26

Principais Características

  • Remoção do DFL
    O módulo Distribution Focal Loss (DFL), embora eficaz, muitas vezes complicava a exportação e limitava a compatibilidade de hardware. O YOLO26 remove o DFL completamente, simplificando a inferência e ampliando o suporte para dispositivos edge e de baixa potência.

  • Inferência End-to-End Sem NMS
    Ao contrário dos detectores tradicionais que dependem do NMS como uma etapa de pós-processamento separada, o YOLO26 é nativamente end-to-end. As previsões são geradas diretamente, reduzindo a latência e tornando a integração em sistemas de produção mais rápida, leve e confiável.

  • ProgLoss + STAL
    Funções de perda aprimoradas aumentam a precisão da detecção, com melhorias notáveis no reconhecimento de pequenos objetos, um requisito crítico para IoT, robótica, imagens aéreas e outras aplicações edge.

  • Otimizador MuSGD
    Um novo otimizador híbrido que combina SGD com Muon. Inspirado no Kimi K2 da Moonshot AI, o MuSGD introduz métodos avançados de otimização do treinamento de LLM na visão computacional, permitindo um treinamento mais estável e uma convergência mais rápida.

  • Inferência de CPU Até 43% Mais Rápida
    Especificamente otimizado para computação edge, o YOLO26 oferece inferência de CPU significativamente mais rápida, garantindo desempenho em tempo real em dispositivos sem GPUs.


Tarefas e Modos Suportados

O YOLO26 foi projetado como uma família de modelos multi-tarefa, estendendo a versatilidade do YOLO em diversos desafios de visão computacional:

Modelo Tarefa Inferência Validação Treinamento Exportar
YOLO26 Detecção
YOLO26-seg Segmentação de Instância
YOLO26-pose Pose/Keypoints
YOLO26-obb Detecção Orientada
YOLO26-cls Classificação

Esta estrutura unificada garante que o YOLO26 seja aplicável em detecção em tempo real, segmentação, classificação, estimativa de pose e detecção de objetos orientados — tudo com suporte para treinamento, validação, inferência e exportação.


Métricas de Desempenho

Visualização de Desempenho

Os seguintes benchmarks são pré-visualizações iniciais. Os números finais e os pesos para download serão lançados assim que o treinamento for concluído.

Treinado em COCO com 80 classes pré-treinadas. Consulte a Documentação de Detecção para obter instruções de uso assim que os modelos forem lançados.

Modelo tamanho
(pixels)
mAPval
50-95(e2e)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
parâmetros
(M)
FLOPs
(B)
YOLO26n 640 39.8 40.3 38.90 ± 0.7 1.7 ± 0.0 2.4 5.4
YOLO26s 640 47.2 47.6 87.16 ± 0.9 2.7 ± 0.0 9.5 20.7
YOLO26m 640 51.5 51.7 220.0 ± 1.4 4,9 ± 0,1 20.4 68.2
YOLO26l 640 53.0* 53.4* 286.17 ± 2.0* 6.5 ± 0.2* 24.8 86.4
YOLO26x 640 - - - - - -

*As métricas para YOLO26l e YOLO26x estão em andamento. Os benchmarks finais serão adicionados aqui.

Métricas de desempenho em breve.

Métricas de desempenho em breve.

Métricas de desempenho em breve.

Métricas de desempenho em breve.


Citações e Agradecimentos

Publicação Ultralytics YOLO26

A Ultralytics não publicou um artigo de pesquisa formal para o YOLO26 devido à natureza de rápida evolução dos modelos. Em vez disso, focamos em fornecer modelos de ponta e torná-los fáceis de usar. Para obter as atualizações mais recentes sobre recursos, arquiteturas e uso do YOLO, visite nosso repositório GitHub e documentação.

Se você usar o YOLO26 ou outro software Ultralytics em seu trabalho, cite-o como:

@software{yolo26_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO26},
  version = {26.0.0},
  year = {2025},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

DOI pendente. O YOLO26 está disponível sob as licenças AGPL-3.0 e Enterprise.


FAQ

Quais são as principais melhorias no YOLO26 em comparação com o YOLO11?

  • Remoção de DFL: Simplifica a exportação e expande a compatibilidade de borda
  • Inferência End-to-End Sem NMS: Elimina o NMS para uma implantação mais rápida e simples
  • ProgLoss + STAL: Aumenta a precisão, especialmente em objetos pequenos
  • Otimizador MuSGD: Combina SGD e Muon (inspirado no Kimi K2 da Moonshot) para um treinamento mais estável e eficiente
  • Até 43% Mais Rápido na Inferência de CPU: Ganhos de desempenho importantes para dispositivos somente com CPU

Quais tarefas o YOLO26 suportará?

O YOLO26 foi projetado como uma família de modelos unificada, fornecendo suporte completo para múltiplas tarefas de visão computacional:

Cada variante de tamanho (n, s, m, l, x) está planeada para suportar todas as tarefas no lançamento.

Por que o YOLO26 é otimizado para implantação em edge?

O YOLO26 oferece desempenho de ponta com:

  • Inferência de CPU até 43% mais rápida
  • Tamanho do modelo e espaço de memória reduzidos
  • Arquitetura simplificada para compatibilidade (sem DFL, sem NMS)
  • Formatos de exportação flexíveis, incluindo TensorRT, ONNX, CoreML, TFLite e OpenVINO

Quando os modelos YOLO26 estarão disponíveis?

Os modelos YOLO26 ainda estão em treinamento e ainda não são de código aberto. As prévias de desempenho são mostradas aqui, com downloads e lançamentos oficiais planejados para um futuro próximo. Veja YOLO Vision 2025 para palestras sobre o YOLO26.



📅C riado há 21 dias ✏️ Atualizado há 2 dias

Comentários