Ir para o conteúdo

YOLO26 vs.YOLO: A evolução da deteção de objetos em tempo real

O panorama da visão computacional evolui rapidamente, com novas arquiteturas constantemente a expandir os limites da velocidade e precisão. Dois marcos significativos nesta linha do tempo são YOLO, desenvolvido pelo Alibaba Group no final de 2022, e o YOLO26, o modelo de última geração lançado pela Ultralytics 2026.

EnquantoYOLO conceitos inovadores como a Pesquisa de Arquitetura Neural (NAS) na YOLO , o YOLO26 representa uma mudança de paradigma em direção ao processamento nativo de ponta a ponta e ao design edge-first. Esta comparação detalhada explora as diferenças arquitetónicas, métricas de desempenho e realidades de implementação desses dois modelos poderosos para ajudar os programadores a escolher a ferramenta certa para as suas necessidades de detecção de objetos.

Comparação de Métricas de Desempenho

A tabela a seguir compara o desempenho do YOLO26 comYOLO. Observe as melhorias significativas na velocidade de inferência, especialmente para operações CPU, que é uma característica marcante da arquitetura do YOLO26.

Modelotamanho
(pixels)
mAPval
50-95
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
parâmetros
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Ultralytics : O novo padrão

Lançado em janeiro de 2026 pela Ultralytics, o YOLO26 baseia-se no legado do YOLO11 e YOLOv8, introduzindo mudanças radicais no pipeline de detecção. A sua filosofia de design principal concentra-se na remoção de gargalos na implementação e no treinamento, tornando-o o modelo mais eficiente para GPUs de ponta e dispositivos de ponta com restrições.

Inovações Principais

  1. Design NMS de ponta a ponta: Ao contrário das gerações anteriores e dos concorrentes comoYOLO, o YOLO26 é nativamente de ponta a ponta. Ele elimina a necessidade de pós-processamento de supressão não máxima (NMS). Isso reduz a variação de latência e simplifica os pipelines de implementação, uma abordagem inovadora pioneiramente introduzida no YOLOv10.
  2. Otimizador MuSGD: Inspirado nos recentes avanços no treinamento de Modelos de Linguagem Grande (LLM), o YOLO26 utiliza um híbrido de SGD Muon. Este otimizador oferece maior estabilidade durante o treinamento e convergência mais rápida, reduzindo o custo de computação necessário para atingir a precisão ideal.
  3. Otimização Edge-First: Ao remover a Distribution Focal Loss (DFL), a arquitetura do modelo é simplificada para facilitar a exportação para formatos como ONNX CoreML. Isso contribui para uma velocidade CPU 43% mais rápida em comparação com as iterações anteriores, tornando-o ideal para dispositivos como o Raspberry Pi ou telemóveis.
  4. Detecção aprimorada de pequenos objetos: a integração do ProgLoss e do STAL (Scale-Aware Training Adaptive Loss) melhora significativamente o desempenho em pequenos objetos, resolvendo uma fraqueza comum em detectores de estágio único.

Implantação Simplificada

Como o YOLO26 remove a NMS , os modelos exportados são redes neurais puras, sem código de pós-processamento complexo. Isso torna a integração em C++ ou ambientes móveis significativamente mais fácil e menos propensa a erros lógicos.

Exemplo de Código

A experiência do utilizador com o YOLO26 permanece consistente com o Python simplificado Ultralytics .

from ultralytics import YOLO

# Load the nano model
model = YOLO("yolo26n.pt")

# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)

# Export to ONNX for edge deployment
path = model.export(format="onnx")

Saiba mais sobre YOLO26

YOLO: O desafiante impulsionado por NAS

YOLO, desenvolvido pela DAMO Academy da Alibaba, causou sensação em 2022 ao utilizar a Pesquisa de Arquitetura Neural (NAS) para projetar a sua estrutura principal. Em vez de criar manualmente a estrutura da rede, os autores utilizaram o MAE-NAS (Método de Arestas Auxiliares) para descobrir automaticamente arquiteturas eficientes sob restrições específicas de latência.

Principais Características

  • Backbone MAE-NAS: A estrutura da rede foi otimizada matematicamente para maximizar o fluxo de informações e minimizar o custo computacional.
  • RepGFPN: Uma rede piramidal de características eficiente que utiliza reparametrização para melhorar a fusão de características em diferentes escalas.
  • ZeroHead: Um design leve de cabeça de detecção destinado a reduzir a contagem de parâmetros na extremidade da rede.
  • AlignedOTA: Uma estratégia de atribuição de rótulos que ajuda o modelo a compreender melhor quais caixas âncora correspondem aos objetos da verdade fundamental durante o treinamento.

EmboraYOLO um excelente desempenho para a época, a sua dependência de um complexo pipeline de treino de destilação — em que um modelo professor maior orienta o modelo aluno menor — torna o treino personalizado mais intensivo em recursos em comparação com os recursos de «treino a partir do zero» Ultralytics .

Comparação Detalhada

Estabilidade da arquitetura e da formação

A diferença mais marcante reside na abordagem de otimização.YOLO do NAS para encontrar a melhor estrutura, o que pode produzir FLOPs teóricos altamente eficientes, mas muitas vezes resulta em arquiteturas difíceis de modificar ou depurar.

O YOLO26, por outro lado, emprega melhorias arquitetónicas artesanais e intuitivas (como a remoção do DFL e do cabeçalho NMS) reforçadas pelo MuSGD Optimizer. Este otimizador traz a estabilidade frequentemente vista em LLMs para a visão computacional. Para os programadores, isso significa que o YOLO26 é menos sensível ao ajuste de hiperparâmetros e converge de forma fiável em conjuntos de dados personalizados.

Velocidade de Inferência e Eficiência de Recursos

EnquantoYOLO para GPU usando TensorRT, o YOLO26 adota uma abordagem mais ampla. A remoção do DFL e NMS o YOLO26 se destaque nas CPUs, alcançando velocidades até 43% mais rápidas do que os seus antecessores. Isso é crucial para aplicações em análises de retalho ou cidades inteligentes, onde os dispositivos de ponta podem não ter GPUs dedicadas.

Além disso, os requisitos de memória do YOLO26 durante o treinamento são geralmente mais baixos. EnquantoYOLO requer o treinamento de um modelo professor pesado para destilação a fim de alcançar resultados máximos, o YOLO26 alcança resultados SOTA diretamente, economizando GPU significativas GPU e eletricidade.

Versatilidade e Ecossistema

Uma grande vantagem do Ultralytics é a versatilidade.YOLO principalmente um detetor de objetos. Em contrapartida, a arquitetura YOLO26 suporta nativamente uma ampla gama de tarefas de visão computacional, incluindo:

Isso permite que uma única equipa de desenvolvimento utilize uma API e uma estrutura para vários problemas distintos, reduzindo drasticamente a dívida técnica.

Tabela comparativa: Características

FuncionalidadeYOLO26DAMO-YOLO
Data de LançamentoJaneiro de 2026Nov 2022
ArquiteturaDe ponta a ponta, NMSBaseado em NAS, sem âncora
Pós-processamentoNenhum (Saída do modelo = Final)Supressão Não Máxima (NMS)
OtimizadorMuSGD (SGD Muon)SGD AdamW
Pipeline de formaçãoEstágio único, Treinamento desde o inícioDestilação complexa (professor-aluno)
Tarefas Suportadasdetect, segment, Pose, obb, classifyDetecção
Otimização de BordaAlta (sem DFL, otimizada para CPU)Moderado (TensorRT )

Conclusão

Ambas as arquiteturas representam pontos altos na história da deteção de objetos.YOLO o poder da pesquisa automatizada de arquiteturas e da reparametrização. No entanto, o YOLO26 representa o futuro da implementação prática da IA.

Ao eliminar NMS , introduzir otimizadores de nível LLM como o MuSGD e fornecer uma solução unificada para segmentação, pose e detecção, Ultralytics oferece um equilíbrio superior entre desempenho e facilidade de uso. Para desenvolvedores que criam aplicações do mundo real — desde automação industrial até aplicações móveis —, o ecossistema robusto, a documentação abrangente e a Ultralytics tornam o YOLO26 a recomendação óbvia.

Para aqueles interessados em outras comparações, podem explorar YOLO11 .YOLO ou procurar alternativas baseadas em transformadores, como RT-DETR.

Autoria e referências

YOLO26

DAMO-YOLO

  • Autores: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
  • Organização: Alibaba Group
  • Data: 2022-11-23
  • Artigo:arXiv:2211.15444

Comentários