YOLO26 vs.YOLO: A evolução da deteção de objetos em tempo real

O panorama da visão computacional evolui rapidamente, com novas arquiteturas constantemente a expandir os limites da velocidade e precisão. Dois marcos significativos nesta linha do tempo são YOLO, desenvolvido pelo Alibaba Group no final de 2022, e o YOLO26, o modelo de última geração lançado pela Ultralytics 2026.

EnquantoYOLO conceitos inovadores como a Pesquisa de Arquitetura Neural (NAS) na YOLO , o YOLO26 representa uma mudança de paradigma em direção ao processamento nativo de ponta a ponta e ao design edge-first. Esta comparação detalhada explora as diferenças arquitetónicas, métricas de desempenho e realidades de implementação desses dois modelos poderosos para ajudar os programadores a escolher a ferramenta certa para as suas necessidades de detecção de objetos.

Comparação de Métricas de Desempenho

A tabela a seguir compara o desempenho do YOLO26 comYOLO. Observe as melhorias significativas na velocidade de inferência, especialmente para operações CPU, que é uma característica marcante da arquitetura do YOLO26.

Modelo	tamanho ^(pixels)	mAP^val 50-95	Velocidade ^{CPU ONNX (ms)}	Velocidade ^{T4 TensorRT10 (ms)}	parâmetros ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

Ultralytics : O novo padrão

Lançado em janeiro de 2026 pela Ultralytics, o YOLO26 baseia-se no legado do YOLO11 e YOLOv8, introduzindo mudanças radicais no pipeline de detecção. A sua filosofia de design principal concentra-se na remoção de gargalos na implementação e no treinamento, tornando-o o modelo mais eficiente para GPUs de ponta e dispositivos de ponta com restrições.

Inovações Principais

Design NMS de ponta a ponta: Ao contrário das gerações anteriores e dos concorrentes comoYOLO, o YOLO26 é nativamente de ponta a ponta. Ele elimina a necessidade de pós-processamento de supressão não máxima (NMS). Isso reduz a variação de latência e simplifica os pipelines de implementação, uma abordagem inovadora pioneiramente introduzida no YOLOv10.
Otimizador MuSGD: Inspirado nos recentes avanços no treinamento de Modelos de Linguagem Grande (LLM), o YOLO26 utiliza um híbrido de SGD Muon. Este otimizador oferece maior estabilidade durante o treinamento e convergência mais rápida, reduzindo o custo de computação necessário para atingir a precisão ideal.
Otimização Edge-First: Ao remover a Distribution Focal Loss (DFL), a arquitetura do modelo é simplificada para facilitar a exportação para formatos como ONNX CoreML. Isso contribui para uma velocidade CPU 43% mais rápida em comparação com as iterações anteriores, tornando-o ideal para dispositivos como o Raspberry Pi ou telemóveis.
Detecção aprimorada de pequenos objetos: a integração do ProgLoss e do STAL (Scale-Aware Training Adaptive Loss) melhora significativamente o desempenho em pequenos objetos, resolvendo uma fraqueza comum em detectores de estágio único.

Implantação Simplificada

Como o YOLO26 remove a NMS , os modelos exportados são redes neurais puras, sem código de pós-processamento complexo. Isso torna a integração em C++ ou ambientes móveis significativamente mais fácil e menos propensa a erros lógicos.

Exemplo de Código

A experiência do utilizador com o YOLO26 permanece consistente com o Python simplificado Ultralytics .

from ultralytics import YOLO

# Load the nano model
model = YOLO("yolo26n.pt")

# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)

# Export to ONNX for edge deployment
path = model.export(format="onnx")

Saiba mais sobre YOLO26

YOLO: O desafiante impulsionado por NAS

YOLO, desenvolvido pela DAMO Academy da Alibaba, causou sensação em 2022 ao utilizar a Pesquisa de Arquitetura Neural (NAS) para projetar a sua estrutura principal. Em vez de criar manualmente a estrutura da rede, os autores utilizaram o MAE-NAS (Método de Arestas Auxiliares) para descobrir automaticamente arquiteturas eficientes sob restrições específicas de latência.

Principais Características

Backbone MAE-NAS: A estrutura da rede foi otimizada matematicamente para maximizar o fluxo de informações e minimizar o custo computacional.
RepGFPN: Uma rede piramidal de características eficiente que utiliza reparametrização para melhorar a fusão de características em diferentes escalas.
ZeroHead: Um design leve de cabeça de detecção destinado a reduzir a contagem de parâmetros na extremidade da rede.
AlignedOTA: Uma estratégia de atribuição de rótulos que ajuda o modelo a compreender melhor quais caixas âncora correspondem aos objetos da verdade fundamental durante o treinamento.

EmboraYOLO um excelente desempenho para a época, a sua dependência de um complexo pipeline de treino de destilação — em que um modelo professor maior orienta o modelo aluno menor — torna o treino personalizado mais intensivo em recursos em comparação com os recursos de «treino a partir do zero» Ultralytics .

Comparação Detalhada

Estabilidade da arquitetura e da formação

A diferença mais marcante reside na abordagem de otimização.YOLO do NAS para encontrar a melhor estrutura, o que pode produzir FLOPs teóricos altamente eficientes, mas muitas vezes resulta em arquiteturas difíceis de modificar ou depurar.

O YOLO26, por outro lado, emprega melhorias arquitetónicas artesanais e intuitivas (como a remoção do DFL e do cabeçalho NMS) reforçadas pelo MuSGD Optimizer. Este otimizador traz a estabilidade frequentemente vista em LLMs para a visão computacional. Para os programadores, isso significa que o YOLO26 é menos sensível ao ajuste de hiperparâmetros e converge de forma fiável em conjuntos de dados personalizados.

Velocidade de Inferência e Eficiência de Recursos

EnquantoYOLO para GPU usando TensorRT, o YOLO26 adota uma abordagem mais ampla. A remoção do DFL e NMS o YOLO26 se destaque nas CPUs, alcançando velocidades até 43% mais rápidas do que os seus antecessores. Isso é crucial para aplicações em análises de retalho ou cidades inteligentes, onde os dispositivos de ponta podem não ter GPUs dedicadas.

Além disso, os requisitos de memória do YOLO26 durante o treinamento são geralmente mais baixos. EnquantoYOLO requer o treinamento de um modelo professor pesado para destilação a fim de alcançar resultados máximos, o YOLO26 alcança resultados SOTA diretamente, economizando GPU significativas GPU e eletricidade.

Versatilidade e Ecossistema

Uma grande vantagem do Ultralytics é a versatilidade.YOLO principalmente um detetor de objetos. Em contrapartida, a arquitetura YOLO26 suporta nativamente uma ampla gama de tarefas de visão computacional, incluindo:

Segmentação de instâncias (com perdas semânticas especializadas)
Estimativa de pose (usando RLE para maior precisão)
Caixa Delimitadora Orientada (OBB) (crítico para imagens aéreas)
Classificação de Imagem

Isso permite que uma única equipa de desenvolvimento utilize uma API e uma estrutura para vários problemas distintos, reduzindo drasticamente a dívida técnica.

Tabela comparativa: Características

Funcionalidade	YOLO26	DAMO-YOLO
Data de Lançamento	Janeiro de 2026	Nov 2022
Arquitetura	De ponta a ponta, NMS	Baseado em NAS, sem âncora
Pós-processamento	Nenhum (Saída do modelo = Final)	Supressão Não Máxima (NMS)
Otimizador	MuSGD (SGD Muon)	SGD AdamW
Pipeline de formação	Estágio único, Treinamento desde o início	Destilação complexa (professor-aluno)
Tarefas Suportadas	detect, segment, Pose, obb, classify	Detecção
Otimização de Borda	Alta (sem DFL, otimizada para CPU)	Moderado (TensorRT )

Conclusão

Ambas as arquiteturas representam pontos altos na história da deteção de objetos.YOLO o poder da pesquisa automatizada de arquiteturas e da reparametrização. No entanto, o YOLO26 representa o futuro da implementação prática da IA.

Ao eliminar NMS , introduzir otimizadores de nível LLM como o MuSGD e fornecer uma solução unificada para segmentação, pose e detecção, Ultralytics oferece um equilíbrio superior entre desempenho e facilidade de uso. Para desenvolvedores que criam aplicações do mundo real — desde automação industrial até aplicações móveis —, o ecossistema robusto, a documentação abrangente e a Ultralytics tornam o YOLO26 a recomendação óbvia.

Para aqueles interessados em outras comparações, podem explorar YOLO11 .YOLO ou procurar alternativas baseadas em transformadores, como RT-DETR.

Autoria e referências

YOLO26

Autores: Glenn Jocher, Jing Qiu
Organização:Ultralytics
Data: 2026-01-14
Documentação:Documentação do YOLO26

DAMO-YOLO

Autores: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
Organização: Alibaba Group
Data: 2022-11-23
Artigo:arXiv:2211.15444