YOLO26 vs.YOLO: A evolução da deteção de objetos em tempo real
O panorama da visão computacional evolui rapidamente, com novas arquiteturas constantemente a expandir os limites da velocidade e precisão. Dois marcos significativos nesta linha do tempo são YOLO, desenvolvido pelo Alibaba Group no final de 2022, e o YOLO26, o modelo de última geração lançado pela Ultralytics 2026.
EnquantoYOLO conceitos inovadores como a Pesquisa de Arquitetura Neural (NAS) na YOLO , o YOLO26 representa uma mudança de paradigma em direção ao processamento nativo de ponta a ponta e ao design edge-first. Esta comparação detalhada explora as diferenças arquitetónicas, métricas de desempenho e realidades de implementação desses dois modelos poderosos para ajudar os programadores a escolher a ferramenta certa para as suas necessidades de detecção de objetos.
Comparação de Métricas de Desempenho
A tabela a seguir compara o desempenho do YOLO26 comYOLO. Observe as melhorias significativas na velocidade de inferência, especialmente para operações CPU, que é uma característica marcante da arquitetura do YOLO26.
| Modelo | tamanho (pixels) | mAPval 50-95 | Velocidade CPU ONNX (ms) | Velocidade T4 TensorRT10 (ms) | parâmetros (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Ultralytics : O novo padrão
Lançado em janeiro de 2026 pela Ultralytics, o YOLO26 baseia-se no legado do YOLO11 e YOLOv8, introduzindo mudanças radicais no pipeline de detecção. A sua filosofia de design principal concentra-se na remoção de gargalos na implementação e no treinamento, tornando-o o modelo mais eficiente para GPUs de ponta e dispositivos de ponta com restrições.
Inovações Principais
- Design NMS de ponta a ponta: Ao contrário das gerações anteriores e dos concorrentes comoYOLO, o YOLO26 é nativamente de ponta a ponta. Ele elimina a necessidade de pós-processamento de supressão não máxima (NMS). Isso reduz a variação de latência e simplifica os pipelines de implementação, uma abordagem inovadora pioneiramente introduzida no YOLOv10.
- Otimizador MuSGD: Inspirado nos recentes avanços no treinamento de Modelos de Linguagem Grande (LLM), o YOLO26 utiliza um híbrido de SGD Muon. Este otimizador oferece maior estabilidade durante o treinamento e convergência mais rápida, reduzindo o custo de computação necessário para atingir a precisão ideal.
- Otimização Edge-First: Ao remover a Distribution Focal Loss (DFL), a arquitetura do modelo é simplificada para facilitar a exportação para formatos como ONNX CoreML. Isso contribui para uma velocidade CPU 43% mais rápida em comparação com as iterações anteriores, tornando-o ideal para dispositivos como o Raspberry Pi ou telemóveis.
- Detecção aprimorada de pequenos objetos: a integração do ProgLoss e do STAL (Scale-Aware Training Adaptive Loss) melhora significativamente o desempenho em pequenos objetos, resolvendo uma fraqueza comum em detectores de estágio único.
Implantação Simplificada
Como o YOLO26 remove a NMS , os modelos exportados são redes neurais puras, sem código de pós-processamento complexo. Isso torna a integração em C++ ou ambientes móveis significativamente mais fácil e menos propensa a erros lógicos.
Exemplo de Código
A experiência do utilizador com o YOLO26 permanece consistente com o Python simplificado Ultralytics .
from ultralytics import YOLO
# Load the nano model
model = YOLO("yolo26n.pt")
# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)
# Export to ONNX for edge deployment
path = model.export(format="onnx")
YOLO: O desafiante impulsionado por NAS
YOLO, desenvolvido pela DAMO Academy da Alibaba, causou sensação em 2022 ao utilizar a Pesquisa de Arquitetura Neural (NAS) para projetar a sua estrutura principal. Em vez de criar manualmente a estrutura da rede, os autores utilizaram o MAE-NAS (Método de Arestas Auxiliares) para descobrir automaticamente arquiteturas eficientes sob restrições específicas de latência.
Principais Características
- Backbone MAE-NAS: A estrutura da rede foi otimizada matematicamente para maximizar o fluxo de informações e minimizar o custo computacional.
- RepGFPN: Uma rede piramidal de características eficiente que utiliza reparametrização para melhorar a fusão de características em diferentes escalas.
- ZeroHead: Um design leve de cabeça de detecção destinado a reduzir a contagem de parâmetros na extremidade da rede.
- AlignedOTA: Uma estratégia de atribuição de rótulos que ajuda o modelo a compreender melhor quais caixas âncora correspondem aos objetos da verdade fundamental durante o treinamento.
EmboraYOLO um excelente desempenho para a época, a sua dependência de um complexo pipeline de treino de destilação — em que um modelo professor maior orienta o modelo aluno menor — torna o treino personalizado mais intensivo em recursos em comparação com os recursos de «treino a partir do zero» Ultralytics .
Comparação Detalhada
Estabilidade da arquitetura e da formação
A diferença mais marcante reside na abordagem de otimização.YOLO do NAS para encontrar a melhor estrutura, o que pode produzir FLOPs teóricos altamente eficientes, mas muitas vezes resulta em arquiteturas difíceis de modificar ou depurar.
O YOLO26, por outro lado, emprega melhorias arquitetónicas artesanais e intuitivas (como a remoção do DFL e do cabeçalho NMS) reforçadas pelo MuSGD Optimizer. Este otimizador traz a estabilidade frequentemente vista em LLMs para a visão computacional. Para os programadores, isso significa que o YOLO26 é menos sensível ao ajuste de hiperparâmetros e converge de forma fiável em conjuntos de dados personalizados.
Velocidade de Inferência e Eficiência de Recursos
EnquantoYOLO para GPU usando TensorRT, o YOLO26 adota uma abordagem mais ampla. A remoção do DFL e NMS o YOLO26 se destaque nas CPUs, alcançando velocidades até 43% mais rápidas do que os seus antecessores. Isso é crucial para aplicações em análises de retalho ou cidades inteligentes, onde os dispositivos de ponta podem não ter GPUs dedicadas.
Além disso, os requisitos de memória do YOLO26 durante o treinamento são geralmente mais baixos. EnquantoYOLO requer o treinamento de um modelo professor pesado para destilação a fim de alcançar resultados máximos, o YOLO26 alcança resultados SOTA diretamente, economizando GPU significativas GPU e eletricidade.
Versatilidade e Ecossistema
Uma grande vantagem do Ultralytics é a versatilidade.YOLO principalmente um detetor de objetos. Em contrapartida, a arquitetura YOLO26 suporta nativamente uma ampla gama de tarefas de visão computacional, incluindo:
- Segmentação de instâncias (com perdas semânticas especializadas)
- Estimativa de pose (usando RLE para maior precisão)
- Caixa Delimitadora Orientada (OBB) (crítico para imagens aéreas)
- Classificação de Imagem
Isso permite que uma única equipa de desenvolvimento utilize uma API e uma estrutura para vários problemas distintos, reduzindo drasticamente a dívida técnica.
Tabela comparativa: Características
| Funcionalidade | YOLO26 | DAMO-YOLO |
|---|---|---|
| Data de Lançamento | Janeiro de 2026 | Nov 2022 |
| Arquitetura | De ponta a ponta, NMS | Baseado em NAS, sem âncora |
| Pós-processamento | Nenhum (Saída do modelo = Final) | Supressão Não Máxima (NMS) |
| Otimizador | MuSGD (SGD Muon) | SGD AdamW |
| Pipeline de formação | Estágio único, Treinamento desde o início | Destilação complexa (professor-aluno) |
| Tarefas Suportadas | detect, segment, Pose, obb, classify | Detecção |
| Otimização de Borda | Alta (sem DFL, otimizada para CPU) | Moderado (TensorRT ) |
Conclusão
Ambas as arquiteturas representam pontos altos na história da deteção de objetos.YOLO o poder da pesquisa automatizada de arquiteturas e da reparametrização. No entanto, o YOLO26 representa o futuro da implementação prática da IA.
Ao eliminar NMS , introduzir otimizadores de nível LLM como o MuSGD e fornecer uma solução unificada para segmentação, pose e detecção, Ultralytics oferece um equilíbrio superior entre desempenho e facilidade de uso. Para desenvolvedores que criam aplicações do mundo real — desde automação industrial até aplicações móveis —, o ecossistema robusto, a documentação abrangente e a Ultralytics tornam o YOLO26 a recomendação óbvia.
Para aqueles interessados em outras comparações, podem explorar YOLO11 .YOLO ou procurar alternativas baseadas em transformadores, como RT-DETR.
Autoria e referências
YOLO26
- Autores: Glenn Jocher, Jing Qiu
- Organização:Ultralytics
- Data: 2026-01-14
- Documentação:Documentação do YOLO26
DAMO-YOLO
- Autores: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
- Organização: Alibaba Group
- Data: 2022-11-23
- Artigo:arXiv:2211.15444