YOLO26 vs. YOLOv9: A próxima evolução na deteção de objetos em tempo real
A evolução das arquiteturas de detecção de objetos tem sido marcada por uma busca constante por velocidade, precisão e eficiência. Comparando o YOLO26 com o YOLOv9 destaca essa rápida progressão. Enquanto YOLOv9 os limites da retenção de informações com gradientes programáveis, o mais recente YOLO26 redefine o panorama com uma arquitetura de ponta a ponta, NMS, otimizada especificamente para desempenho de ponta e CPU massivos CPU .
Visão Geral do Modelo
YOLO26
O YOLO26 representa o que há de mais avançado em IA de visão no início de 2026. Desenvolvido pela Ultralytics, apresenta um design nativo de ponta a ponta que elimina a necessidade de supressão não máxima (NMS), simplificando os pipelines de implementação. Ao remover a perda focal de distribuição (DFL) e integrar o novo otimizador MuSGD— um híbrido de SGD Muon inspirado no treinamento LLM —, o YOLO26 alcança CPU até 43% mais rápida, mantendo a precisão de alto nível.
- Autores: Glenn Jocher, Jing Qiu
- Organização:Ultralytics
- Data: 14 de janeiro de 2026
- Característica principal: Detecção ponta a ponta NMS, Otimizador MuSGD, ProgLoss + STAL
- GitHub:Repositório Ultralytics
YOLOv9
Lançado no início de 2024, YOLOv9 introduziu o conceito de Informação de Gradiente Programável (PGI) e a arquitetura GELAN. Essas inovações resolveram o problema do «gargalo de informação» em redes profundas, garantindo que dados críticos não fossem perdidos durante o processo de feed-forward. Continua a ser um modelo poderoso, especialmente para aplicações de pesquisa que exigem alta eficiência de parâmetros.
- Autores: Chien-Yao Wang, Hong-Yuan Mark Liao
- Organização: Institute of Information Science, Academia Sinica
- Data: 21 de fevereiro de 2024
- Característica principal: Informação de gradiente programável (PGI), arquitetura GELAN
- Arxiv:YOLOv9
- GitHub:Repositório YOLOv9
Comparação da Arquitetura Técnica
A divergência arquitetónica entre estes dois modelos significa uma mudança da otimização teórica do fluxo de informação para a eficiência prática da implementação.
YOLO26: Eficiência e design com prioridade nas bordas
O YOLO26 concentra-se na redução da sobrecarga computacional do pós-processamento e do cálculo de perdas.
- NMS de ponta a ponta: Ao contrário dos detetores tradicionais que produzem caixas delimitadoras redundantes que requerem NMS, o YOLO26 prevê diretamente o conjunto exato de objetos. Isso reduz a variação de latência e simplifica a exportação para formatos como ONNX TensorRT, já que NMS personalizados complexos não são mais necessários.
- ProgLoss + STAL: A introdução do Progressive Loss e do Soft-Target Anchor Labeling melhora significativamente a deteção de pequenos objetos, um requisito crítico para imagens de drones e inspeção robótica.
- MuSGD Optimizer: Trazendo inovações do treinamento de modelos de linguagem de grande porte para a visão computacional, este otimizador híbrido estabiliza o momentum do treinamento, permitindo uma convergência mais rápida com menos ajustes de hiperparâmetros.
YOLOv9: Retenção de informações
A arquitetura YOLOv9 foi criada com o objetivo de resolver o problema da perda de informação em redes profundas.
- PGI (Informação de Gradiente Programável): Um ramo de supervisão auxiliar gera gradientes confiáveis para atualizar os pesos da rede, garantindo que as camadas profundas retenham informações semânticas.
- GELAN (Generalized Efficient Layer Aggregation Network): Esta espinha dorsal otimiza a utilização de parâmetros, permitindo YOLOv9 alta precisão com menos parâmetros do que alguns de seus antecessores, embora muitas vezes à custa de maior complexidade computacional (FLOPs) em comparação com o YOLO26 simplificado.
Simplicidade de Implantação
A remoção do NMS YOLO26 é uma grande mudança para a implementação de ponta. Em modelos mais antigos, como YOLOv9, a NMS é executada na CPU que o modelo seja executado em uma GPU, criando um gargalo. A saída do YOLO26 está pronta para uso imediato, tornando-o significativamente mais rápido no Raspberry Pi e em dispositivos móveis.
Métricas de Desempenho
A tabela a seguir compara os modelos em benchmarks padrão. Observe a vantagem significativa em termos de velocidade do YOLO26 no CPU , um resultado direto das otimizações da sua arquitetura.
| Modelo | tamanho (pixels) | mAPval 50-95 | Velocidade CPU ONNX (ms) | Velocidade T4 TensorRT10 (ms) | parâmetros (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Vantagens do Ecossistema Ultralytics
Embora YOLOv9 sólidas bases teóricas, a utilização do YOLO26 no Ultralytics proporciona vantagens distintas para programadores e empresas.
Facilidade de Uso Incomparável
Python Ultralytics transforma fluxos de trabalho de treinamento complexos em poucas linhas de código. Essa experiência "do zero ao sucesso" contrasta com a configuração centrada em pesquisa de muitos outros repositórios.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
Versatilidade em Diferentes Tarefas
Ao contrário YOLOv9, que se concentra principalmente na deteção, a Ultralytics e o YOLO26 suportam nativamente uma gama mais ampla de tarefas de visão computacional. Isso permite que você use uma única API unificada para:
- Segmentação de instâncias: Máscara precisa de objetos ao nível do pixel.
- Estimativa de pose: deteção de pontos-chave para análise da atividade humana.
- OBB (Oriented Bounding Box): Detecção de objetos girados, como navios, em imagens de satélite.
- Classificação: Categorização de imagens inteiras.
Treino e eficiência da memória
Ultralytics são projetados para serem eficientes em termos de recursos. O YOLO26 normalmente requer menos GPU (VRAM) durante o treinamento em comparação com alternativas que utilizam muito transformadores. Essa eficiência permite:
- Lotes maiores em hardware de consumo.
- Reduza os custos de computação em nuvem.
- Ciclos de experimentação mais rápidos com pesos pré-treinados prontamente disponíveis.
Aplicações no Mundo Real
A escolha do modelo certo depende das suas restrições específicas de implementação.
Edge Computing e IoT
O YOLO26 é o campeão indiscutível para dispositivos de ponta. CPU sua CPU 43% mais rápida torna-o viável para monitorização em tempo real em dispositivos como o Raspberry Pi ou NVIDIA Nano, sem a necessidade de quantização pesada. Por exemplo, um sistema de estacionamento inteligente executado em hardware local beneficia imensamente do design NMS, reduzindo picos de latência.
Inspeção em Altitude Elevada
Para monitoramento agrícola ou inspeção de infraestrutura com drones, o YOLO26 se destaca devido às funções ProgLoss + STAL. Elas são especificamente ajustadas para lidar com objetos pequenos e proporções difíceis melhor do que as gerações anteriores, garantindo que rachaduras em tubulações ou pragas em culturas sejam detectadas com maior precisão.
Investigação académica
YOLOv9 continua a ser um forte candidato para a investigação académica, particularmente para estudos focados no fluxo de gradiente e na teoria da arquitetura de redes. O seu conceito PGI oferece uma via fascinante para explorar como as redes neurais retêm a profundidade da informação.
Conclusão
Ambas as arquiteturas marcam marcos significativos na visão computacional. YOLOv9 a importância das informações de gradiente em redes profundas. No entanto, o YOLO26 traduz essas lições em uma potência pronta para produção. Com seu design completo NMS, CPU superior CPU e integração perfeita com a Ultralytics , o YOLO26 oferece o melhor equilíbrio entre velocidade, precisão e facilidade de uso para aplicações modernas de IA.
Para os programadores que desejam permanecer na vanguarda, recomendamos a migração para o YOLO26 para aproveitar os avanços mais recentes em estabilidade do otimizador e desempenho de ponta.
Leitura Adicional
Se estiver interessado em outros modelos de alto desempenho da Ultralytics , confira YOLO11 para tarefas de uso geral ou RT-DETR para deteção em tempo real baseada em transformadores.